이번 아티클에서는 동질 집단 분석(Cohort exploration) 분석에 대해서 살펴보도록 하겠습니다. 우리는 앞선 아티클에서 세그먼트에 대해서도 살펴보았는데요, 간혹 세그먼트와 코호트의 개념을 혼동하여 사용하는 경우가 많습니다. 이를 혼동하여 사용하는 경우도 많은데, GA4에서 Explorations 메뉴에 각각 분리되어 템플릿이 제공되는 것을 보면, 이는 명백히 다른 개념이라는 것을 알 수 있습니다.
앞선 아티클에서 segment는, 공통점을 가진 집단에 대한 분류라는 광의의 의미로 사용된다는 것을 확인했습니다.
그럼, cohort는 무엇일까요? 이 역시 한국어로 번역되면서 ‘동질 집단’이라는 용어로 번역되어서 혼란스럽습니다. 세그먼트와 비슷한 듯 하지만, segment와는 개념 상 차이가 있습니다. 두 개념 모두 ‘공통점’을 갖는 집단을 형성한다는 점은 비슷하지만, cohort의 경우에는 이 공통점이 ‘시점’에 집중되어 있습니다. 눈치채신 분들도 있겠지만, DAY에 따른 리텐션 분석이 여기에 해당합니다. 어떤 국가/디바이스/연령 등의 구분이 아닌, ‘0월 0일에 설치한 유저’를 공통으로 분류하여 그 고객들의 리텐션을 분석하는 것을 보면 이해가 가실 겁니다.
Cohort expolation 기본 화면은 위와 같이 구성됩니다. 우선 이 화면에서는 COHORT GRANULARITY가 WEEK 단위로 설정되어 있는 것을 참고해주시기 바랍니다. 예를 들어 11월 13~11월 18일 사이에 발생한 액티브 유저는 첫 주에 5,735명입니다. 그 유저들 중에서 다음 주차에 액티브 유저로 남아있는 고객은 775명이 되었습니다. 또 한 주가 지난 후에는 451명, 그다음 주에는 340명이 되었습니다(그 이후에는 남아있지 않습니다) 이것을 이용해 리텐션 분석을 하게 되죠?
COHORT GRANULARITY를 DAY로 바꾸어서 일자별로도 분석을 진행해 보겠습니다.
자, 이번에는 세팅 탭에서 METRIC TYPE을 변경해 보겠습니다. 지금은 Sum 값으로 되어 있는데 이를 Per cohort user로 변경해 보겠습니다. 그럼 리텐션이 보기 쉽게 비율로 나타나게 됩니다.
만일, 98.4%의 유저가 다음날 10.9%가 되고, 그 다음 6.7%라고 표시되면 해당 전체 유저 중에서 몇 퍼센트가 남는지를 직관적으로 볼 수 있게 되는 것이죠. 정확한 수치보다는 비율이 더 중요하다면 해당 방식으로 보는 것이 더 유리합니다.
잔존율을 활용하는 방식은 매우 다양합니다. 가장 대표적인 예를 들어보자면, 특정 날짜에 유난히 잔존율이 높은 날이 있을 것입니다. 평균치보다 높은 날이 있다면, 그날 집행했던 마케팅 활동 등을 복기해 보는 것입니다. 해당 유저가 잔존율이 높다는 것을 증명할 수 있기 때문이죠.
다만 주의할 것이 있습니다. 기본적으로 모바일 앱의 경우 firebase를 사용해서 유입을 측정하게 되는데, GTM같은 방식으로 유입경로를 정확히 체크하는 데 한계가 있습니다. 구글 애즈의 경우 대부분 정확하게 잡히는데, 페이스북이나 네이버 광고와 같은 서드 파티 광고의 경우 유입을 체크하기 쉽지 않습니다. 그래서 모바일 앱의 유입경로 추적을 위해 주로 앱스 플라이어 같은 툴을 쓰게 됩니다. 그리고 이를 연동해 앰플리튜드 같은 GA툴을 쓰게 되는 것이죠. 물론 GA4로 업데이트되면서 이런 부분들은 점차 개선되고 있습니다.
* 참고 : CALCULATION 옵션
CALCULATION 옵션은 다소 이해하기 어려운 부분이라서, 마지막에 따로 살펴보도록 배치했습니다. 공식 문서의 설명을 보더라도 사실 정확히 이해는 되지 않습니다.
사실 의외로 큰 차이를 갖는 옵션이므로, 잘 살펴보도록 하겠습니다.
· Standard(일반) : 당연히 가장 기본적인 타입입니다. 아래 이미지를 보겠습니다. 11/14 ~ 11/18을 기준으로, 0주차에 4,695명의 사용자를 획득했습니다. 그리고 0주 차에 4,636명의 사용자가 발생했습니다. 일반(Standard) 모드에서 1주 차, 2주 차, 3주 차, 4주 차의 재방문 유저를 카운팅 하게 되면 1주 차나 2주 차에 잡히는 재방문 고객은 "연속해서 방문한 유저가 아니라는 점"을 주의해야 합니다. 즉, 2주 차에 카운팅 된 378명의 유저는 1주 차에는 방문하지 않았을 수도 있는 것입니다. 4,636명의 방문 유저 중, 1~3주 차에는 방문하지 않았다가 4주 차에 방문하게 되면 50명에 포함되는 것입니다.
그래프 상단의 설명에는 "Each cell is the sum of Active users for users who had Any event, in that week after First touch (acquisition date)"라고 표시됩니다. - "각 셀은 첫 번째 터치(획득일) 이후 해당 주에 이벤트가 있었던 사용자의 활성 사용자 수 합계입니다."
· Rolling(최근) : 번역의 폐혜로 인해 오독하게 되는 가장 대표적인 사례입니다. rolling이라는 형용사는 [
used to describe something that is done in stages over a long period(오랜 기간에 걸쳐 단계적으로 수행되는 작업을 설명하는 데 사용됨)]이라는 의미로 여기서 사용됩니다. 즉, 간단히 말해서 0주 차의 활성 유저가 1주 차, 2주 차, 3주 차, 4주 차에 모두 연속으로 이벤트가 발생했을 경우에만 카운팅 되는 것입니다. 그래서 동일 데이터라고 하더라도, 아래와 같이 계산 옵션을 바꾸어주면 수치가 달라집니다. 당연히 조건이 까다로워지므로 수는 더 줄어듭니다.
그래프 상단의 설명에는
"Each cell is the sum of Active users for users who had Any event, in every week up to that week after First touch (acquisition date)"라고 표시됩니다. - "각 셀은 첫 번째 터치(획득일) 이후 해당 주까지의 모든 주에 이벤트가 있었던 사용자의 활성 사용자 수를 합한 값입니다."
· Cumulative (누적) : 각 셀에서 표시하는 방식이 누적된 사용자의 수로 표시합니다. 데이터는 동일한 상황에서 측정한 것이지만, 옵션을 Cumulative로 바꾼 다음에는 큰 차이가 발생합니다. "Each cell is the sum of Active users for users who had Any event, in any week up to that week after First touch (acquisition date)" - "각 셀은 첫 번째 터치(획득일) 이후 해당 주까지의 모든(any) 주에 어떤 이벤트가 있었던 사용자의 활성 사용자 수를 합한 값입니다."
'Data Literacy > Google Analytics' 카테고리의 다른 글
8. GA4와 looker studio 연동 : looker studio 기본 (1) - 기본 조작 (0) | 2023.12.19 |
---|---|
7. GA4 데이터 분석하기 : Explorations (8) - 잠재고객 생성 (0) | 2023.12.13 |
7. GA4 데이터 분석하기 : Explorations (6) - Segment overlap (1) | 2023.12.07 |
7. GA4 데이터 분석하기 : Explorations (5) - Path Exploration (3) | 2023.12.02 |
7. GA4 데이터 분석하기 : Explorations (4) - Funnel Exploration (0) | 2023.11.29 |