[분석] 코호트 분석에 대한 고민들
by 소라고동_이번 글은 코호트 분석을 접했을 때 들었던 의문점과 그에 대한 고민들을 담은 글입니다.
0. 들어가며
고객을 분석하는 업무를 할 때 자주 쓰이는 개념 중 코호트(Cohort)라는 개념이 있습니다.
코호트의 개념을 분석에 활용하면 고객들의 행동들을 보다 세부적으로 뜯어보며 어떠한 패턴을 찾아낼 수 있는데요.
이러한 장점을 가지고 있다 보니 분석 업무를 하다 보면 '코호트를 나누어서 보고 싶다.'라는 요청이 자주 옵니다.
그런데 그런 요청 중에서는 종종 '이걸 코호트라고 할 수 있나?', '무작정 코호트로 나눈다고 다 되는 건가?'라는 생각이 들 때가 있었습니다.
그래서 이번 글에서는 코호트 분석에 대한 목적과 분석을 진행하면서 했던 고민들을 담아보려 합니다.
1. 코호트 분석
1.1. 코호트 분석이란?
코호트 분석이라는 개념은 사실 많이들 알고 있을텐데요.
그래도 한 번 개념 정리를 해보면 아래와 같습니다.
코호트 분석 (Cohort Analysis)
- 특정한 공통 속성을 가진 사용자 그룹(코호트)의 행동 변화를 시간의 흐름에 따라 분석하는 기법

이 개념들을 기준으로 코호트 분석을 하며 고민했던 부분들을 살펴보면요.
2. 코호트 분석을 하며 했던 고민들
코호트 분석과 관련된 업무를 하면서 고민했던 부분들을 정리해 보면 아래와 같습니다.
2.1. 코호트와 세그먼트는 뭐가 다를까?
고객 분석을 진행할 때에는 고객들을 특정한 기준에 따라 몇 가지 그룹으로 묶어서 분석을 진행하는 경우가 많습니다.
보통은 그런 분석을 할 때 '고객 세그먼트를 나누어서 분석한다.'라고 이야기를 하는데요.
여기서 의문점이 생깁니다.
세그먼트도 고객을 특정한 기준에 따라 나누어 묶어준 개념이고,
코호트도 고객들을 특정한 공통 특성에 따라 묶어준 개념인데,
그렇다면 이 둘은 뭐가 다른 것일까?
개인적으로 이 둘의 핵심적인 차이는 고객 분류의 목적이라고 생각하는데요.
코호트는 '시간의 흐름에 따라 살펴보기 위해' 고객을 분류한다면, 세그먼트는 '특정 그룹을 나누기 위해'고객을 분류한다고 이야기할 수 있을 것 같습니다.
개념이 조금 모호하기 때문에 조금 더 상세히 풀어보면요.
코호트 (Cohort)
- 특정한 기준에 따라 정의된 순간 코호트 그룹 분류에 있어서는 변함이 없고, 고정된 그룹에 속함
- 즉, '고정된 그룹에 속한 고객들이 시간의 변화에 따라 어떤 패턴을 보이는가?'를 살펴보게 됨
- 예시)
첫 구매 시점을 기준으로 그룹을 나누어, 그 시점에 해당 액션을 한 고객들이 어떤 패턴을 보여주는지 살펴본다.
세그먼트 (Segment)
- 특정한 기준에 따라 정의되고, 분석을 하고자 하는 '시점'에 따라 각각의 고객이 세그먼트에 포함됨
- 즉, '특정 시점에 특정 고객군이 어떤 행동을 보이는가?'를 살펴보게 됨
- 예시)
29cm의 경우 25년 2월에 35만 원 구매한 경우 25년 3월에 RED 등급이 되고,
해당 고객은 25년 3월 한 달 동안 RED등급 세그먼트에 속한다.
이 고객이 25년 3월에 10만 원만 구매해서 25년 3월엔 ORANGE 등급이 될 수 있고,
그 고객은 25년 4월엔 한 달 동안 ORANGE등급 세그먼트에 속한다.
즉, 코호트는 고객 그룹을 기준에 따라 고정시켜 두고 시간의 흐름에 따라 지표를 살펴보며 패턴을 파악하게 되고, (물론 이 패턴에서 액션으로 이어짐)
세그먼트는 특정 시점에 고객이 속한 그룹을 나누고 그에 따른 그룹별 액션을 진행하기 위해 활용됩니다.
2.2. 무작정 고객을 코호트로 묶어서 보면 되는 건가?
코호트 분석은 설명이 비교적 쉽고 액션으로 이어지기 용이한 분석방법이기 때문에 고객을 다루는 분석에서 자주 '코호트로 나눠 보고 싶다'라는 요청이 오는데요.
가끔씩은 '고객을 묶고 데이터를 보기만 하면 다 코호트 분석인가?'라는 고민을 할 때가 있었습니다.
이 부분은 첫 번째 고민이었던 코호트와 세그먼트의 차이를 살펴보면서 자연스레 해소되었는데요.
결국엔 '이 고객을 왜 쪼개보려고 하는 것일까?'라는 질문에서 출발하여 '코호트의 개념을 가지고 올지', '세그먼트 분석을 통해서도 충분한 인사이트를 만들어낼 수 있는지'를 판단하게 되었습니다.
즉, '고객을 쪼개서 살펴보는 목적이 시간의 흐름에 따라 패턴을 파악하기 위함인가?'라는 부분을 고려할 필요가 있다는 것이죠.
예를 들어 아래와 같은 상황이라고 가정해 봅시다.
- 앱 유입과 활성 시간을 늘리기 위해 앱에 접속한 뒤 접할 수 있는 새로운 기능을 런칭
- 런칭 이후 '이 기능을 통해 정말 고객의 유입이 늘어났을까?'라는 궁금증이 생기고, 기능을 접한 고객들의 지표를 분석하고자 함
- 이 상황에서 '이 기능을 처음 사용한 월을 기준으로 코호트를 나누어 지표를 보고 싶다.'라는 요청이 온 상태
위와 같은 상황에서 이 분석에서 코호트를 나눈다는 것, 그러니깐 '이 기능을 처음 사용한 것이 어떤 의미를 가지는 거지?'라는 고민이 시작됩니다.
고민을 하며 이 기능의 목적을 다시 떠올려보면 '앱 유입 증대'와 '앱 활성 시간 증가'임을 생각해 볼 수 있고,
이러한 경우에는 기능을 사용한 고객의 코호트를 나누기보다는 기능 사용 여부에 따른 세그먼트를 나누어 살펴보는 것이 우선이라는 생각을 해볼 수 있습니다.
예를 들어 기능을 사용한 고객과 사용하지 않은 고객의 비교 분석을 진행하고, 기능을 사용한 고객 중 원래도 앱을 잘 사용하던 고객, 그렇지 않은 고객을 추가적으로 나누어서 살펴볼 수 있겠죠.
이렇듯 기능의 목적, 분석의 목적에 따라서 코호트를 나눌지, 세그먼트로 살펴볼지를 결정하는 것이 필요하다고 생각했습니다.
2.3. 한 명의 고객이 여러 코호트에 들어가도 되는 것인가?
보통의 코호트 분석에서는 어떤 액션을 처음 한 시점을 기준으로 코호트를 정의하고 분석을 진행합니다.
이렇게 기준을 잡는 원인은 '각각의 고객들이 명확한 기준에 따라 하나의 코호트에 속하게 되기 때문'인데요.
그런데 가끔은 코호트의 기준이 모호한 경우가 발생합니다.
예를 들면 첫 구매월이 아닌 '구매월에 따라 코호트를 나눠 보고 싶다.'라는 요청인데요.
코호트를 동질 집단이라고 정의하게 되면 말이 안 되는 코호트는 아니지만, 이런 경우에는 코호트 분석의 장점 중 하나인 '그룹 간 비교 분석'을 제대로 활용하기가 어려워집니다.
특정 그룹에서 어떠한 패턴이 보인다 하더라도 그 그룹의 고객들이 다른 그룹에도 속해있기 때문에 영향을 정확하게 파악하기가 어렵고, 자연스레 액션을 진행할 때에도 모호함이 생기기 때문이죠.
그렇기에 보통은 한 명의 고객이 하나의 코호트에 들어가는 것이 일반적이지만.. 또 분석의 목적에 따라 그렇지 않을 수 있습니다.
만약 특정 월에 어떠한 액션을 하게 되었고, 그 액션을 한 월에 구매한 고객들이 어떤 패턴을 가지는지 보고 싶은 경우라면?
이러한 경우라면 위와 같이 '구매월'에 따라 코호트를 나누고 시간의 흐름에 따른 분석을 하는 것이 목적에 맞는 방법일 수 있습니다.
이런 경우에는 그룹 간 비교를 중심으로 하기보다는 특정 마케팅액션을 경험한 고객들이 어떤 패턴을 갖는지를 중점으로 살펴보게 됩니다.
즉, 시간의 흐름에 따른 패턴 분석을 통해 해당 마케팅 액션의 효과를 살펴보는 목적으로 코호트 분석을 진행하는 것이죠.
그러니 '보통은 한 명의 고객은 하나의 코호트에 속하는 것이 일반적이지만, 목적에 따라 그렇지 않을 수 있다.'정도로 정리할 수 있겠습니다.
3. 코호트 분석 고민 끝에서
이렇게 코호트 분석에 대한 고민들을 정리해 봤는데요. 마지막으로 한 번 더 정리를 하며 글을 마쳐보면요.
고객 분석을 할 때 코호트 분석을 많이 활용하지만 결국엔 이는 주요한 목적을 달성하기 위한 하나의 분석 도구로 여겨야 한다고 생각이 됩니다.
그 목적을 달성하기 위한 방법이 코호트 분석이라면 이를 활용하는 것이고, 세그먼트 분석이 적합하다면 세그먼트 분석을 활용하게 되죠.
만약 두 방법이 모두 필요하다면 두 방법을 모두 활용하기도 하고요.
이렇게 고민의 과정을 거치면서 코호트 분석에 대한 생각도 조금씩 바뀌었는데요.
처음에는 '코호트 분석이면 무조건 한 명의 고객이 하나의 코호트에 들어가야 되는 거 아니야?'라는 생각을 했었지만,
'코호트를 어떻게 나누는지에 대한 고민은 충분히 필요하겠지만, 고민의 끝에 코호트를 나누고 목적에 맞게 지표를 설정한다면 어찌 됐건 유의미한 분석으로 이어질 수 있겠다'라고 생각을 바꾸게 되었고요.
처음 코호트 분석의 개념을 접했을 땐 아주 단순하게 '고객을 나누면 다 코호트지 뭐~ 쉽네'라는 생각을 했었지만,
그만큼 목적에 대한 고민이 전제되어야 함을 깨달았습니다.
코호트 분석을 접하다 보면 자연스레 리텐션, LTV와 같은 개념까지 연결이 되는데요.
그만큼 활용도가 정말 높은 분석 방법이라는 생각이고 이 도구를 목적을 고민하자는 생각으로 이번 글을 마칩니다.
블로그의 정보
고동의 데이터 분석
소라고동_