고동의 데이터 분석

[개념노트] AARRR을 책으로 배웠습니다 #3 : 리텐션(Retention)

by 소라고동_

* 지난 포스팅에 이어 양승화님의 "그로스 해킹" 책을 읽고 정리한 내용을 담았습니다.

 

0. 이전 포스팅

 

[개념노트] AARRR 을 책으로 배웠습니다 #2 : 활성화(Activation)

* 지난 포스팅에 이어 양승화님의 "그로스 해킹" 책을 읽고 정리한 내용을 담았습니다. 0. 이전 포스팅 [개념노트] AARRR 을 책으로 배웠습니다 #1 : 고객유치(Acquisition) * 이번 포스팅은 양승화님의 "

schatz37.tistory.com

위 링크는 AARRR 개념 중 활성화(Activation) 단계에 대해 정리한 글입니다.

활성화 단계에서의 핵심은 '전환율을 높히는 것'이고 이를 위해 퍼널 분석에 대한 개념을 함께 살펴봤었습니다.

오늘은 이렇게 전환된 사용자들을 어떻게 유지할지에 대한 내용인 리텐션(Retention)에 대해 포스팅해보도록 하겠습니다!

 

1. AA"R"RR : Retention, 리텐션(=유지율)

리텐션(Retention)
사용자가 서비스의 핵심 가치를 꾸준히 경험하게 하고, 그 수준을 측정할 수 있는 지표를 정의하고 관리하는 것
= 시간이 지날수록 얼마나 많은 유저가 제품 및 서비스로 다시 돌아오는지 측정한 것.

이전 활성화 단계에서는 사용자가 서비스의 핵심 가치를 경험하도록 서비스를 개선시키는 것에 목적을 두었습니다.

리텐션 단계에서는 핵심 가치를 꾸준히 경험하게 하고, 그 수준을 측정할 수 있는 지표를 정의하고 관리하는 것에 목적이 있습니다.

 

일반적으로 리텐션을 측정할 땐 접속이나 로그인을 기준으로 측정을 합니다.

이는 일반적으로 사용자가 서비스에 진입하는 것은 유의미한 행동이며, 이러한 행동이 반복되는지 살펴보는 것이 중요하기 때문입니다.

그렇지만 꼭 접속이 아니더라도 서비스에서 지정한 주요 이벤트들을 시간의 흐름에 따라 반복 여부를 살펴보는 것도 의미가 있다고 합니다.

 

리텐션의 측정을 위한 주요 이벤트들의 예시를 들어보면 다음과 같습니다.

- 정기 구독형 서비스 (음원 스트리밍, 네이버 멤버십 플러스, 쿠팡와우 등)
  : 고객이 해지하지 않고 매월/매년 구독료를 지불하는 것
- 무료 서비스 (페이스북, 인스타그램 등)
  : 사용자가 계속해서 서비스를 이용하는 것. (로그인, 게시글 작성 등)
- 쇼핑몰 (SSG.com, 29cm, 무신사 등)
  : 사용자가 제품을 구매하는 것.

위와 같은 기준으로 시간의 흐름에 따라 살펴보며 리텐션을 측정할 수 있습니다.

 

 

1.1. 리텐션 측정하기

그렇다면 위와 같은 이벤트를 이용해서 어떻게 리텐션을 측정할 수 있을까요?

늘 그렇듯 절대적인 방법이 존재하는 것은 아니지만 일반적으로 활용되는 방법은 존재합니다.

우선 리텐션 측정에 앞서 알아두면 좋을 개념을 먼저 이야기 해보고 시작해보겠습니다.

* 제품 사용 주기
  : 유저들에게 기대하는 단위 기간별(일, 주, 월 등) 제품(=서비스)을 사용하는 빈도수

어떤 리텐션 측정 방식을 사용할지, 그리고 리텐션 측정 시 관측 범위를 어떻게 설정할지를 제품 사용 주기에 따라 고려할 수 있습니다.

 

1) 클래식 리텐션 (Classic Retention)

가장 일반적인 유지율 계산 방법입니다.

특정일에 이벤트를 발생시킨 유저의 비율을 계산하는 방식이기 때문에 "Day N 리텐션"이라고도 합니다.

클래식 리텐션(Classic Retention)
= Day N 에 서비스를 이용한 사람 / Day 0 에 처음 서비스를 사용한 사람.

출처 : 양승화님 인프런 그로스해킹 강의

Day N Day 7 Day 14 Day 28
클래식 리텐션 6/10 = 60% 4/10 = 40% 2/10 = 20%

위 그림에 대한 리텐션 값을 표로 나타내봤습니다.

예시처럼 기준이 되는 Day 0 을 정하고 그로부터 N 일이 지난 시점의 리텐션 값을 계산하면 되는 간편한 방법입니다.

장점
 1. 개념을 설명하기 쉽고 계산 방식이 간편하다.

단점
 1. 특정일의 노이즈에 민감하고 일 단위의 로그인 데이터를 모두 확보하고 있어야 계산할 수 있다.

단점에 대한 설명을 조금 덧붙히자면,

어떤 사용자가 꾸준히 해당 서비스를 이용하다가 리텐션을 측정하는 특정일에 접속하지 않는다면 리텐션 집계에 포함되지 않습니다. 그 반대로 접속하지 않다가 리텐션 측정일에 접속한 경우 리텐션 집계에 포함되고요.

이러한 단점을 해결하기 위해서 기준일을 6,7,8,9일 등 다양하게 설정한 뒤 평균을 내는 방법을 사용하기도 한다고 합니다. 

그렇기 때문에 클래식 리텐션은 매일매일 접속해서 사용할 것으로 기대되는 서비스(메신저, SNS, 모바일 게임 등)에서 활용하기 적절한 지표입니다.

 

2) 범위 리텐션(Range Retention)

범위 리텐션은 특정 기간에 이벤트를 발생시킨 유저의 비율을 계산하는 방식입니다.

클래식 리텐션이 특정일을 기준으로 리텐션을 측정했다면 범위 리텐션은 특정 기간을 기준으로 한다는 차이가 있습니다.

범위 리텐션 (Range Retention)
 = Range N 에 서비스를 이용한 사람 / Range 0에 처음 서비스를 이용한 사람
    (기간 내 접속한 횟수는 고려하지 않음, 접속 여부를 서비스 이용의 기준으로 함.)

출처 : 양승화님 인프런 그로스해킹 강의

Range N Range 1 Range 2 Range 3
범위 리텐션 8/10 = 80% 6/10 = 60% 4/10 = 40%

마찬가지로 위 예시에 대한 리텐션 값을 구해봤습니다.

예시처럼 기준이 되는 범위(Range 0)를 정하고 같은 길이의 다른 기간 범위(Range1~3)의 리텐션값을 구하는 방식입니다.

장점
 1. 설명이 쉽고 계산이 간편하다.
 2. 클래식 리텐션보다 노이즈가 적은편이다.

단점 
 1. 기준 기간이 길어질수록 리텐션이 과대 추정(Over-estimated) 될 수 있다.
 2. 리텐션 트렌드를 확인하는 데 비교적 오랜 시간이 필요하다.
    (의미 있는 결과 도출을 위해서 어느정도 기간이 축적되어야 하기 때문.)

범위 리텐션은 마찬가지로 직관적이고 간편하다는 장점이 있습니다. 

또한 일정한 기간의 접속 여부를 고려하기 때문에 우연히 하루 접속하지 않았다고 하더라도 리텐션에 영향을 미치지 않습니다.

반대로 해당 기간에 하루만 접속하여도 리텐션 값을 계산할 때 포함되기 때문에 리텐션 값이 과대추정될 수 있다는 단점이 있습니다.

그렇기 때문에 매일 접속하진 않더라도 일정 간격으로 꾸준히 사용하는 서비스(배달서비스 등)에 활용하기 적합한 리텐션입니다.

 

 

3) 롤링 리텐션 (Rolling Retention)

롤링 리텐션은 앞 두가지 리텐션과는 다른 관점으로 리텐션을 계산합니다.

앞서 두 리텐션은 '최초에 이벤트 발생 후 시간이 지난 후 얼마나 반복적으로 해당 이벤트가 발생하는가? 를 기준으로 리텐션을 계산했다면,

롤링 리텐션은 '더 이상 해당 이벤트가 발생하지 않는 비율은 얼마인가?' 라는 관점으로 리텐션을 계산합니다.

롤링 리텐션 (Rolling Retention)
 = After N day 이후에도 서비스를 이용한 유저 / Day 0 에 처음 서비스를 이용한 유저

출처 : 양승화님 인프런 그로스해킹 강의

After N Day After 7 Day After 14 Day After 28 Day
롤링 리텐션 8/10 =80% 6/10 = 60% 2/10 = 20%

위 예시를 이용해 리텐션값을 구해보면,

After 7 Day 즉, 첫 이벤트 발생 후 7일째 되는 날 이전에 마지막 로그인 날짜를 기록한 사용자(User2, User9)를 7일 이전에 이탈한 사용자로 간주하고 리텐션을 계산합니다.

장점
 1. 계산에 필요한 데이터가 간단하고 계산 자체도 간단하다.
    (최초 로그인 시점과 마지막 로그인 시점만 있으면 계산이 가능하다.)

단점
  1. 리텐션 값이 과대 추정 되는 경향이 있다.
     (한 번이라도 로그인 하면 그 이전의 모든 기간을 활동 기간으로 간주하기 때문.)
  2. 리텐션 수치가 시점에 따라 계속해서 변한다.

롤링 리텐션의 단점은 마지막 접속을 기준으로 리텐션을 측정한다는 점에서 발생합니다.

단점을 하나씩 살펴봅시다.

  • 단점1.
    특정 시점에서 롤링 리텐션을 측정할 때, 약 1년만에 서비스에 접속한 사용자와 1년동안 꾸준히 접속한 사용자가 같은 그룹으로 계산됩니다. 
    예를 들어 아래의 경우 After 1 Days ~ After 28 Days 리텐션을 계산한다면 User8 과 User9 가 동일한 그룹으로 계산된다는 것입니다.

Rolling Retention 의 단점

  • 단점2.
    롤링 리텐션을 계산한 예시 표에서 Day 7 기준 리텐션 값이 80% 였는데, User2 와 User9 가 그 이후에 접속을 하게된다면 Day 7 리텐션 값이 100% 로 바뀔 수 있습니다.
    서비스 탈퇴를 하지 않는 이상 사용자는 언제든지 다시 서비스를 이용할 수 있기 때문에 (= 롤링 리텐션 값이 계속해서 바뀌기 때문에) 롤링 리텐션 값을 최종적으로 알 수 없다는 단점이 있습니다. 

 

이러한 부분 때문에 롤링 리텐션을 활용할 때에는 절대적인 수치보다 지표의 움직임 추이에 초점을 맞춰 활용해야 합니다.

그리고 일반적으로 롤링 리텐션은 앞서 다른 리텐션보다 측정 범위가 넓기 때문에(Day 0 ~ 마지막 접속일) 사용빈도가 높지 않은 서비스(의류 쇼핑서비스, 여행 서비스 등)에서 유용하게 활용됩니다.

 

 

2. 리텐션 분석하기

리텐션 분석도 퍼널 분석과 마찬가지로 코호트 분석을 진행하는 것이 아주 중요합니다.

일반적으로 리텐션을 분석할 때 날짜를 기준으로 코호트 분석을 진행하는데요.

가입 월별 리텐션 또는 첫 구매 월별 리텐션 같이 날짜나 기간을 기준으로 리텐션 추이를 살펴보면, 리텐션이 시간의 흐름에 따라 어떻게 변화하는지를 판단할 수 있기 때문입니다.

또는 유입 채널별 리텐션을 비교하여 어떤 채널을 통해 들어온 사용자들이 높은 리텐션을 갖는지 확인할 수도 있습니다.

이렇게 기준에 따라 리텐션을 파악할 때 주로 쓰이는 도구가 리텐션 차트(Retention Chart) 입니다.

 

2.1. 리텐션 차트(Retention Chart)

리텐션 차트는 크게 4가지 구성요소로 이루어져있습니다.

리텐션 차트 예시

예시와 함께 리텐션 차트를 구성하는 요소들의 특징을 살펴봅시다.

1. 코호트
 : 보통 리텐션 차트에서의 코호트는 '동일 기간 가입' 또는 '동일 기간 결제' 로 정하는 경우가 많습니다.
  위 예시에서는 동일 월에 첫 결제를 한 고객을 하나의 코호트로 정했습니다.

2. 볼륨
 : 각 코호트의 크기를 의미합니다.

3. 기간
 : 리텐션을 구분해서 보기 위한 날짜 기준을 의미합니다.
   일별, 주별, 월별 등 사용자들의 평균 서비스 방문 주기를 고려하여 적합한 기준을 정하면 됩니다.
   위 예시에서는 월별로 살펴보았습니다.

4. 리텐션
 : 각 코호트별, 기간별 집계된 리텐션을 의미합니다.

이렇게 구성된 리텐션 차트를 통해 우리가 중점으로 살펴봐야할 부분은 다음과 같습니다.

  1. 하나의 코호트 안에서 기간에 따른 유지율을 살펴보았을 때, 그 추이가 어떠한지?
    • 유지율이 급감하는지?
    • 유지율이 안정화되는 지점이 있는지?
    • 얼마나 기간이 지나야 안정되는지?
  2. 서로 다른 코호트의 동일한 기간의 유지율을 비교하면 어떠한지?
    • A 기간에 가입한 사용자와 B 기간에 가입한 사용자의 m+2 리텐션의 차이가 있는지?
  3. 기간에 따라 나눈 코호트의 규모가 어떻게 변화하고 있는지?
    • 가입자가 꾸준히 증가/감소하는 추세인지?

 

살펴봐야 할 내용의 중점은 '시간에 따른 변화 추이'를 살펴보는 것입니다.

위 내용들을 토대로 리텐션 차트를 살펴본 후 서비스 개선을 위한 인사이트를 얻어내야 하는데요.

이 부분을 그냥 말로만 설명하기엔 잘 와닿지 않을 것 같아 캐글 데이터를 통해 직접 리텐션 차트를 만들어봤습니다.

데이터를 통한 예시를 확인해보려면 아래 링크를 통해 확인해주세요 :)

2021.10.18 - [#4. 프로젝트 노트] - [실습] SQL을 활용한 리텐션 분석하기

 

2.2. 리텐션 개선하기

리텐션 차트를 통해 코호트별 리텐션을 확인해보았다면 리텐션을 어떻게 개선할 수 있는지 살펴봅시다.

리텐션 차트의 값들을 이용해서 그래프를 그려보면 아래와 같은 형태의 그래프가 나오는데요

출처 : AB180

위 그래프를 살펴보며 2가지 관점에서의 개선 방법을 알아봅시다.

  1. 초기에 리텐션이 떨어지는 속도를 늦추기
    • 이 부분은 활성화(Activation) 프로세스의 영향을 많이 받습니다.
    • 사용자가 서비스에 처음 방문해 가입하는 동선 및 핵심 기능을 사용하는 프로세스 등을 단계별로 쪼개서 살펴보는 것이 좋습니다.
    • 즉, 활성화 단계에서 이탈이 많은 경로가 어디인지를 살펴본다면 초기 유지율이 떨어지는 것을 보완할 수 있습니다.
    • 이러한 부분은 NUX(New User Experience, 신규 사용자 경험)라고 부른다고 합니다.
  2. 안정화 된 리텐션을 오랜 기간 유지시키기
    • 이 부분은 사용자와의 관계를 잘 유지하는 것이 중요합니다.
    • 정기적인 커뮤니케이션 플랜, CRM 마케팅 활동, 주기적인 프로모션 등을 진행해 주는 것이 도움이 될 수 있습니다.
    • 휴먼 고객을 대상으로 적절한 복귀 유도를 하는 리마케팅(Re-Marketing) 등을 꾸준히 진행할 필요가 있습니다.

 

 

3. 정리하면

여기까지 리텐션에 대한 전반적인 내용을 살펴보았습니다.

이번에는 리텐션을 다룰 때 주의해야 할 점을 정리하며 포스팅을 마치도록 하겠습니다.

1. 단순히 리텐션 지표만 보는 것이 아닌 전반적인 사용자 경험을 고려해야 한다.
  리텐션을 높히기 위해 무분별한 Trigger(앱 푸시, SMS 등)을 반복적으로 사용한다면 일시적으로는 리텐션이 높아질지 모르지만, 앱 삭제나 회원탈퇴 같은 부작용이 생길 수 밖에 없습니다.
 그러니 리텐션 유지를 위한 마케팅 활동이 서비스에 부정적인 영향을 주진 않았는지 살펴봐야합니다.

2. 서비스 카테고리마다 권장되는 리텐션 수준이 다르다.
 당연하겠지만 서비스의 성격에 따라 고객들의 리텐션 수준이 다를 수 밖에 없습니다. 그렇기 때문에 서비스별로 목표하는 리텐션 수준을 잘 정의하는 것이 중요합니다. 

3. 리텐션은 늘 일관되게 유지되지 않는다.
 같은 서비스라도 유입되는 사용자의 특성이나 경쟁사의 출현 등의 외부적인 요인이 리텐션에 영향을 미칠 수 있습니다.
 그렇기 때문에 코호트에 따른 리텐션 분석을 기간에 따라 꾸준히 진행해줘야 합니다.

 


다음 포스팅에서는 AARRR 의 나머지 단계에 대해 알아보도록 하겠습니다!

 

블로그의 정보

고동의 데이터 분석

소라고동_

활동하기