고동의 데이터 분석

[분석] 지표를 제대로 바라보려면?

by 소라고동_

이번 포스팅은 업무를 하며 여러 지표들을 접하고 고민하는 과정들을 잊지 않기 위해 정리한 경험 정리글입니다.
포스팅을 읽다 더 좋은 관점이나 방법이 있으시다면 언제든 댓글 부탁드립니다 :)

 


0. 지표들을 처음 접했을 때

사내에서 활용되는 다양한 지표들을 처음 접했을 때 사실 당황스러움을 느꼈습니다.

당황스러움을 느꼈던 포인트는 크게 2가지였는데요.

1. 지표의 종류가 너무 많다.
2. 지표의 개념이 너무 낯설다.

이 두 가지의 허들이 있다 보니 분석을 위해 지표를 제대로 활용하기는 커녕 그저 지표를 바라보기만 했던 것 같습니다.

예를 들면,

월별 재구매율 추이가 늘어나고 있는 데이터를 봤을 때, 그저 '재구매율이 높아졌네' 라고만 생각을 했습니다.

다시 말하면, '재구매율이라고 적혀있는 지표에 숫자들이 상승했네' 수준의 문자 그대로의 해석만 하는 상태였죠.

(어려운 책을 읽는다고 치면 책을 읽는게 아니라 글자를 보는 느낌이랄까요?)

지표를 봤다 = 지표를 이해했다?

즉, 어떤 지표의 정의나 계산 방식에 대해 생각하지 않았고, 지표들에 대해서 그 진정한 의미를 파악하기 위해 고민을 하지 않았습니다.

 

시간이 지나고 계속해서 지표들을 접하다보니 지표들이 익숙해지기는 했지만, 그 의미가 무엇인지 깊게 와닿지 않았고 그러다보니 해석에 어려움을 겪기도 했습니다.

 

그래서 이러한 부분을 빠르게 극복하기 위해서 이런저런 고민들을 하고 실천해보려고 노력했었는데요. (사실 아직도 진행중입니다..)

그 방법들을 잊지 않기 위해 한번 정리해보는 시간을 가져보려 합니다.

 

 

1. 지표 그 속을 바라보려는 노력들

지표를 제대로 이해하고 바라보기 위한 고민들은 다음과 같습니다.

 

1.1. 지표의 정의 명확히 하기

우선 첫 번째로 노력했던 부분은 바로 지표의 정의를 명확하게 이해하는 것이었습니다.

지표의 정의를 이해하기 위한 과정을 정리해보면 아래와 같습니다.

< 지표의 정의를 명확히 이해하기 위한 과정 >
  1. 지표가 가지고 있는 이름의 의미를 생각해본다.

  2. 이름의 의미와 지표가 계산되는 계산식을 엮어본다.

  3. 실제로 지표가 활용될 때 계산식에 들어가는 분자, 분모에 포함되는 기간, 포함/제외된 항목을 파악한다.

  4. 이 지표가 오르면 or 내리면 어떤 의미를 가지는건지 생각해본다.

  5. 이 지표를 어떻게 해석하면 될 지 정리한다.

너무 당연한 이야기를 늘어둔 것 같지만 저에게는 꽤나 효과적인 방법이었습니다.

한번 예시를 들어 보겠습니다.

 

'상품당 평균 주문 금액' 이라는 지표를 마주하게 되었고, 위 과정을 따라가본다고 생각을 해봅시다. 

1. 지표가 가지고 있는 이름의 의미를 생각해본다.
  → 고객이 해당 상품을 구매했을 때 평균적으로 얼마의 금액을 지불했는지 나타내는 지표인가보다.

2. 이름의 의미와 지표가 계산되는 계산식을 엮어본다.
  → '총 매출액 / 상품 주문 unit 수'로 계산된다.
       계산식을 생각해보면 판매된 상품들에 대한 평균 판매 단가라고 생각해볼 수 있겠다.

3. 실제로 지표가 활용될 때 계산식에 들어가는 분자, 분모에 포함되는 기간, 포함/제외된 항목을 파악한다.
  → 만약 전체 상품에 대한 '상품당 평균 주문 금액'이라고 한다면, '특정 기간동안의 총 매출액 / 특정 기간동안의 상품 주문 unit 수'라고 계산되고,
      카테고리 단위나 상품 단위로 내려간다면 '특정 기간동안의 해당 카테고리 총 매출액 / 특정 기간동안의 해당 카테고리 상품 주문 unit 수'로 계산이 되겠네.
      그런데 제대로 지표를 계산하기 위해서는 매출이 0 으로 잡히는 증정품이나 쇼핑백 같은 제품들은 제외해주는게 보다 정확한 의미를 가질 수 있겠다.

4. 이 지표가 오르면 or 내리면 어떤 의미를 가지는건지 생각해본다.
  → '상품당 평균 주문 금액'가 오른다는 건, 하나의 상품이 판매될 때 가져다주는 매출액이 커진다는 의미이고,
       내린다는 건, 반대로 하나의 상품이 판매될 때 가져다주는 매출액이 적어진다는 의미이다.
       즉, 이 지표가 올라가면 값비싼(= 단가가 높은) 상품이 많이 팔렸다고 볼 수 있고, 내려간다면 저렴한 상품들 위주로 판매가 이루어졌다고 생각할 수 있다.

5. 이 지표를 어떻게 해석하면 될 지 정리한다.
  → 단순히 하나의 상품이 가져다주는 매출액이 커진다, 적어진다를 넘어서 어떻게 이 부분을 해석하는게 좋을까?
       하나의 상품을 판매할 때 가져다 주는 매출액이 커진다는 의미는, 단가가 높은 상품이 많이 팔렸다는 의미라고 위에서 정리 했는데 그게 왜 좋을걸까?
       똑같은 수의 제품을 판매했을 때, 더 많은 매출을 가져다 준다는건 같은 주문처리비용 (포장비, 배송비 등) 선에서 보다 효율적인 비용 소모를 가져다 준다고 볼 수 있겠다. (같은 비용을 썼는데, 더 많은 매출액을 가져왔으니깐)
      그러니깐 '상품당 평균 주문 금액'이 높아지는게 좋다고 볼 수 있겠구나.

위와 같은 과정을 통해 지표에 대한 정의를 명확히 하게 되면, 이 지표를 만났을 때 어떻게 해석해야할지에 대해 보다 수월하게 접근할 수 있었습니다.

 

그런데 지표의 세계는 이렇게 간단하기만 하진 않더라구요.

왜냐하면 단순히 하나의 지표가 좋아졌다고 해서 전체적인 서비스가 좋아졌다라고 해석할 수 없기 때문이었습니다.

즉, 단순히 지표를 정의하는데서 그치지 않고 하나의 step을 더 나아가야 함을 깨달았습니다.

 

 

 

1.2. 지표들의 관계성에 대해 고민하기

단순히 하나의 지표가 개선되었다고 해서 비즈니스 또는 서비스가 개선되고 있다고 보기는 어렵다고 생각합니다.

왜냐하면 하나의 지표가 올라감에 따라 그에 영향을 받는 지표가 생길 수 있기 때문입니다.

그래서 각각의 지표가 가지고있는 관계성에 대해서도 고민이 필요함을 알게되었습니다.

지표들의 연관성을 찾아보기 위해 고민했던 방법은 이렇습니다.

< 지표들의 관계성을 찾아보려는 과정 >
  1. 해당 지표가 계산식의 일부로 사용되는 다른 지표를 찾아본다.

  2. 그 지표의 의미를 생각하며 관계성을 찾는다.

위 과정에 대한 예시를 들어보면 아래와 같습니다.

1. 해당 지표가 계산식의 일부로 사용되는 다른 지표를 찾아본다.
    → 다른 지표들을 살펴보니, '장바구니 크기'라는 지표가  '상품당 평균 주문 금액 * 주문 시 주문 상품 unit 수'로 계산됨을 발견했습니다.
         '장바구니 크기'는 한 번 주문했을 때, 얼마의 금액이 주문되는지 나타내는 지표로 이 지표가 높을수록 한 번의 배송으로 높은 주문금액의 배송을 완료할 수 있다는 장점이 있습니다.

2. 그 지표의 의미를 생각하며 관계성을 찾는다.
    → 즉, '장바구니 크기'는 '상품당 평균 주문 금액'이 높아지거나 '주문 시 주문 상품 unit수'가 많아지면 커짐을 알 수 있는데요.
        여기서도 '상품 당 평균 주문 금액'은 높이고 '주문 시 주문 상품 unit 수'를 낮춰 '장바구니 크기'를 늘리는 것이 효율적임을 생각해볼 수 있습니다. (주문 금액과 unit수 모두 늘어나는 것도 좋지만요)
        왜냐하면 '주문 시 주문 상품 unit 수'만 늘어나고 '상품 당 평균 주문 금액'은 낮아진다면, 같은 '장바구니 크기'를 가진 배송이더라도 포장의 부피나 비용이 늘어나 배송의 효율을 떨어뜨릴 수 있기 때문입니다.
        즉, '장바구니 크기'가 상승하는 것은 긍정적인 현상이지만, 그 속을 들여다봤을 때 '상품당 평균 주문 금액'도 함께 늘어나는 것이 중요한 부분이라고 생각할 수 있습니다.
        반대로 '상품당 평균 주문 금액'이 늘어나더라도 그로 인해 '주문 시 주문 상품 unit수'가 감소하여 '장바구니 크기'가 작아진다면 이 또한 문제가 될 수 있는 부분이라고 생각할 수 있습니다.

위와 같은 과정을 통해 각 지표들의 관계성을 살펴보려 노력했습니다. 

 

이렇게 지표들에 대한 이해도를 높이려 노력했는데요.

여기서 끝이 나면 좋았겠지만, 지표에 대한 이해만큼 중요한 부분이 또 있었습니다.

 

 

1.3. 왜 이 지표를 살펴보려하는지에 대해 이해하기

지표에 대한 이해만큼 중요한 부분은 해당 지표를 왜 살펴보려고 하는지에 대한 이해도였습니다.

목적에 대한 이해가 있어야 그에 맞는 지표의 정의를 할 수 있고, 올바른 지표를 선정할 수 있기 때문입니다.

 

예를 들어,

고객 등급별 와인 구매 현황을 보기 위해 등급별 와인 구매 고객 수와 비중을 전달해달해주세요.

라는 요청이 들어왔다고 합시다.

 

요청을 받고는 이런 생각을 했습니다.

와인 구매 비중이 높은 등급 or 낮은 등급에게 어떠한 액션을 취하기 위함일텐데,
와인 구매 고객 수와 비중만 가지고 제대로된 고객 등급별 와인 구매 현황을 살펴볼 수 있을까?

라는 생각을 했고, 

보다 제대로된 해석을 하기 위해서는 '등급별 와인 구매 고객 수 → 비중' 의 흐름으로 가는 것이 아니라,
'등급별 전체 고객 수 및 비중 → 등급별 와인 구매 고객 수 및 비중 → 등급별 와인 구매 고객 수/등급별 전체 고객 수' 의 흐름으로 가는 것이 해석에 있어 의미가 있지 않을까?
그리고 그 고객들이 와인을 얼마나 많이 구매했는지도 함께 살펴보는게 좋을 것 같은데?
'등급별 고객 당 와인 구매 수량, 등급별 고객 당 와인 구매 금액'도 함께 보는게 좋을 것 같다.

라는 생각으로 이어져 추가적으로 지표를 함께 확인해보는 것은 제안했고, 긍정적인 피드백으로 이를 함께 전달드렸습니다.

 

이렇게 지표 활용 목적에 대한 이해를 바탕으로 지표를 선정하고 살펴봐야함을 알 수 있었고, 습관화하려 노력하고 있습니다.

 

 

2. 마치며

이렇게 이번 포스팅에서는 제가 짧은 시간동안이지만 지표에 대한 이해도를 높이기 위해 노력했고, 지금도 노력하고 있는 부분에 대한 정리를 해봤습니다.

지표에 대해 접하면서 느낀 점은 이렇습니다.

분석의 목적에 따라 지표들의 해석과 활용이 달라질 수 있지만, 기본적으로 지표들의 정의와 관계에 대해 파악하고 분석 목적에 대한 이해를 가지는 것이 중요하다.

생각보다 지표들은 연관성을 가지는 경우가 많기 때문에(거의 대부분이 그렇지 않을까 싶네요) 이러한 습관을 가져두면 좋을 것 같다는 생각이 들었습니다.

 

혹시 이 내용을 읽어보셨을 때, 더 나은 방법이나 관점이 있으시면 언제든 댓글로 말씀주세요 :)

 

블로그의 정보

고동의 데이터 분석

소라고동_

활동하기