고동의 데이터 분석

[Tableau] 개인 블로그 방문 현황 시각화

by 소라고동_

이번 포스팅은 아래의 Tableau Public에 업로드 되어있는 대시보드에 대한 내용을 담았습니다.

해당 내용의 결과물인 대시보드는 아래의 Tableau Public 에 업로드되어 있습니다.

 

개인 블로그 현황 대시보드

개인 블로그 현황 대시보드

public.tableau.com


0. 들어가며

제가 처음 블로그에 글을 쓰기 시작한 것은 약 3년 전이었습니다.

그 때에는 가장 친숙한 네이버 블로그에 글을 썼는데요, 전공과목 내용과 R, SQL, Pyhton 그리고 소소한 일상들을 기록했었습니다.

네이버 블로그를 운영하며 느낀 좋은 점은 블로그 자체에서 다양한 지표를 다운로드 할 수 있도록 제공한다는 것이었습니다.

그래서 이번에는 이 데이터를 Tableau 로 가져와 대시보드 시각화를 해봤습니다.

 

0.1. 사용한 데이터 둘러보기

네이버 블로그에 제공하는 다양한 지표를 보면 다음과 같습니다.

다양한 네이버 블로그의 지표들

이렇게 아주 다양한 데이터들을 제공하고 있으니 그저 다운로드만 하면 되겠구나! 라고 생각했지만.. 겉보기와 다르게 수집에 약간의 까다로움이 있었습니다.

약간의 까다로움
 = 일간 데이터를 제공하지 않는 지표가 있다.
 = 최근 3개월의 데이터만 제공한다.
 = 서로이웃, 피이웃, 기타, 성별, 연령별 등의 정보들이 선택옵션으로 이루어져 각각 다운로드 한 뒤 파일을 합쳐줘야 한다.
 = 파일 다운로드 과정이 극한의 단순반복작업이라 번거롭다.

 

사실 이전에도 이 데이터를 이용해서 무언가를 해보고 싶어 Python과 셀레니움을 통해 데이터 수집을 해놓은 상태였는데요.(자동화 시켜놓지는 않음..)

2021년 4월 ~ 2021년 8월 1일 기간의 데이터를 수집한 뒤 현생에 치여 살다 그 이후 기간의 데이터를 수집하지 못했습니다.... (3달에 한번씩만 코드를 돌려주면 되는 일이었는데 말이죠..)

 

제가 사용한 데이터 항목과 기간을 정리해보면 다음과 같습니다.

테이블명 레이아웃 비고
방문자 수 일자, 요일, 이웃 구분, 방문자 수 데이터 기간
- 2021.04.01 ~ 2021.07.31

이웃 구분
- 서로이웃, 피이웃, 기타
방문기기 구분
- PC, 모바일
유입경로
- Naver, Google, 기타
성·연령대별 방문 일자, 요일, 성별, 연령, 이웃 구분, 조회수
게시글 순위 일자, 제목, 조회수, 순위
유입 채널 일자, 유입 경로, 방문 횟수
평균 사용시간 일자, 요일, 이웃 구분, 사용시간(초)
기기별 방문 일자, 이웃 구분, 방문 기기 구분, 방문자 수
재방문율 일자(주 단위), 이웃 구분, 재방문율(%)

이제 이 지표들을 이용해서 대시보드를 만들어본 과정을 살펴봅시다!

 


1. 대시보드의 목적

이번 대시보드의 목적은 다음과 같습니다.

기존 네이버 블로그 운영 현황을 분석하여 새로운 티스토리 블로그의 방향성을 정하기 위한 근거 자료가 되는 대시보드

거창하게 이야기 했지만 그냥 내 블로그에 누가 왔고 왜 왔는지를 확인해보기 위함이라고 말할 수 있겠습니다ㅎ

이런 관점에 작성해본 대시보드의 스토리라인은 다음과 같습니다.

1. 방문자 현황
  * 일자별 방문자 추이가 어떻게 될까? ▶ 방문자 추이
  * 어떤 이웃 그룹이 가장 많이 방문할까? ▶ 이웃 구분별 방문자 추이
  * 어떤 요일에 방문자가 많이 방문할까? ▶ 요일별 방문 현황
  * 방문자들의 재방문율은 어느정도일까? ▶ 이웃 구분별 재방문율 

2. 방문자 특성 현황
  * 어떤 성별의 방문자가 더 많을까? ▶성별 조회수
  * 어떤 연령대의 방문자가 많이 방문할까? ▶ 연령대별 조회수

3. 인기 게시글 현황
  * 어떤 카테고리의 게시글이 가장 조회수가 높을까? ▶ 게시글 순위
  * 동일한 카테고리 안에서는 어떤 게시글이 가장 조회수가 높을까? ▶ 게시글 순위

4. 블로그 방문 현황
  * 어떤 채널에서 방문자가 유입될까? ▶ 방문채널별 비중
  * 방문자들이 얼마나 블로그에 머무를까? ▶ 평균 방문 시간
  * 어떤 기기를 이용해서 블로그의 게시글을 읽을까? ▶ 기기별 방문 현황

그럼 위 내용들을 담은 대시보드 내용을 살펴보겠습니다.

 


2. 대시보드 구성 및 해석하기

이번 대시보드는 4개의 대시보드를 가진 스토리로 구성했습니다.

 

2.1. 방문자 현황

방문자 현황을 나타낸 대시보드에는 총 5개의 내용이 들어있습니다.

<대시보드 구성 내용>
📌 일자별 방문자 수
     방문자 수의 추이를 살펴볼 수 있도록 구성하였습니다.

📌 요일별 방문자 수
     월별, 요일별 방문자 수를 확인할 수 있도록 구성하였습니다.

📌 이웃구분별 방문횟수 추이
     일자별 방문자 수를 이웃 구분에 따라 구체적으로 살펴볼 수 있도록 구성하였습니다.


📌 구분별 방문자 비율
     특정 서로이웃, 피이웃, 기타 방문자의 비중을 확인할 수 있도록 구성하였습니다.

📌 이웃구분별 재방문율
     이웃 구분별 재방문율(주 단위)을 확인할 수 있도록 구성했습니다.

🧷 '요일별 방문자 수' 의 행(요일)과 열(월)을 선택하면 해당 내용만 확인할 수 있도록 동작을 추가하였습니다.
🧷 '구분별 방문자 비율'의 각 항목을 선택하면 해당 내용만 확인할 수 있도록 동작을 추가하였습니다. 

일자별 방문자 수(좌), 요일별 방문자 수(우)
이웃 구분별 방문횟수 추이(좌), 구분별 방문자 비율(우)
이웃구분별 재방문율

<해석하기>
📌 일자별 방문자 수
    ✔️ 4월 → 7월로 갈수록 방문자 수가 감소하는 추세를 확인할 수 있습니다.
    ✔️ 일자별 그래프를 살펴봤을 때 하루하루가 들쭉날쭉한 것을 확인할 수 있습니다.
        → 그 속에서도 특정한 패턴이 반복되는듯 하여 요일별 방문자 수를 확인해봤습니다.

📌 요일별 방문자 수
   ✔️ 세로(열)를 기준으로 살펴보면 월~목요일에 방문자가 많다는 것을 확인할 수 있습니다.
   ✔️ 4~6월에 비해 7월에 방문자 수가 대폭 감소한 것을 확인할 수 있습니다.
        ▪️ 주로 공부한 내용을 담았기 때문에 대학생들이 방학을 하는 시점에 급격히 감소하는 것으로 추정됩니다.

📌 이웃구분별 방문횟수 추이
   ✔️ '기타' >>>  '피이웃' > '서로이웃' 의 순서로 방문하는 것을 확인할 수 있습니다.
        ▪️ 불특정 다수가 들어오는 '기타' 그룹(N명), 나를 이웃으로 추가한 '피이웃'(약 300명)
         , 서로 이웃신청을 승락한 서로이웃 (17명) 임을 고려해봤을 때, 당연한 결과이기도 한 듯 합니다.
        ▪️ 피이웃의 경우 분석 기간동안 고르게 방문하지 않고 집중적으로 방문하는 모습을 보여줍니다.
          시리즈로 이뤄진 카테고리(= 투자론, MSSQL)를 보고 이웃추가를 한 뒤 그 시점에만 방문한 것이 아닐까? 라는 생각을 해봅니다.
        ▪️ 서로이웃의 경우 대부분이 오프라인 친구로 이루어져있는데, 가끔 '얜 뭘 하고 살고있나..?' 라는 느낌으로
         친구들이 들어와보는 것 같습니다.

   ✔️ 결국 '기타'그룹 방문자가 줄어들었기 때문에 전체 방문자 수가 줄어들었음을 확인할 수 있었습니다.

📌 구분별 방문자 비율
   ✔️ 약 98%의 방문자가 '기타' 방문자로 이루어져 있습니다.
        ▪️ 극심한 불균형을 해결하기 위해 비슷한 관심사를 다루는 블로그 이웃을 만드는 것도 필요해보입니다.

📌 이웃구분별 재방문율 (주 단위)
   ▪️ 어느 정도가 높은 재방문율인지 기준이 없어 현재의 상황이 좋은지 나쁜지를 판단하기가 어려웠습니다.
     그래서 값을 보기 보다는 일단 추세를 한번 살펴보는 데에 의의를 두기로 했습니다.
  ✔️ 기타 그룹은 약 3~4%의 재방문율을 유지하는 모습을 확인할 수 있었습니다.
       ▪️ 재방문율이 떨어지지 않았다는 점이 긍정적인 부분이라고 느껴집니다만, 여기는 7월 데이터가 없어 급감하는 시기에
         재방문율이 어떤지 확인이 어렵다는 점이 매우 안타깝습니다.
       ▪️ 우선 꾸준한 포스팅으로 재방문율이 떨어지지 않도록 유지하고 연속성 있는 게시글을 통해 재방문율을 높여보는 것
          필요해보입니다.

  ✔️ 이웃 그룹은 보통 약 40%의 재방문율을 보여줬습니다.
       ▪️ 연속성이 있는 게시글을 작성하는 것은 재방문율을 높이는 데 도움이 많이 된다는 것을 확인할 수 있습니다.]

  ✔️ 서로이웃 그룹은 들쭉날쭉한 재방문율을 보여줍니다.
       ▪️ 서로이웃 그룹은 방문자 수 자체가 적고 실제 지인 위주라 크게 확인할 부분은 없어보입니다.
         (그저 저에게 얼마나 관심이 있는지에 대한 척도랄까요,,? 방문 자체를 않는 경우가 많네요 ㅎㅎ)

 

2.2. 성·연령별 조회 현황

성·연령별 조회 현황을 나타낸 대시보드에는 총 3개의 내용이 들어있습니다.

<대시보드 구성 내용>
📌 연령별 조회수
     월별, 연령별로 조회수를 확인하여 어떤 연령대가 가장 많이 방문하는지 확인할 수 있도록 구성하였습니다.
     월별 상위 2개 연령대에는 다른 색상으로 표현되도록 구성하였습니다.

📌 연령별 조회수 비중
     연령대를 그룹화 하여 연령대별 조회수 비중을 확인할 수 있도록 구성하였습니다.

📌 성별 조회수 비중
     성별 조회수 비중을 확인할 수 있도록 구성하였습니다.
 
🧷 '연령별 조회수 비중', '성별 조회수 비중'의 항목들을 클릭하면 해당 항목만 표현되도록 동작을 추가했습니다..
      (ctrl + Click 으로 여러 항목을 함께 선택할 수 있습니다.)

연령별 조회수
연령별 조회수 비중(좌), 성별 조회수 비중(우)

<해석하기>
📌 연령별 조회수
    ✔️ 19-24, 25-29세 연령대에서 많은 방문자가 분포하는 것을 확인할 수 있습니다.
    ✔️ 7월에는 19-24세 연령대 방문이 급감했습니다. 대학생들의 방학으로 이러한 감소세가 나타난 것으로 보입니다.

    ✔️ 30-34세 그룹도 꾸준히 방문해주고 있는데요, 아마 SQL 이나 파이썬 게시글로 유입된 직장인이 아닐까 생각됩니다.

📌 연령별 조회수 비중
    ✔️ 연령대를 그룹화 하여 살펴보면 20대(19-24, 25-29세 그룹)가 약 60% 정도의 조회수를 차지하고 있습니다.
    ✔️ 30대도 약 20% 의 조회 비중을 차지하고 있고 40대도 약 10%의 비중을 차지하고 있습니다.

📌 성별 조회수 비중

    ✔️ 성별은 남여 크게 차이가 없다는 것을 확인할 수 있습니다.
    ✔️ 대학생 방문자가 줄어든 7월에 남성 방문자 보다 여성 방문자의 비율이 많이 줄어든 것을 확인할 수 있습니다.

🚩 
   ▪️ 위 내용을 살펴본 결과 주 방문자는 19-24세 대학생, 25-29세 대학생 및 사회초년생, 30-34세 직장인 정도가 될 것 같습니다.
   ▪️ 여기서 Base가 되는 방문자는 직장인으로 추정되는 25-29세(약 30%), 30-34세(약 20%) 그룹이라고 생각됩니다. 
      (대학생의 경우 높은 조회수를 기록하지만 학기중(특히 시험기간)에 집중적으로 방문하는 불안정성을 보여줍니다.)
   ▪️ 앞으로의 방향은 사회초년생 및 직장인이 소비할 수 있는 게시글을 위주로 작성하는 것이 좋아보입니다.

 

 

2.3. 게시글 순위 

게시글 순위를 나타낸 대시보드에는 총 2개의 내용이 들어있습니다.

<대시보드 구성 내용>
📌 월별 카테고리별 조회수
     블로그 게시글을 카테고리별로 그룹화하여 조회수를 확인할 수 있도록 구성했습니다.
     가장 많은 조회수를 기록한 2개의 카테고리는 진하게 색상 처리를 했습니다.

📌 카테고리별 게시글 조회수
     카테고리에 속해있는 게시글 중 어떤 게시글이 조회수가 많았는지 확인할 수 있도록 구성했습니다.

🧷 매개변수를 이용해서 카테고리별 조회수 상위 n개의 게시글을 살펴볼 수 있도록 구성했습니다.
🧷 동작을 추가하여 '월별 카테고리별 조회수' 그래프에서 월을 클릭할 경우 카테코기별 해당 월 게시글 조회수를 확인할 수 있습니다.

월별 카테고리별 조회수 (좌), 카테고리별 게시글 조회수(우)

<해석하기>
📌 월별 카테고리별 조회수
    ✔️ 모든 월에서 <Python> 카테고리의 조회수가 가장 많은것을 확인할 수 있었습니다.
    ✔️ <투자론>은 4~6월에 높은 조회수를 기록하다 방학이 되는 7월에 조회수가 급감하는 것을 확인할 수 있습니다.
    ✔️ 꾸준히 높은 비중을 차지하는 카테고리는 <Python>, <MSSQL>, <R> 정도라는 것을 확인할 수 있었습니다.

📌 카테고리별 게시글 조회수
    ▪️ 사람들의 수요가 높은것은 그만큼 많이 사용하고 필요로 하는 내용이라고 생각할 수 있습니다.
    ✔️ <MSSQL> 의 경우 SQLD 시험을 준비하며 작성했던 내용인데 조회수가 높은 게시글 = 이해가 어려워 부가설명이 필요한
         게시글이라는 생각이 들었습니다.
        ▪️ 서브쿼리 > select 절 실행순서 > 조인 > where절 에 관련된 내용의 조회수가 높았습니다.
        ▪️ 실제 SQL 쿼리를 작성할 때 중요한 내용을 담은 게시글이 높은 조회수를 기록한 것을 확인할 수 있습니다.

    ✔️ <Python>과 <R> 카테고리에는 공통적으로 크롤링 내용을 담은 주제가 많이 분포했습니다.
        ▪️ 데이터 분석을 하려는 사람들에게 크롤링에 대한 지식은 어느정도 기본이 되어간다는 느낌을 받을 수 있었습니다.
        ▪️그 외에도 정규표현식, pandas의 group by, R 의 tidyr 생태계에 대한 내용도 인기가 있었습니다.

    ✔️ 나머지 카테고리는 개념 설명에 대한 게시글이 대부분인데, 중요하고 어려운 내용일수록 조회수가 높다고 판단했습니다.
        ▪️ <시계열 분석> : 편자기상관함수(PACF), 자기상관함수(ACF)에 대한 내용
        ▪️ <투자론> : 포트폴리오의 위험과 수익률, 효율적 프론티어에 대한 내용

🚩
    ▪️ 대부분의 카테고리에는 '개념 설명'에 대한 게시글이 대부분이고 높은 조회수를 차지했습니다.
    ▪️ 개념설명 이외에도 직접 분석한 내용이나 사례 위주의 게시글 비중도 높혀나가봐야겠다는 생각을 했습니다.
    ▪️ 각 카테고리에 대해서 가볍게 다룬 내용이 많은데 향후 개념에 대한 공부를 할 때 조회수가 높은 주제, 내가 공부하면서 어려웠던
      주제들을 위주로 포스팅을 해봐야겠습니다.

 

2.4. 블로그 방문 현황

블로그 방문 현황을 나타낸 대시보드에는 총 3개의 내용이 들어있습니다.

<대시보드 구성 내용>
📌 방문채널별 비중
     어떤 채널에서 블로그로 유입되는지를 확인할 수 있도록 구성하였습니다.

📌 평균 방문 시간
     월별로 게시글당 평균 유지 시간이 얼마나 되는지 확인할 수 있도록 구성하였습니다.

📌 기기별 방문 현황
     어떤 기기를 통해 방문하는지 확인할 수 있도록 구성하였습니다.

방문채널별 비중(좌), 평균 방문 시간(우)
기기별 방문 현황

<해석하기>
📌 방문채널별 비중
    ✔️ 네이버 블로그임에도 불구하고 Google 유입자가 40% 이상이라는 점이 의외였습니다.
    ✔️ 대부분의 유입자(99%)가 Naver, Google 을 통해 방문하고 있다는 것을 확인할 수 있었습니다.
    ✔️ 7월 Google > Naver 부분을 이전의 월별 카테고리별 조회수 부분을 함께 고려해봤을 때,
         네이버 = <투자론>, Google = <Python>, <R>, <MSSQL> 카테고리 유입이 많을 것이라고 예상해볼 수 있습니다.

📌 평균 방문시간
    ✔️ 실제로 대부분의 게시글을 소비하는 '기타' 그룹을 살펴보면 8~9분 정도 게시글에 머무르는 것을 확인할 수 있습니다.

📌 기기별 방문 현황
    ✔️ PC 방문이 약 70%, 모바일 방문이 약 30%로 PC 방문이 더 많음을 확인할 수 있습니다.
        ▪️ 게시글에는 사진, 캡쳐본, 수식 등이 포함된 게시글이 많아 모바일로 볼 경우 가독성이 떨어질 수 있는데 다행히 PC 방문이 많았습니다.

🚩
    ▪️ 앞으로 블로그에서 주로 다룰 카테고리가 Python, R, SQL 임을 고려했을 때, 네이버 블로그를 고집할 필요가 없다고 생각이
      들었습니다. (티스토리 블로그로 이전한 것이 좋은 선택이라고 생각됩니다.)
    ▪️ 대부분의 방문자가 검색을 통해 유입되고 있는데 다양한 유입 채널(커뮤니티, LinkedIn 등)을 만드는 것이 필요해보입니다.

 

 

3. 끝맺으며

이렇게 흐름에 따라 대시보드의 구성내용과 그에 대한 해석을 살펴봤는데요.

살펴본 내용을 활용해서 앞으로의 방향성과 그렇게 나아가기 위한 액션을 정리하며 이번 포스팅을 마무리하려합니다.

🚩 이번 대시보드의 목적
      = 기존 블로그 현황 분석을 통해 새로운 티스토리 블로그의 품질 개선 및 포지셔닝을 위한 방향성을 확립

🚩 방향성
    📌 방문자 현황
        현재 : 대부분의 방문자가 일회성 방문자
        방향 : 어떤 주제를 떠올렸을 때 내 블로그가 함께 떠오르게 하여 유입을 늘리고 재방문율 높이기
        액션 : 몇 가지 카테고리를 정하고 그 카테고리에 대한 게시글을 시리즈로 작성해보기

    📌 성·연령별 조회 현황
         현재 : 19-24세 대학생, 25-29세 대학생&사회 초년생, 30-34세 직장인이 많은 비중을 차지함
         방향 : 25-34세에 해당하는 사회초년생, 직장인을 타겟으로 한 블로그 운영하기
         액션 : IT 계열 직장인이 필요로하는 내용 = 내가 필요한 내용이므로 공부한 내용을 꾸준히 포스팅하기
                 (Python, R, SQL, 비즈니스 모델 관련 내용 등)

    📌 게시글 순위
         현재 : 개념 설명에 대한 내용이 많고 어렵거나 실무에서 많이 사용하는 내용일수록 조회수가 높음
                 대부분의 게시글이 개념 설명에 대한 포스팅임
         방향 : 개념 설명 이외에도 다양한 내용을 담은 게시글 작성하기
         액션 : 개념 설명에 대한 게시글은 어렵거나 실무에서 많이 사용하는 내용 위주로 다루기
                 개념 이외에도 미니 프로젝트 진행, 실제 사례 소개 등 다양한 게시글 작성하기

    📌 블로그 방문 현황
         현재 : 대부분이 Naver, Google 검색을 통해 유입, 게시글 하나를 소비하는 데 8~9분의 시간 소요
         방향 : 유입채널 다양화 하기
         액션 : 커뮤니티나 LinkedIn 같은 채널을 활용해서 검색 이외의 유입을 확보하기
                 게시글 중간중간에 쉬어갈 수 있는 내용이나 이미지를 넣어서 방문자가 지치지 않도록 하기

긴 글 읽어주셔서 감사합니다🙂

 


추가로 이렇게 블로그 분석을 진행하게 된 내용에 스토리 한 방울 담아 따로 정리를 해봤습니다.

 

[분석] 개인 블로그 현황 분석을 통한 블로그 운영 성과 개선하기 (with. Tableau)

0. 21세기는 컨텐츠의 시대 이전의 자본주의 사회에서는 제품 공급자와 소비자의 경제활동을 통해 세상이 돌아갔습니다. 하지만 요즘의 세상을 돌아보면 구독이라는 시스템 아래에 컨텐츠 공급

schatz37.tistory.com

시간 되실 때 편안하게 읽어봐주세요~ 감사합니다🐣

블로그의 정보

고동의 데이터 분석

소라고동_

활동하기