고동의 데이터 분석

[종합] 파이썬을 활용한 자산별 상관관계 구하기 (feat. 자산 포트폴리오)

by 소라고동_

* 올해 초(2021년 1월) 개인적인 호기심으로 네이버 블로그에 포스팅했던 내용을 티스토리 블로그로 옮긴 글입니다. 옮기는 과정에서 내용을 조금 수정하여 원본과 약간의 차이는 존재하겠지만 전체적인 내용 구성은 동일합니다.

(원본 = 본인 네이버 블로그 게시글 https://blog.naver.com/schatz37/222202355325 )

 

 

0. 들어가며

'빚투', '영끌' 등 근래 몇 년간 새로 등장하는 단어들을 살펴보면 투자에 대한 관심이 폭발적으로 증가했음을 알 수 있습니다.

주변만 둘러봐도 주식을 시작하는 '주린이' 들을 쉽게 볼 수 있고, 2020년 주식 시장을 주도한 주체로 스마트해진 개인투자자들을 꼽기도 합니다.

말도 안되게 늘어난 신규 계좌 수와 개인 순매수액.

특히 2030 세대들의 주식 계좌 신규 개설이 많이 늘어났는데 이들이 재테크를 시작하는 이유들은 다양했습니다.

'시중 금리가 너무 낮아 예적금을 드는 것이 의미가 없다.' , '남들이 다 하는데 나만 안하면 뒤쳐질 것 같아서 시작했다.' , '부동산 가격이 너무 급격하게 상승해서 월급만으로는 평생 집을 살 수 없으니, 주식 투자로 돈을 벌어서 부동산을 살거다.' 등등...

위와 같은 이유 뿐만 아니라 유투브와 같은 매체를 통해서 다양한 정보를 쉽게 얻을 수 환경도 개인투자자의 증가에 한몫 했다고 볼 수 있습니다

 

올해 초(2021년 1월) 해당 내용을 다뤘을때의 주식시장의 상황을 돌아보면 굉장한 강세장이 이어졌었습니다.

그래서 그 당시에는 수익을 얻을 확률이 높았고 주변에서 돈을 벌었다는 이야기도 쉽게 들을 수 있습니다.

하지만 우리는 강세장이 언제까지 유지될지 모르며 지금 상황을 바라보면 벌써 강세장이 끝난것만같은 느낌을 받습니다.

주식은 Random walk 라는 말도 있듯 누구도 예측할 수 없습니다. 누가 알기나 했을까요.. 2020년 3월 생각도 못한 요인으로 폭락장이 찾아온다는 걸요.

순식간에 폭락하는 KOSPI 

우리는 이렇게 예측할 수 없는 주식시장에서 살아남아야합니다.

살아남기 위해서 다양한 방법이 존재하겠지만 하나의 좋은 방법은 자산, 종목, 시간 분배를 하는 것입니다.

그래서 이번 포스팅에서는 자산의 분배, 자산 포트폴리오에 대해서 이야기를 해보려 합니다.

 

 

0.1. 상관관계

자산의 분배에 대해 알아보기 앞서 꼭 알고가야할 개념인 상관관계에 대해 알아봅시다.

출처 : 네이버 백과사전

네이버 백과사전에는 두 대상이 서로 관련성이 있다고 추측되는 관계라고 정의하고 있습니다.

이해를 돕기 위해서 짧막한 예시를 가져와봤습니다.

편의점을 운영하는 A 사장님이 매장의 판매량을 살펴보던 중 몇 가지 연관성을 발견했습니다.

'여름이 되어 기온이 높을수록 아이스크림 판매량이 늘어나는구나!'
'겨울이 와서 기온이 낮아지니 아이스크림 판매량이 줄어들구나. 그런데 호빵 판매량은 늘어나네?'

위 예시에서 우리가 생각해볼 수 있는 것은 "기온", "아이스크림 판매랑", "호빵 판매량"의 관계입니다.

기온이 높으면 아이스크림 판매량이 높아진다.
기온이 낮으면 아이스크림 판매량은 낮아지고, 호빵 판매량은 높아진다.

분명 기온과 아이스크림, 호빵의 판매량은 어떠한 관계를 가지고 있습니다.

여기서 상관관계의 개념을 도입해보면 '기온과 아이스크림 판매량, 기온과 호빵 판매량은 상관관계가 존재한다.' 라고 표현할 수 있습니다.

 

하지만 상관관계를 이해하실 때 주의해야하는 부분이 있습니다.

상관관계는 인과관계(원인과 결과의 관계)를 의미하는 것이 아니다.

 

상관관계를 해석할 때 아주 중요한 부분입니다.

예시를 이용해보면 기온이 높아지면 아이스크림이 잘 팔린다고 추측할 수 있지만, '기온이 높아졌기 때문에 아이스크림이 많이 팔린다.' 라는 인과관계로 해석할 수는 없다는 것입니다.

그저 기온과 아이스크림 판매량, 기온과 호빵 판매량은 서로 연관되어있는 경향성이 존재한다. 정도로 해석을 하셔야 합니다.

상관관계의 예시를 조금 더 살펴보시고 싶으면 이 링크를 타고 확인해보시길 바랍니다.

 

이러한 상관관계를 수치로 표현한 것이 '상관계수라는 것입니다.상관계수는 관계에서의 '경향성이 얼마나 강한지?' 그리고 '양의 관계 또는 음의 관계를 가지는지?'를 나타냅니다.이 값은 -1 ~ 1 의 값을 가지며 수치에 대한 해석은 아래와 같이 할 수 있습니다.

상관계수가 1 에 가깝다 = 강한 양의 상관관계를 가지고 있다.
양의 상관관계란 하나의 대상이 다른 대상과 같은 방향성을 가지고 있음을 의미합니다.
위 예시에서 기온이 높아지면 아이스크림 판매량이 높아지는 경향을 보였으니, 기온과 아이스크림은 양의 상관관계를 가지고 있다고 해석할 수 있습니다.

상관계수가 -1 에 가깝다. = 강한 음의 상관관계를 가지고 있다.
음의 상관관계란 두 대상이 상반되는 방향성을 가지고 있다는 것입니다.
위 예시에서는 기온과 호빵이 음의 상관관계를 가진다고 볼 수 있겠죠.

상관계수가 0 이다. = 두 대상간의 관련성이 없다.

'포트폴리오' 구성을 위해 필요한 '상관관계(상관계수)'라는 개념을 잘 기억해둔채로 포트폴리오에 대한 내용을 알아봅시다.

 

1. 포트폴리오란?

투자를 시작하고 이런 저런 내용들을 공부하다보면 '포트폴리오'라는 용어를 쉽게 접할 수 있습니다.

포트폴리오가 뭐길래 수많은 전문가들이 이야기할까요? 포트폴리오의 사전적 정의를 살펴보면 다음과 같습니다.

 

출처 : 네이버 백과사전

 

 

기본적으로 투자에 있어서는 "High Risk, High Return" 이라는 공식이 적용됩니다.

위험을 부담할수록 더 높은 수익을 기대할 수 있다는 의미입니다.

그런데 투자자들은 개인마다 성향이 다릅니다. 누군가는 위험을 감당하며 높은 수익을 노려보지만, 다른 누군가는 적당히 위험을 감수해서 적당한 수익을 얻어내고 싶은 사람도 있습니다.

즉, 사람마다 위험 선호도가 다르다는 것이죠.

 

포트폴리오는 위험 선호도가 비교적 낮은 사람들을 위해 사용하는 개념입니다.

위의 사전적 정의를 보면 "위험을 줄이고", "투자수익을 극대화" 한다고 정의되어 있습니다.

그리고 그 방법으로 "여러 종목에 분산 투자" 를 들고 있습니다.

 

하지만 포트폴리오는 단순히 여러 종목을 사는 것이 아닙니다.

예를 들어서 포트폴리오를 만들기 위해 분산 투자를 하라고 했으니 "LG화학", "삼성SDI", "SK이노베이션"을 담았습니다.

여러 종목을 샀으니 '나는 포트폴리오를 구성했네~' 라고 생각하는 것은 포트폴리오의 개념에서 조금 벗어난 것일지도 모릅니다.

 

왜냐하면 위 종목들은 상당히 높은 양의 상관관계를 가지고 있습니다.

물론 위험의 분산이 될지 모르지만 만약 종목이 떨어지기 시작하면 다같이 떨어져 위험을 줄이기 힘들어집니다.

 

그렇기 때문에 '포트폴리오'라 함은 서로 음의 상관관계를 가진 종목들로 구성하여 어떤 종목이 떨어질 때 다른 종목은 상승하여 그 손실을 줄이는 데에 목적이 있습니다.

이러한 과정을 "위험의 헷지(Hedge)" 라고 부르기도 합니다.

 

이렇게 여러 종목을 구성해서 1차적으로 위험을 회피할 수 있지만 만약 작년 3월처럼 주식 시장 전체가 하락하는 경우라면 어떻게 될까요?

물론 상승하는 종목도 있겠지만 다같이 하락하는 경우를 맞이할 확률이 높습니다.

그래서 이러한 위험을 줄이기 위해 "자산 포트폴리오" 구성이 필요합니다.

 

 

1.1. 자산 포트폴리오를 만들자

자산 포트폴리오는 말 그대로 다양한 자산군에 자본은 분배하여 포트폴리오를 만드는 것입니다.

우리가 운용할만한 자산의 종류는 '국내 주식', '해외 주식', '달러', '금', '채권', '부동산' 등이 있습니다.

 

이 자산들은 서로 양의 상관관계를 가지기도 하고 음의 상관관계를 가지기도 합니다.

위에서 알아본 내용을 토대로 우리의 목적을 한 문장으로 정리하면 이렇게 됩니다.

 

"음의 상관관계를 가진 자산들을 함께 운용해 나가면서 위험을 최소화 하고,
위험이 최소화된 상태에서의 수익률을 극대화 하는 것"

위 목적을 달성하기 위해서는 자산별 상관관계를 알아야하니 자산별 상관관계를 구해봅시다.

 

 

2. 자산별 상관관계

다양한 자산 중 이번 포스팅에서 다뤄볼 자산을 정리하면 아래와 같이 정리할 수 있습니다.

자산의 종류

부동산의 경우 현재 제가 운용할 수 있는 자산이 아니라서 제외하였습니다.

 

이제 해당 INDEX 들의 월단위 수익률을 이용하여 상관관계를 파악해보도록 하겠습니다.

사용한 데이터는 아래 링크에 들어가시면 확인할 수 있습니다.

 

주식시장 시세와 금융뉴스 - Investing.com

Investing.com은 무료 실시간 시세, 포트폴리오, 챠트, 최신 금융 뉴스, 주식시장 데이터 및 기타를 제공.

kr.investing.com

 

2.1. 자산의 가격 추이 확인하기

우선 각 자산들의 가격들이 지금까지 어떻게 변화했는지를 그래프로 확인을 해보겠습니다.

각 자산의 가격 변화

한눈에 봤을 때 파랑색 그래프, NASDAQ 인덱스의 가격 상승이 한눈에 들어옵니다.

이어서 S&P500(빨강), KOSPI(노랑), Gold(검정) 인덱스도 꾸준히 증가하고 있음을 확인할 수 있습니다.

 

그런데 US_Bond 는 일단 가격대가 낮아서 그래프 상에서 확인이 잘 안됩니다.

자산이 어떻게 움직이는지를 확인하기 위함이었으니 따로 그려보겠습니다.

미국 국채 수익률

US_Bond 도 상승하고 있음을 확인할 수 있습니다.

 

여기서 우리가 생각해볼 수 있는 점은 이렇습니다.

결국엔 자산의 가격은 상승하고 있다.
그러므로 장기적으로 자산에 대한 투자는 자산 증식에 필수적이다.

 

2.2. 자산별 상관관계 파악하기

데이터를 받아와서 정제한 후 Index 별 가격을 수익률로 변환시켜주었습니다.

수익률로 변환한 이유는 자산 가격이 가지는 추세를 없애기 위함입니다.

가결 -> 수익률 변환

 

국내 KOSPI 시장의 시작인 1980년 1월부터의 데이터를 가지고 만들어보고 싶었는데,

열심히 구글링을 해봐도 모든 자산들의 가격 데이터를 1980년 부터 구할수가 없어 가능한 만큼 확보를 한 상태로 진행했습니다.

그래서 값이 없는 시기는 제외하고 값이 갖추어진 시점의 값들만 활용하였습니다

 

사용할 데이터셋

Null 값을 없애고 나니 활용할 수 있는 기간이 줄어들었습니다.

일단 이 자산군들의 상관관계를 파악해봅시다.

* 기간 : 1985년 11월 ~ 2020년 12월, 총 241개월

가운데 대각선 축을 기준으로 대칭으로 이루어져있기 때문에 한 방향만 보셔도 됩니다.

 

우리가 가장 쉽게 투자할 수 있는 국내 주식시장을 대표하는 KOSPI 지수의 값을 기준으로 이야기를 해봅시다.

  • KOSPI와 S&P500, NASDAQ 은 양의 상관관계를 가지고 있다.
  • KOSPI와 US_Bond 는 약한 음의 상관관계를 가지고 있다.
  • KOSPI와 환율은 음의 상관관계를 가지고 있다.
  • KOSPI와 금은 아주 약한 양의 상관관계를 가지고 있다(거의 없다고 봐도 될 정도).

위 내용을 바탕으로 자산포트폴리오를 구성한다면 달러나 미국 국채를 함께 운용하는 것이 좋아보입니다.

 

하지만 전체 기간의 상관관계를 한번에 확인하니 자산별 상관계수값이 희미해진 느낌입니다.

물론 2~30년동안 자산 포트폴리오를 꾸준하게 운용한다면 위 상관관계를 따라갈 것이라고 생각하고 위 수치를 참고하면 됩니다.

하지만 저는 2~30년 까지 동일하게 자산을 운용하기는 어렵다고 생각하기때문에 특정 기간에서의 자산별 상관관계를 알아보기로 했습니다.

 

해당 부분은 따로 포스팅을 하였으니 아래의 링크를 통해 확인할 수 있습니다.

2021.08.17 - [분류 전체보기] - [시각화] 파이썬을 활용한 자산별 상관관계 구하기 #2

 

3.끝마치며

이렇게 자산별 상관관계를 알아보았습니다. (꼭 위 링크의 기간별 상관관계를 확인하시길 바랍니다!)

자산 포트폴리오의 핵심은 음의 상관관계(혹은 낮은 양의 상관관계)를 가진 자산을 통해 위험을 최소화 하고 수익을 극대화 하는 것입니다.

근데 여기서 유의할 점은 위험이 낮아지므로 당연히 수익률도 낮아지게 됩니다.

오르는 자산과 떨어지는 자산을 함께 보유하고 있으니 수익률이 떨어지는 것은 당연하겠지요.

그럼에도 포트폴리오는 가치가 있습니다.

투자는 수익률을 높혀 자산을 불러나가는 것을 목적으로 하지만 반대로 잃지 않는 투자를 하는 것 또한 매우 중요하기 때문이죠.

어떤 투자방법이든 장단점은 존재합니다.

잃지 않는 투자를 하는 것은 매우 지루할 수 있고, 인내심을 가지고 주변의 환호에 휩쓸리지 않도록 자신을 다스려야합니다. 반대로 위험선호가 높은 투자자의 투자는 짜릿하지만 그만큼 위험합니다.

그렇기 때문에 자신의 성향에 맞는 투자 방법을 찾아서 투자를 하는 것이 가장 바람직합니다.

만약 이 게시글을 읽고 자산 포트폴리오에 관심이 생기셨다면 세계적인 헷지펀드에서 구성하고 있는 자산 포트폴리오들이 많으니 그것들을 참고해도 좋겠습니다.

해당 게시글을 통해 어떤 방향으로든 도움이 되셨길 바랍니다😊

블로그의 정보

고동의 데이터 분석

소라고동_

활동하기