데이터로 보는 경제 역설: 금리와 실업률의 숨겨진 관계

시작은 링크드인 이 글 때문입니다. 제가 이렇게 이야기 했거든요.

9월부터 미국의 금리 인하가 시작되면 게이밍 산업도 미래에 대한 낙관이 싹트며 올해 겪었던 대량해고는 발생하지 않을 것으로 봅니다. 파란색 막대처럼 500명 수준의 해고가 최대치이길 바랍니다.

생각해보죠. 금리가 낮아진다는 것은 화폐 가치가 떨어지는 것입니다. 돈이 더 이상 귀하지 않고 흔해지죠. 그래서 기업들이 펀딩을 받기 쉬워지고, 운영자금이 확보되니 고용이 안정 될거에요. 고용이 안정되니까 해고도 줄어들고, 해고가 줄어드니 실업률도 떨어지겠죠. 그런데 현실 세계에서 정말 그럴까요? 여러분은 금리와 실업률의 관계에 대해 어떻게 생각하시나요?

그래서 데이터를 분석해보기로 했고, 저는 일반적으로 이런 과정을 밟습니다.

  1. 원천 데이터 확보
  2. 데이터 전처리
  3. EDA (Exploratory Data Analysis)
  4. 분석 모델 적용
  5. 결과 확인, 트윅, 해석

분석 태스크의 난이도는 위 과정들의 난이도를 모두 더한 것이라고 할 수 있겠죠. 다행이 이번 태스크는 난이도가 쉽습니다.

원천 데이터 확보

필요한 수치가 정부 데이터이니 공개되어있을 것이고 보기 쉽고 다루기도 쉽게 제공될 것이라고 기대합니다. 난이도 easy. FRED(Federal Reserve Economic Data)에 필요한 데이터가 다 있었고 데이터 특성은 이렇습니다.

  • data: 미국 금리, 미국 실업률
  • range: 2000-01-01 ~ 2024-06-01
  • dimension - datetime, monthly
  • metric - number, rate

마침 두 데이터가 차원과 지표가 완전히 같아요. 그리고 흔하고 다루기 쉬운 데이터죠. 먼저 미국 기준금리(Federal Funds Effective Rate)부터 볼까요?

그리고 실업률(Unemployment Rate)입니다.

차트 배경을 보면 세로로 회색 음영이 있어요. 그 음영이 커버하는 영역에서 뭔가 라인이 급격하게 변하는 패턴이 있죠? 그런데 한 차트에선 라인이 수직낙하하고 다른 차트에선 튀어 오르네요. 냄새가 납니다. 혹시 여러분도 이 기간에 일상생활에서 금리나 실업률 변화를 이렇게 급격하게 체감하신 적이 있나요? 저는 없었는데 다른 분들의 경험이 궁금하군요.

참고로 차트 하단에서 customize를 클릭하면 FRED로 가서 데이터를 만져보거나 csv로 다운로드 할 수 있고요, download data를 클릭하면 excel 파일을 받을 수 있어요.

데이터 전처리 & EDA

이 두 단계를 합친 이유는 이번 태스크에 전처리나 EDA라고 할만한 게 없기 때문입니다. 먼저 전처리 단계

  • 데이터 형태 파악
  • 데이터 불량 처리

뭐 이런 작업들을 하는데요, 워낙 신뢰할만한 소스에서 제공하는 데이터이고 기준금리와 실업률 두 가지 수치만 있다보니 사실 전처리를 할게 없었습니다. csv 열어서 구조가 올바른지 보고, 모든 기간에 수치 값들이 잘 있는지 보면 끝이었어요.

데이터 포인트가 많고 각각 어떤 관계인지 짐작하기 어려우면 EDA에 시간이 많이 걸리겠지만 이번 케이스는 그렇지 않죠. 위에서 패턴이 뚜렷하게 보이기도 했고요. 그냥 두 데이터를 겹쳐보면 될 것 같네요.

움직임이 반대인 경향성이 보입니다

이 그래프를 보고 어떤 점이 가장 눈에 띄시나요? 예상과 다른 부분이 있었다면 무엇인가요?

제가 눈으로 보기에 두 데이터는 다른 방향으로 움직이는 것 같습니다. 실업률이 올라가는 추세일 때 금리는 내려가는 추세가 생기고, 실업률이 내려가는 추세일 때 금리가 올라가는 추세가 만들어지죠. 눈으로 본 것이 통계적으로 얼마나 유효할지를 봐야겠어요. 참고로 아래와 같은 코드로 로컬이든 구글 Colab이든 데이터를 로드해서 플롯을 그릴 수 있습니다.

# 라이브러리 임포트
import pandas as pd
import matplotlib.pyplot as plt

# csv 에서 데이터 불러오기
# 각자 환경에 맞게 이 부분을 변경해서 사용하세요
data1 = pd.read_csv('/content/FEDFUNDS.csv')
data2 = pd.read_csv('/content/UNRATE.csv')

x1 = data1['DATE']
y1 = data1['FEDFUNDS']
x2 = data2['DATE']
y2 = data2['UNRATE']

# 라인차트
plt.figure(figsize=(16, 9))
plt.plot(x1, y1, color='blue', label='interest', linewidth=5)
plt.plot(x2, y2, color='red', label='unemployment', linewidth=5)

# 그래프 옵션
plt.ylabel('%')
plt.title('2000 - 2024, Monthly, USA')
plt.legend()
plt.gca().axes.xaxis.set_visible(False)
plt.show()

분석 모델 적용

금리와 실업률 사이의 상관관계를 구하는 모델이 필요합니다. 꼭 데이터 분석이 아니더라도 어떤 요소들 간의 상관관계를 발견하는 것은 삶 속에서도 중요한 스킬이죠. 상관관계 분석이 일상생활의 필수 주제인 만큼, 통계 분야에서는 오래 전부터 피어슨 상관계수(Pearson Correlation Coefficient)를 주로 사용하며 요소 간의 상관관계를 계산해 왔습니다.

피어슨 상관계수의 수학적인 배경은 잘 모릅니다만(ㅎㅎㅎ), 파이썬에 라이브러리가 있으니 그냥 사용하면 되지 않겠어요? SciPy 통계 패키지 scipy.stats 에 피어슨 상관계수 라이브러리 pearsonr 가 있습니다. 위에서 로드했던 데이터로 바로 계산에 들어갑니다.

# 라이브러리 임포트
from scipy.stats import pearsonr

# 피어슨 상관계수와 p-value 계산
correlation, p_value = pearsonr(data1['FEDFUNDS'], data2['UNRATE'])

# 결과 출력
print(f"피어슨 상관계수: {correlation}")
print(f"p-value: {p_value}")

계산 결과는 이렇습니다.

피어슨 상관계수: -0.5855721562490348
p-value: 1.8759045545903473e-28

결과 해석

피어슨 상관계수는 두 변수 간의 관계를 -1에서 1 사이의 숫자로 나타냅니다. 두 변수가 얼마나 밀접하게 묶여서 같이 움직이는지를 보여주는 지표예요. 예를 들어 아이스크림 판매량과 기온의 관계처럼요.

  • 0.7 ~ 1: 강한 양의 선형 관계라는 의미입니다. 즉 하나가 증가하면 다른 하나도 증가하고, 감소하면 따라서 감소합니다.
  • 0.3 ~ 0.7: 보통 정도로 양의 상관관계가 있습니다.
  • 0 ~ 0.3: 약하게 양의 상관관계가 있습니다.
  • -0.3 ~ 0: 약하게 음의 상관관계가 있습니다.
  • -0.7 ~ -0.3: 보통 정도로 음의 상관관계가 있습니다.
  • -1 ~ -0.7: 강한 음의 상관관계가 있습니다. 즉 하나가 증가하면 다른 하나는 감소하고, 감소하면 반대로 증가합니다.

앞의 결과를 보면 피어슨 상관계수가 -0.586 이었죠. 미국의 금리와 실업률은 보통 정도로 음의 상관관계가 있다 입니다. 금리가 올라가면 실업률이 내려가고, 금리가 내려가면 실업률이 올라가는 경향이 일반적으로 있는 것이죠. 금리와 실업률의 관계는 마치 시소와 같습니다. 한쪽이 올라가면 다른 쪽이 내려가는 것처럼 보이죠. 차트에서 육안으로 본 반대 패턴을 신뢰할 수 있겠네요.

두번째, p-value 도 봐야죠. p-value는 우리가 발견한 관계가 우연인지 아닌지를 판단하는 데 도움을 줍니다. 마치 복권에 당첨될 확률과 비슷해요. p-value가 작을수록 우리가 발견한 관계가 우연이 아닌 진짜일 가능성이 높다는 의미입니다.

  • p-value < 0.05: 관측된 상관관계가 통계적으로 유의미하다 라는 말이고요, 이 상관관계가 우연히 발생할 확률이 5% 미만이니 관측치를 신뢰할 수 있다는 것이지요.
  • p-value ≥ 0.05: 관측된 상관관계가 통계적으로 의미가 없는 경우입니다. 이 상관관계가 우연히 발생할 확률이 5% 를 넘으니 신뢰하기 어려운 관측치가 되겠습니다.

앞의 결과에서 p-value 가 1.8759045545903473e-28 이네요. 숫자 뒤에 e-28 이렇게 붙어있는데요, 이런 기호가 붙어있으면 이 수치는 숫자 그대로 봐서는 안됩니다. 과학적 표기법이라고 하고요 엄청 크거나 작은 숫자를 표시하기 위해 이런 방법을 사용합니다. 엑셀에서 종종 보실 수 있을거에요(페이스북 캠페인 ID라거나). e-28 은 지금 제시된 숫자에서 소수점 이하 28번째까지 내려가야 한다는 의미입니다. 그래서 실제 수치는 0.000000000000000000000000000018759045545903473 입니다.

p-value 가 0.05 보다 작으면 신뢰할 수 있는 수치라고 했죠? 지금 나온 수치는 작은 정도가 아니라 극한으로 수렴하는 수준이네요. 관측된 상관관계, 즉 피어슨 상관계수 -0.586가 우연에 의해 발생할 확률이 사실상 없다는 의미입니다. 결과적으로 2000년 ~ 2024년 6월까지 미국의 금리와 실업률을 보건데, 두 수치는 보통의 음의 상관관계를 보인다라고 확실하게 말할 수 있는 것이죠. 금리가 올라가면 실업률이 내려가고, 금리가 내려가면 실업률이 올라갑니다.

저 위쪽에 임베딩한 FRED 차트에 회색 음영 있었죠? 그 시기가 미국의 resession 시기입니다. 경기 침체가 실업률이 확 올라가고, 경기가 후퇴하니 금리를 확 내려버리죠. 음의 상관관계. 이런 경제 지표의 관계가 앞으로 여러분의 삶에 어떤 영향을 미칠 것 같나요?

그래서 앞으로는?

유럽은 금리 인하를 시작했어요. 한국도 이제 동결을 끝내고 금리를 내릴 거라고 생각합니다. 미국은 이렇게 다른 나라들이 금리를 내린 후에 금리 인하를 시작합니다. 역사적인 패턴이 그래요. 아마도 미국이 가장 경제가 튼튼하기 때문에 고금리를 오래 버티는 것이지 않을까 싶습니다.

아껴쓰고 나부터 바보처럼

미국 금리가 내려가면, 미국 실업률이 올라가겠죠. 그렇다는 것은 해고가 증가하고 신규 고용이 늘어나지 않는 상황이 될 가능성이 높아질 것입니다. 그럼에도 경험상 금리 추세가 인하로 전환되는 딱 그 시점에는 자산 가격이 활활 타오르고 분위기가 좋았던 것 같은데요, 이번 분석으로 보면 금리 인하 후 얼마간 시간이 지나면 개인이나 시장 모두가 힘든 상황이 된다는 것이 결론입니다.

이 경제 지표들이 여러분의 일상에 얼마나 큰 영향을 미칠지 생각해 보세요. 금리가 내려가면 여러분의 소비와 저축 계획은 어떻게 변할까요? 이제 여러분은 개인적으로 어떤 준비나 계획을 세우고 싶으신가요?