본문 바로가기

데이터 분석

스피어만 상관계수(python)

조건 : 변수가 모두 연속형 변수이고 정규성을 따르지 않는 경우에 사용

import pandas as pd
import scipy.stats as stats

df = pd.DataFrame(np.array([[1, 2], [3, 3], [4, 4], [5, 6]]),columns=['col1','col2'])
# 또는 CSV 임포트 #df = pd.read_csv('test.csv')

# 스피어만 상관계수 검정
corr = stats.spearmanr(df.col1, df.col2)
corr

1.0으로 강한 상관관계. pvalue는 0으로 대립가설

 

pvalue

필수적이지는 않지만, 일반적으로 0.05이상은 귀무가설, 0.05미만은 대립가설을 채택

일반적으로 해석되는 경향

  • 귀무가설 : 차이가 없다. 효과가 없다. 변수간 영향이 없다.
  • 대립가설 : 차이가 있다. 효과가 있다. 변수간 영향이 있다.

 

참고

상관관계

2020/04/07 - [데이터/이론] - 상관관계

'데이터 분석' 카테고리의 다른 글

ROC AUC  (0) 2021.05.07
log를 이용한 정규분포 변환(python)  (0) 2020.07.23
distplot를 이용한 정규분포 확인(python)  (0) 2020.07.23
지수와 로그  (0) 2020.05.26
상관관계  (0) 2020.04.07