조건 : 변수가 모두 연속형 변수이고 정규성을 따르지 않는 경우에 사용
import pandas as pd
import scipy.stats as stats
df = pd.DataFrame(np.array([[1, 2], [3, 3], [4, 4], [5, 6]]),columns=['col1','col2'])
# 또는 CSV 임포트 #df = pd.read_csv('test.csv')
# 스피어만 상관계수 검정
corr = stats.spearmanr(df.col1, df.col2)
corr
pvalue
필수적이지는 않지만, 일반적으로 0.05이상은 귀무가설, 0.05미만은 대립가설을 채택
일반적으로 해석되는 경향
- 귀무가설 : 차이가 없다. 효과가 없다. 변수간 영향이 없다.
- 대립가설 : 차이가 있다. 효과가 있다. 변수간 영향이 있다.
참고
상관관계
'데이터 분석' 카테고리의 다른 글
ROC AUC (0) | 2021.05.07 |
---|---|
log를 이용한 정규분포 변환(python) (0) | 2020.07.23 |
distplot를 이용한 정규분포 확인(python) (0) | 2020.07.23 |
지수와 로그 (0) | 2020.05.26 |
상관관계 (0) | 2020.04.07 |