카테고리 없음
[확률 및 통계] 상관 분석(Correlation Analysis)
unnjena
2020. 8. 11. 19:57
산점도(Scatter plot)
- (x1,y1), (x2,y2), …, (xn, yn)평면좌표에 표시한 도표
- 시각적으로 두 변수의 관계를 쉽게 알 수 있게 해줌
- 변수간 관계의 방향, 형태, 관계의 강도를 알 수 있음
공분산(Covariance)
- 두 확률변수 X와 Y의 선형적 상관관계를 측정할 수 있는 척도
- X와 Y가 각각의 평균을 중심으로 하여 같은 방향으로 변화하는 정도를 나타냄
- σxy=Cov[X, Y] = E[(X- E[X])(Y- E[Y])] = E[XY] - E[X]E[Y]
- 공분산 값의 크기가 단위 등에 따라 달라짐
표본 공분산(Sample Covariance)
- σxy 의 추정량으로 Sxy 로 표현
상관계수
- 공분산을 단위와 무관하게 표준화시킴
- -1 에서 1까지의 값을 가짐
표본상관계수
- 상관계수의 추정량으로 rxy 로 표현
- 표본상관계수에 따른 산점도
- 상관계수 검정