카테고리 없음

[확률 및 통계] 상관 분석(Correlation Analysis)

unnjena 2020. 8. 11. 19:57

산점도(Scatter plot)

  • (x1,y1), (x2,y2), …, (xn, yn)평면좌표에 표시한 도표
  • 시각적으로 두 변수의 관계를 쉽게 알 수 있게 해줌
  • 변수간 관계의 방향, 형태, 관계의 강도를 알 수 있음

공분산(Covariance)

  • 두 확률변수 X와 Y의 선형적 상관관계를 측정할 수 있는 척도
  • X와 Y가 각각의 평균을 중심으로 하여 같은 방향으로 변화하는 정도를 나타냄
  • σxy=Cov[X, Y] = E[(X- E[X])(Y- E[Y])] = E[XY] - E[X]E[Y]
  • 공분산 값의 크기가 단위 등에 따라 달라짐

표본 공분산(Sample Covariance)

  • σxy 의 추정량으로 Sxy 로 표현

상관계수

  • 공분산을 단위와 무관하게 표준화시킴
  • -1 에서 1까지의 값을 가짐

표본상관계수

  • 상관계수의 추정량으로 rxy 로 표현

  • 표본상관계수에 따른 산점도

  • 상관계수 검정