728x90
상관관계는 두 변수(예: X, Y)가 함께 변하는 패턴이 있을 때, 그 연관성의 방향과 정도를 말하는 통계 개념이다.[jmp]
기본 정의
- 한 변수가 증가할 때 다른 변수도 함께 증가하면 “양의 상관관계”가 있다.[wikidocs]
- 한 변수가 증가할 때 다른 변수는 감소하면 “음의 상관관계”가 있다.[jmp]
- 같이 움직이는 뚜렷한 패턴이 없으면 상관관계가 거의 없거나 0에 가깝다고 본다.[fanruan]
상관계수 값 해석
- 상관관계의 강도는 보통 상관계수 r 하나로 표현하며, 값의 범위는 -1에서 +1 사이이다.[diseny.tistory]
- r=+1에 가까울수록 매우 강한 양의 상관, r=−1에 가까울수록 매우 강한 음의 상관, r≈0이면 선형 관계가 거의 없다.[hyen4110.tistory]
상관관계 vs 인과관계
- 상관관계가 있다고 해서 한 변수가 다른 변수의 “원인”이라고 결론 내릴 수는 없다.[namu]
- 둘 다 같은 숨은 요인(예: 계절, 시간, 환경)에 의해 동시에 움직일 수 있기 때문에 “상관관계는 인과관계를 의미하지 않는다”는 것이 데이터 분석의 핵심 원칙이다.[brunch.co]
직관적 예시
- 키와 몸무게: 키가 큰 사람일수록 몸무게도 큰 경향이 있어 양의 상관관계를 보일 수 있다.[wikidocs]
- 아이스크림 판매량과 익사 사고: 둘 다 여름에 늘어나 상관관계는 있지만, 아이스크림이 익사의 원인은 아니라는 전형적인 예시로 자주 사용된다.[brunch.co]
언제 어떻게 쓰나
- 데이터 분석에서 두 변수 간에 “관계가 있는지, 있다면 방향과 강도는 어떤지”를 빠르게 보는 탐색 도구로 사용한다.[diseny.tistory]
- 회귀분석이나 인과추론을 하기 전에 변수 후보를 고르는 데 기초 지표로 자주 활용된다.[jmp]
728x90