데이터 점들의 집합에 가장 알맞은 선분을 찾는 과제가 중요합니다. 데이터 점들의 집합을 위한 최적의 선분을 발견하는 통계적 기술을 회귀(regression)라고 하며 그 결과 나타난 선분을 회귀 선분(regression line)이라고 부릅니다.



일년째 여러분이 광장에서 커피와 아이스크림을 판매하는 테이크아웃 전문점을 운영하고 있다고 상상해보세요. 지난 1년간의 판매를 되돌아보며 온도가 내리고 오르는지에 따라 커피의 판매량이 얼마나 변했는지, 또는 아이스크림 판매량이 얼마나 변했는지 알게 되며 재료와 작업과 서비스에 대한 준비를 더 효율적으로 진행하여 앞으로 1년간 좋은 성과를 기대할 수 있을 것입니다.
상관 관계의 뜻
아이스크림 판매량과 온도 또는 커피 판매량과 온도와 같이 두 개의 서로 다른 변수들간의 관계를 측정하고 표현하는 통계적인 방법을 상관 관계(correlation)이라고 합니다. 따라서 상관 관계는 언제나 두 개의 변수들이 가지고 있는 값들이 필요합니다. 변수들의 점수를 X와 Y로 표시하여 그래프로 나타내는데 그래프에 표시되는 점들을 살펴보면 데이터들의 패턴과 경향을 파악할 수 있습니다. 데이터들이 패턴과 경향은 상관 관계의 특징을 의미하는데 크게 세 가지로 정리할 수 있습니다.
첫번째 특징 : 관계의 방향
온도가 오르면 증가하는 아이스크림 판매량과 같은 방향을 지니는 관계를 양(positive)의 상관 관계라고 합니다. 반면에 온도가 오르면 감소하는 카피의 판매량과 같은 방향을 지니는 관계를 음(negative)의 상관 관계라고 합니다. 양의 상관 관계는 두 개의 변수가 같은 방향으로 움직이는 경향이 있고 음의 상관 관계는 두 개의 변수가 반대의 방향으로 움직이는 경향이 있는 것입니다.
두번째 특징 : 관계의 형태
상관 관계에서 흔히 볼 수 있는 형태가 선형 관계이지만 경우에 따라서는 그렇지 않은 경우도 많으며 그들을 계산하기 위해서는 다른 특별한 방법들이 사용됩니다.
세번째 특징 : 관계의 정도
상관 관계는 데이터가 고려되는 특별한 형태에 얼마나 잘 맞는지를 특정해줍니다. 예를 들어 선형의 상관 관계는 직선에 얼마나 잘 맞는지를 측정할 수 있습니다. 이 관계의 정도는 상관 관계의 숫자로 표현하는데 완전한 상관 관계는 완전히 맞는 것을 가리키며 1의 상관 관계를 갖는다고 합니다. 물론 -1도 역시 완전한 상관 관계를 갖는다고 표현합니다. 마찬가지로 전혀 일치하지 않은 경우에 0의 상관 관계를 갖는다고 합니다.
댓글을 달아 주세요
댓글 RSS 주소 : http://hobbits84.hosting.paran.com/tc/rss/comment/37댓글 ATOM 주소 : http://hobbits84.hosting.paran.com/tc/atom/comment/37