
변수들 사이의 관계를 찾는 제일 단순한 방법은 두 개의 변수들 사이에 관계가 있는지를 관찰하는 것으로 이를 상관 관계 방법이라고 부른다. 예를 들어 어린이가 게임을 하는 시간과 폭력 행동과의 관련성을 평가하기 위한 상관 관계 연구의 결과를 표로 작성할 수 있다. 게임 시간과 폭력 행동이라는 두 개의 변수를 측정하여 각각의 점수를 작성할 수 있는데 이 데이터들은 게임 시간의 더 높은 수준이 폭력 행동의 더 높은 수준과 관련되어 있는 경향성을 보여 준다.
변하지 않고 다양하지도 않은 없을 상수라고 부른다. 상수는 모든 개체들에 다르지 않고 같은 특성과 조건을 가리킨다. 예를 들어 선생님이 모든 학생들의 점수에 4점을 더해주어야 하는 상황이 생겼다면 모든 학생들의 점수에 더해지는 4점은 상수이다.
학생의 나이, 몸무게, 키, 성(gender)처럼 다른 값을 가지거나 변할 수 있는 서로 다른 개체들의 값들을 변수라고 한다. 따라서 관심 대상의 특성이나 조건을 나타내는 값이기도 하다. 과학자들은 우주에 대해 연구하기 위해 계절을 변화와 달의 상태 변화, 조류의 변화를 관찰하여 규칙성 있는 변화들을 기록해왔는데, 이와 같이 변할 수 있고 서로 다른 값들을 과학자들은 변수라고 정의했다.
변수들을 계산할 때 결과 값은 문자 X와 Y로 자주 표시한다. 예를 들어 변수인 키를 X라고 하면 신발 크기는 Y라고 할 수 있다. 이 관계에서 X가 변하면 Y도 변하게 되는 것이다.
표본들을 다루는 데 나타나는 하나의 문제는, 표본이 모집단에 대해 제한된 정보를 준다는 점이다. 모집단을 나타내기는 하지만 표본이 전체 모집단을 완벽하고 정확하게 반영하지는 못한다는 뜻이다. 결국 표본 통계치와 모집단의 모수 사이에 존재하는 오차 또는 불일치가 있어서 그 불일치를 표집 오차라고 부르며 이 표집오차는 또다른 문제들을 만들어낸다.
50명의 학습에서 국어 시험을 본 결과 데이터들을 모집단으로 삼아서 2개의 표본을 뽑는다고 가정하자. 모집단인 50명의 국어 점수의 평균과 2개의 표본값에서 계산한 평균값이 같은 경우는 거의 없다고 보아야 하는데 이 차이를 표집 오차라고 한다. 하지만 표집 방식의 체계 자체에 문제가 있어서 표집 오차가 발생하는 경우도 있다.
대표적인 사례로 드는 것이 1936년 미국 대통령 선거에 대한 예측 결과이다. 당시 공화당 후보 였던 랜든이 미주당의 루즈벨트 후배를 이길 수 있다는 예측이 나왔지만 결과는 르즈벨트의 압승으로 끝났다. 왜 이런 일이 벌어졌을까? 사전 여론 조사의 대상자(표본)를 전화번호부와 자동차 명부에서 추출하였기 때문에 중산층 이상의 표본들만이 뽑히고 서민들이 표본 대상에서 아예 제외되었기 때문이다.
댓글을 달아 주세요
댓글 RSS 주소 : http://hobbits84.hosting.paran.com/tc/rss/comment/29댓글 ATOM 주소 : http://hobbits84.hosting.paran.com/tc/atom/comment/29