** 해당 내용은 일반통계학(김우철 외 8인 공저)의 내용을 공부하며 쓴 포스트 입니다!

 

 

 

 

사회 대부분의 곳에서는 통계가 사용되어지고 있습니다. 

 

어떤 인사이트를 도출하기 위해서는 그 것에 대한 검증, 분석이 필요하고 이 때 필요한 것이 바로 통계죠!

 

 

 

하물며, 빅데이터 관련해서는 말할 필요가 없을 정도로 그 중요도가 크다고 합니다

 

그런 관계로 다 같이 통계공부를 해보면 좋을 듯 해요!!

 

 

저는 매 포스팅 앞에 이런 그림을 붙여 놓을까 합니다

 

 

 우리가 통계를 쓰게 되는 과정입니다!!

 

공부를 할 때 이런 식으로 내가 어디를 공부하고 있고

 

어떤 상황에 이 것이 필요한지에 대해 명확히 알 때 본인 지식이 되겠죠??

 

 

오늘 배울 부분은 연구 설계에서 데이터에 관한 부분이라고 할 수 있겠습니다.

 

올바른 검정을 위해선 올바른 데이터가 필요한 것은 당연한 일입니다. 

 

그럼 어떤 데이터를 가져올 때 올바른 것일까요

 

 

 

예를 들어 대통령선거에서 결과를 예측하고자 합니다.

 

그럼 우리는 누구에게 설문을 해야할까요?

 

바로 "투표권이 있는 국민" 입니다. 통계학에서는 이런 국민 개인을 "추출단위" 라고 합니다

 

그리고 "투표권이 있는 모든 국민"은 바로  "모집단"  이라고 합니다.

 

 

 

하지만 일반적으로 선거결과 예측을 할 때는 국민모두를 조사하지는 않습니다.

 

일정 이상의 데이터라면 해당 모집단을 대표할 수 있다고 생각하기 때문이죠

 

그러나 기본 전제가 되는 것이 바로 "대표성" 입니다

 

만약 선거결과 예측을 특정지역에서만 진행했다면

 

이는 "투표권을 가진 국민 전체" 라는 모집단을 대표할 수 없겠죠??

 

그렇기 때문에 모집단에서 무작위로 뽑아내는 "랜덤추출" 을 통해 해당 문제를 해결 할 수 있습니다

 

 

이 랜덤추출은 복원추출과 비 복원추출로 나뉘게 되는데

 

뽑았던 것을 제하고 뽑으면 이것이 비 복원추출입니다

 

 

두 차이는 간단하지만, 개인의 실험 목적에 따라 올바른 것을 사용하는 것은 절대적으로 중요합니다

 

 

 

다음은 실험 상황입니다. 우리는 어떤 것에 대해 알아보기 위해 실험을 하는 경우가 많습니다

 

이 때, 변화를 정확히 알아보기 위해 한 곳에는 알고자하는 것을 주입하고

 

한 쪽에는 주입하지 않아야 겠죠?

 

이 때, 주입한 쪽을 "실험집단", 실험집단의 각 개체를 "실험단위" , 주입한 것을 "처리" 라고 합니다.

 

주입되지 않은 쪽은 "통제집단" 입니다!

 

단순한 개념이니 알고만 가시면 될 듯 합니다. 

 

 

여기서 가장 중요한 것은 '한 쪽에는 주입하고 한쪽에는 하지 않는 다' 는 것입니다.

 

즉, 주입한 것에 따른 차이를 알기 위함이라는 것을 알 수 있죠

 

그렇기 때문에 "주입한 것" 이 외에는 모든 것이 둘은 동일해야 합니다

 

 

이러한 점에서 우리는 실험을 할 때 총 3가지 원칙을 지켜야 합니다

 

1 원칙 : "처리" 이 외의 외부 요인은 최소화 한다.

 

2 원칙 : "처리"를 할 실험단위를 선별 시, 랜덤하게 뽑아야 한다

 

3 원칙 : 충분히 많은 실험 단위에 각 처리를 반복실시한다 

 

 

 

이런 내용을 명확히 기억하고 진행하시면 더욱 정확한 실험이 되겠습니다~~!!

 

화이팅~~

'기초통계~~' 카테고리의 다른 글

기초통계(2) - 모집단과 표본  (0) 2019.04.16

+ Recent posts