본문 바로가기
강의들을건대 2학년 1학기/비판적사고와토론

비판적사고와토론 11주차

by 공부해열 2022. 5. 15.

비판적 사고와 토론 11주 차입니다. 오늘의 물음은 사회과학에서 통계를 자주 활용하는 이유는 무엇일까?, 통계를 추론한 결론은 어느 정도 신뢰할 수 있을까? 또 통계적 삼단 논법 등입니다. 통계도 귀납 논증처럼 신뢰를 바탕으로 정확도를 믿게 되는 경향이 있습니다.



귀납적 일반화(통계적 일반화)

귀납적 일반화에는 결론을 보편 명제로 일반화하는 단수 일반화와 결론을 확률적인 명제로 일반화하는 통계적 일반화로 구분됩니다. 통계적 일반화의 형식은 “전체 중에서 X개를 조사하였더니 그중에서 Y개가 F라는 성질을 갖는다는 것이 확인되었다.”의 형식을 띄고 있습니다. 귀납적, 통계적 일반화에는 ‘전혀 없다’,’확실하다’ 등의 100% 또는 0%의 가능성을 도출할 수 없습니다.

귀납적 일반화의 오류

귀납적 일반화의 오류로 중 하나로 편향된 통계 자료의 오류가 있습니다. 그것은 편향된 통계 자료의 오류는 조사 집단(표본)의 다양성을 확보하지 못했을 때 발생합니다. 예를 들어 전체 인구 중 군대 갔다 온 인구를 조사하려 했는데 편향되게 남자 중 군대 다녀온 비율을 조사해서 개연성이 떨어지게 되는 것을 예 로들 수 있습니다. 편향된 통계를 내놓기 위해서 종종 오류를 사용하는데 이를 두고 ‘아전인수’라는 말을 할 수 있겠습니다.

성급한 일반화의 오류로는 표본의 숫자가 너무 적은 것의 오류가 됩니다. 예를 들어 ‘우리 집 강아지 1마리가 배변패드에 대소변을 잘 가리기 때문에 대한민국의 모든 강아지는 대소변을 잘 가린다.’라는 것은 너무 작은 표본으로 조사하였기 때문에 개연성이 떨어질 수 있다는 것입니다.

통계적 삼단논법

통계적 삼단논법은 “모든 F의 X%는G다. a는 F다. 따라서 a는 [X%만큼은] G다.”의 형식입니다.  구조를 다른 식으로 보자면 ‘통계적 명제, 개별적 사실 = 개별적 사실’ 이런 구조면 개연적이라고 말할 수 있습니다. 하지만 50% 이상의 개연성이어야 개연성이 높다고 표현할 수 있습니다. 여기서 F는 준거 집합, G는 귀속 집합입니다. 불완전 증거의 오류(근시안적 귀납의 오류)로는 준거 집합을 선택할 때 사용 가능한 관련 증거를 모두 사용하지 않았을 때 발생합니다. 제 생각에는 삼단논법의 형식이 퀀트 투자랑 굉장히 비슷한 느낌이 들었습니다. 퀀트 투자 저도 잘 모르지만.. 

완벽한 통계의 함정, 감시와 통제

현상을 해석하는 통계 대 현상을 만드는 통계가 있습니다. 빅브라더, 판옵티콘 등등 요즘 보면 구글이 이것에 가장 근접해있다고 봅니다. 구글사가 어떤 윤리적 책임을 가지냐에 따라 세상이 달라질 수 있다고 봅니다. 그래서 구글 주식을 사면 구글의 일원이 될 수 있지 않을까 생각해봅니다.

댓글