« 結果を出した闘将・星野仙一/追悼(114) | トップページ | AI(人工知能) の分類/技術論と文明論(88) »

2018年1月 7日 (日)

シンプソンのパラドックス/知的生産の方法(168)

西内啓『統計学が最強の学問である』ダイヤモンド社(2013年1月)という本があるが、「最強」という言葉には抵抗がある。
著者は、「どんな権威やロジックも吹き飛ばし」という。
権威を吹き飛ばすのは結構であるが、ロジックを吹き飛ばすのが最強だろうか?

そんなツッコミを入れたくなるが、統計的に処理され、表現されたデータが強い説得力を持つことは事実であろう。
定性的な言葉にない定量的な表現の持つ力である。

しかし、注意しないと誤った評価や判断など、ミスリードしかねない点に注意する必要がある。
統計的なパラドックスとして有名なものが「シンプソンのパラドックス」である。
イギリスの統計学者エドワード・H・シンプソンによって示されたもので、「母集団での相関と、母集団を分割した集団での相関は、異なっている場合がある。つまり集団を2つに分けた場合にある仮説が成立しても、集団全体では正反対の仮説が成立することがある」というものである。

神永正博『直感を裏切る数学 「思い込み」にだまされない数学的思考法 』講談社ブルーバックス(2014年11月)に「新生児体重のパラドックス」と呼ばれる例が載っている。

喫煙をしていない母親から産まれた新生児(A)と喫煙をしている母親から産まれた新生児(B)について、体重別死亡率をみると以下のようであった。
Photo_8

上表は、どの体重ランクにおいても、喫煙をしている母親の方が赤ちゃんの死亡率が低いという不可解な結果であった。
喫煙の害は良く知られている。
何故だろうか?

もう少し詳細に見てみると以下のようであった。
2

上表をグラフ化すると下図になる。
Photo_12

つまり、喫煙をしていない母親から産まれた新生児(A)の方が、喫煙をしている母親から産まれた新生児(B)よりも死亡率が高いように見えた 最初の表は、以下のような2つの因果関係が複合した結果であった。

Photo_7

それぞれの因果関係は当然であろうと納得できるものである。
統計の結果を、自分にとって都合のよいように解釈して、断片的に表示していくと、統計そのものの信頼性を失わせないことになる。

|

« 結果を出した闘将・星野仙一/追悼(114) | トップページ | AI(人工知能) の分類/技術論と文明論(88) »

書籍・雑誌」カテゴリの記事

思考技術」カテゴリの記事

知的生産の方法」カテゴリの記事

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: シンプソンのパラドックス/知的生産の方法(168):

« 結果を出した闘将・星野仙一/追悼(114) | トップページ | AI(人工知能) の分類/技術論と文明論(88) »