菅原琢『データ分析読解の技術』(中公新書ラクレ), 中央公論, 2022.
統計表・グラフ読解術。しっかりした統計知識なしに、相関と因果の概念だけでデータ分析の結果をある程度に正しく解釈できるようにする、という野心的な試みである。目指すのは、誤った解釈に対して正しい分析結果を提示できるほどにはならないけれども、相関と因果の間にあるグラデーションを理解しており、強い因果を主張するような解釈に対して留保をつけることができる、というレベルである。著者は『世論の曲解』の政治学者。
データ分析の例題を示して、どこが問題なのかを解説してゆくというスタイルで書かれている。例題は、地方創生政策と移住者数、交通事故と報道の量、特定の疾患と県民性、生涯未婚率と男余り率、新聞購読と学力、ほか著者の専門の選挙関連である。全体で8章あるが、ほぼすべての事例において因果関係に影響する隠れた第三の変数(書籍中では「交絡因子」)を見つけ出すというパターンとなっている。マスメディアで流布する安易なデータ分析のもどかしいところが、ほぼその点に集約されているということなのだろう。サンプリングの偏りや、分析者の意図(間接的にデータ分析を発表する側のメリットや立場から推定する)などの話も扱われているが、ほんの少しだけである。
こういう本は挙げられた事例が興味を引くかどうかだが、「そんな相関関係は知らなかった」かつ「そこそこ関心があるトピックである」ということが多かったので、個人的には面白かった。また、結果に対する解釈だけに留めて、やっかいな分析過程の話を避けているので、統計学の知識がなくても読めるものになってはいる。文系学生の初年次教育に非常に役に立ちそうだ。
統計表・グラフ読解術。しっかりした統計知識なしに、相関と因果の概念だけでデータ分析の結果をある程度に正しく解釈できるようにする、という野心的な試みである。目指すのは、誤った解釈に対して正しい分析結果を提示できるほどにはならないけれども、相関と因果の間にあるグラデーションを理解しており、強い因果を主張するような解釈に対して留保をつけることができる、というレベルである。著者は『世論の曲解』の政治学者。
データ分析の例題を示して、どこが問題なのかを解説してゆくというスタイルで書かれている。例題は、地方創生政策と移住者数、交通事故と報道の量、特定の疾患と県民性、生涯未婚率と男余り率、新聞購読と学力、ほか著者の専門の選挙関連である。全体で8章あるが、ほぼすべての事例において因果関係に影響する隠れた第三の変数(書籍中では「交絡因子」)を見つけ出すというパターンとなっている。マスメディアで流布する安易なデータ分析のもどかしいところが、ほぼその点に集約されているということなのだろう。サンプリングの偏りや、分析者の意図(間接的にデータ分析を発表する側のメリットや立場から推定する)などの話も扱われているが、ほんの少しだけである。
こういう本は挙げられた事例が興味を引くかどうかだが、「そんな相関関係は知らなかった」かつ「そこそこ関心があるトピックである」ということが多かったので、個人的には面白かった。また、結果に対する解釈だけに留めて、やっかいな分析過程の話を避けているので、統計学の知識がなくても読めるものになってはいる。文系学生の初年次教育に非常に役に立ちそうだ。