読書の記録

評論・小説・ビジネス書・教養・コミックなどなんでも。書評、感想、分析、ただの思い出話など。ネタバレありもネタバレなしも。

大学4年間の統計学が10時間でざっと学べる

2024年01月03日 | サイエンス

大学4年間の統計学が10時間でざっと学べる

倉田博史
KADOKAWA


 昨今は統計学がトレンドである。AIやビッグデータの隆盛がその背景にあるのは間違いない。企業の採用でもその手の人材を募集していたり、大学がその名を冠した新学部を創設したり、学生全員を必修科目にするなどしてアピールに余念がない。

 本来的に統計とは試薬の開発や気象分析などサイエンスの分野を支える手法だが、いっぽうで人々を説得するロジックとしてしばしば引き合いに出された。戦場の天使ことナイチンゲールは統計の論法を用いて国を説得し、大規模な医療改革を引き出した。かつて多変量解析は心理学の研究で用いられることが多く、日本の大学では文学部心理学科に統計学の講義があったりした。20世紀も終わりごろになって企業が製造過程において生産効率性をはかるスローガンとして統計誤差に注目するようなことがあった。

 僕は大学を卒業して数年ほどデータ統計をなりわいにしていた小さな会社に在職していたことがあった。大手企業のマーケティング部署が出してくるデータのアウトソーシング先みたいなところだった。僕自身は大学時代にいっさい統計学の授業をとったことがなく、統計については全く無知であった。それなのになんでこんな会社のこんな仕事にまわされたのかというと単にExcelが使えたからである。そんな時代であった。僕の仕事が、当時の日本のGDP向上にどのくらい貢献したのかはさっぱりわからないが、僕自身がここで統計というものを知ったのは役得ではあったと言えよう。

 ただ、そういう在野で身につけた知識の故、その中身はたいへんムラがあるものだった。なにしろ計算そのものはExcelのソフトウェアがしてくれるので我々は出てくるスコア表を見ればよい。出てくるスコアが信頼に足るものかどうかはP値なるものをみて0.05を下回っていればよいとか、そういうのは覚えたが、ではP値というのはいったい何者で、なぜ0.05を下回ればいいのかなんてことは二の次であった。そのくせクラスター分析とかコンジョイント分析とか手数だけはいろいろやってみて重宝されたが、これらの分析の計算過程はブラックボックスで、ただ出力されたスコアが信頼できるかどうかをマニュアルにしたがってチェックするだけだった。

 現場でいいかげんに身に着けたそのような統計学にプライドとコンプレックスがあったまま幾星霜、ここにきて統計ブームである。勤め先も立場も変わり、いまの自分の職務は必ずしも統計知識とは関係ないのだがなにしろ世間が追い風なので何かと会社はデータデータ言ってくる。実際に、膨大なビッグデータをぐるぐるまわして脚光を浴びる若手社員なんてのも出てくる。

 そうなってくると「俺だって若いころは統計やってたんだぜ」と言いたくなる欲求がムズムズわくが、これは老害以外のなにものでもない。ただ、ロートルのレッテルを貼られたままなのも癪である。

 ということで、統計検定を受検してみることにした。統計検定は1級・準1級・2級・3級・4級とある。統計の知識を問う資格については他にも姉妹的な検定がいくつかあるが、もっともスタンダードなのはこの統計検定だ。英検みたいなものである。
 その統計検定の中でも特に2級が目安とされていて、これをとっておくといちおう「この人は統計ができる」と市場価値として認められるとされる。

 というわけで統計検定2級にチャレンジしたのである。「昔やってたんだぜ」はウザいだけだが、「2級持ってるよ」ならば、もう少し人としてなめられなくて済むかもしれんなんて思ったのである。去年の夏頃の話だ。

 そしたら、ものの見事に玉砕した。もちろんぶっつけではなくて過去問なんかもぱらぱらみたのだが、合格点ラインが60点というのでまあなんとかなるだろうと油断したら、もう全然届いていないのである。

 というより、改めて考えると、齢50にもなってこの手のテストは本当に久しぶりなのである。これまでもいくつか資格試験や検定みたいなのものを受けたことはあったが、それらは基本的には「暗記」であった。まれに計算問題を課すものもあったがそれとて全出題のごく一部であって、なんならその問題は捨ててしまっても他で点がとれれば合格に影響しないものであった。

 しかし、統計なのだから当たり前なのだが、出題の大半が計算問題なのである。そんなテストを1時間半にわたって受ける。いまから30年以上前、大学受験以来なのではないか。その30年の間に、当方の脳みそは劣化し、集中力は続かず、出題文を読む目(試験会場ではパソコン画面で行う)は老眼でおぼつかず・・・

 

 「不合格」の画面がパソコン上にパンと出たときは絶望的な気分になったものの、それから心を入れ替えて本気で3か月ほど勉強してみた。過去問集や何冊かの参考書を相手にウンウンとやって年末に再受験したら、今度はギリギリの点数で合格した。これだけ真面目に一生懸命やったのだからもう少し点数はいくかと思ったのだが、本当にギリギリで、あと1問か2問ほど間違っていたら不合格というレベルだった。

 勉強の最後のほうは、統計知識を得るというよりは単に試験対策みたいになってしまい、このパターンの問題が出たらこのパターンの解答みたいな強引なスタイルになってしまっていた。そこで合格後に改めて手にしたのが本書なのである。

 

 

 ともあれ統計検定2級は合格したし、改めてこれを読めばもう一度情報も整理できて人前で「自分は統計ができる」と言ってしまって、なにか返り討ち的な質問をされてもまあ大丈夫かなと思ったのだが、意外にも本書を読み解くことは苦難だった。さんざん検定対策をして、そのうえで本書を読んだ上の感想だが、「10時間でざっとわかる」のは無理なんじゃないのだろうか。もちろん各章題である「分散」「t検定」「独立性の検定」「標準化」などがなんであるかはわかる。というか、それは本書を読む前から勉強していたのだから知っている。しかし、そこに書かれている解説がけっこう晦渋なのだ。自分が勉強したものはこれだったっけ、みたいな戸惑いを感じる。これ、統計学初見の人がよんでわかるのかなあ、などと思ってしまうのである。

 はやりの学問だけあって、書店にいくと「文系でもわかる統計」「中学生の知識でわかる統計」など、お手軽にマスターできそうな統計本が揃っている。暗記物がメインの資格検定はそういうショートカットもありそうだけど、本来が数式と厳密なロジックで成立している統計学はあまり近道がないのではないかと思う。
 と書くと、なんだか教訓と自慢みたいな繰り言で終始してしまうので、なんでそうなってしまうのかというのをさらに考えてみたい。今回のブログ、かなり長文になってしまった。

 

 統計学について学ぶのに一番いいのは、教師役の人と問答しながら双方向で確認しながら進めていくことではないかと、これは独学で参考書を読んだり問題集と解きながらずっと思っていたことではあった。扱うデータもビジネス現場などで扱っている実際のものであればなおよい。というのは結局のところ、統計学の学びの対象は、実際のデータと、どのような論理で成り立っているかという話と、そしてそれをもとにした数式がすべてだからである。

 だけれど、これを一方通行の文章だけで表現して読み手に伝える、というのは参考書の書き手にとってはかなり厄介な仕事なのではないかと思う。統計学の先生なんてのは、想像するに文系的な言語ボキャブラリーが豊富とも思えないし、数字と数式で成立する世界の解説をいちいち日本語の文章で説明するのは外国語の翻訳と同じで隔靴掻痒であろう。厳密に定義しなければならないものほどコトバがもつ冗長性が障害になる。統計学には「棄却する」とか「独立の元では」とか「信頼空間が」とか「自由度」とか変なコトバがいっぱい出てくるが、これも数学の世界によくある定義の厳密性を追求しようとしてこんなへんな日本語になる。業界内では通用しても部外者にはその意味するところはなかなかピンとこない。本書は「10時間でざっとわかる」シリーズの一環で、経済学とか社会学とかいろいろ出ている中の1冊だが、統計学でこの制約を要求された著者も気の毒ではある。

 つまり、統計学(おそらく数学全般に言える話だろうが)を解説書形式で説明するのは、書き手としても高度な技術を要するし、読み手がそれに対してこの文章はどういう意味か、このコトバは何かの質問も確認もできないという一方的読書体制で学ぶのはなかなか効率が悪いのだ。変に四角張った意味がはかりにくい文章と、わかりやすいけど書き手によってその説明の仕方がぜんぜん違ってしまう解説が混在するのが統計学の参考書なのである。要するに参考書だけの独学勉強方法はムリゲーと言ってもよい。

 というわけで、僕がやった勉強スタイルでは、年齢のことは棚に上げるとして、どうもここが限界な気がする。当初はあわよくば準1級でもねらうかとか思ったものだったが絶対ムリだ。高校生の我が娘には、大学に入ったら統計学の授業はとったほうがいいぞ、最前列に座って受けて質問は積極的にした方がいいぞ、と言う。いつもはうるさいなという顔しかしない娘だが、このときばかりは素直にそうだねとうなづいたのは、休日も悪戦苦闘しながら勉強したのに一度目は不合格、二度目になんとかぎりぎり合格した父親の後ろ姿を見たからではないか、と思うと、今回のチャレンジの最大の収穫はこれだったかとも思うのである。

 


この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« Z世代的価値観 | トップ | 生命海流 »