asano.net

読んだ本の感想と旅行の日記を書いていきます。
後、その他なんかあれば・・・

161冊目:「統計学が最強の学問である」

2017-12-29 20:05:57 | 
総評:★★★☆☆ 難しいが、新たな知識になった
面白い度:★★☆☆☆ そこまで面白いという訳ではない
読みやすい度:★★☆☆☆ よく分からない所も多数
ためになる度:★★★★☆ ためになる情報はそれなりにあった
また読みたい度:★★☆☆☆ 重要な所は復習のために読み直すかも



なにやら人気のある統計学の本。
面白そうと思って買ってみた。

内容としては、統計学とはどういう学問だよっていうことというのが書いてあった。
あとはA/B分析やランダムか比較実験など、いろいろな分析手法を知ることができた。

そんなんで分かったことというのが、統計学は基本的には回帰分析がベースにあるということだった。
あと最近いろいろ騒がれているビッグデータというのは統計解析をすることだというのが分かった。
あとは分析するデータは基本的にサンプリング抽出をして母数からある程度のデータを抜き出して分析すれば十分ということが分かった。
回帰分析では、統計解析された結果に対して、標準偏差の値がp値という名前で計算されるが、このp値の読み取り方が分かると、統計情報がもっとよく読み取れることが分かったので、今後はp値の読み取り方について、もうちょっと理解を深めようと思った。

そんなんで、統計学の重要性とその知識を学ぶことができて、なかなか有益な本であった。


最後にまたためになると思った箇所を抜粋する。

・望むと望まざるとにかかわらず、ほとんどすべての学問に関わる学者は統計学を使わざるを得ない時代がすでに訪れているし、統計リテラシーさえあれば、自分の経験を勘以上の何かを自分の人生に活かすことがずいぶんと簡単になる。
 統計リテラシーは、世界トップレベルの学者が長年の研究の結果明らかにした真実に直接アクセスすることを可能にする。この力があるかどうかでみなさんの人生が大きく変わることは間違いない。

・だが一通りの業務がIT化されてしまうと、ITがらみのビジネスは行き詰まってしまう。いくらハードウェアやソフトウェアの処理性能が向上しても、これ以上はIT化すべき業務プロセスはないし、顧客が特に性能に不満を持たなければ、商品を売り込むことはできない。だから、ハードウェアメーカーも、ソフトウェアメーカーも、それらを使ってITのサービスを提供しようとする者も、ITに関わる企業はすべて、すでに満足している顧客に、十分すぎる性能を持った新しい技術を売り込む「理由」が必要なのである。
 ポジティブな建前としては、この十分すぎる性能を使って「いかに価値を産み出すか」という考え方が必要になる。またネガティブな本音としては「価値を生み出そうがなんだろうが、大量の処理が必要になる使い道」を提案しなければならないし、それを売り込むためには「一見ビジネスの役に立ちそうなお題目」が必要にもなる。
 どんな大量のデータでも、どんな計算でもできる技術ができた今、何を計算すべきかと考えると、統計解析以外にはあり得ない。そしてもし「統計解析」という地味な言葉がお題目として魅力的でないのならば、「ビッグデータ」とか「ビジネスインテリジェンス」といった流行り言葉を生み出せばいいのだ。おそらく今、こうした流行り言葉と統計学への注目が高まっているのは、そういう理由ではないのかと私は思う。

・データ分析において必要なのは、「果たしてその解析はかけたコスト以上の利益を自社にもたらすような判断につながるのだろうか?」という視点だ。
 顧客の性別や年代、居住地域の構成を見ると何%ずつでした、あるいはアンケートの回答結果を見ると「とてもそう思う」と答えた人が何%いました、といったデータの集計を「解析結果」として示されることはしばしばある。コンサルタントだとか、マーケターだとか名乗る人々の中にも、適当なアンケートをとってキレイな集計グラフを作ることのみを生業にしているんじゃないかという人すらいる。
 だが、果たしてこれらの結果に「何となく現状を把握した気になる」という以上の意味はあるだろうか?その結果を報告したあなたの上司やクライアントは、「ふ〜ん」という以上に何かリアクションのしようがあるだろうか?
 「ふ〜ん」以上のリアクションをするとは、すなわち、「ビジネスにおける具体的な行動に繋がる」ということである。そしてそうした具体的な行動を引き出すためには、少なくとも以下の「3つの問い」に対して答えられなければいけない。

 【問1】何かの要因が変化すれば利益は向上するのか?
 【問2】そうした変化を起こすような行動は実際に可能なのか?
 【問3】変化を起こす行動が可能だとしてそのコストは利益を上回るのか?

 この3つの問いに答えられた時点ではじめて「行動を起こすことで利益を向上させる」という見通しが立つのであり、そうでなければわざわざ統計解析に従って新たなアクションを取ろうとする意味はない。

・「適切な比較を行うこと」、そして「ただの集計ではなくその誤差とp値についても明らかにすること」。この2点を意識しさえすれば、経験と勘を超えて裏ワザを見つけることが容易になる。
 だがこの2点を理解したつもりで、いざデータを分析しようとしたときにしばしば問題になるのは、「適切な比較」とは何か、あるいはもう少し具体的に言えば「いったい何と何を比較すればよいのか」という点である。
 ここまで、よくある典型的な事例として、「購買金額」や「購買率」といった売上に直結する指標をさまざまな切り口で比較してみたら、という話をした。だが、ビジジネスにおいて比較すべき情報は売上だけに限った話ではない。
 統計学をある程度マスターすれば「どのようにデータを解析するか」ということはわかる。だが、実際に研究や調査をしようとすれば、「どのようなデータを収集し解析するか」という点の方が重要になる。これはしばしば統計かのセンスという言葉で片付けられることも多いが、もう少し噛み砕いて考えれば誰でもこのセンスを身につけることができるのだ。

・回帰分析を使うための基礎用語
 -回帰係数の推定値:切片・傾き(x)ともにデータから算出された値がだがあくまでデータに基づき「真値」を推定した結果だということに注意。
 -標準誤差:推定値の誤差の大きさ。回帰係数の推定値と比べて大きければあまり推定値は信頼できないが、この値自体を問題にするよりは後述の信頼区間で考えた方がいい
 -95%信頼区間:「回帰係数が0」の場合だけでなくさまざまな回帰係数を想定して、「p値が5%以下になる真値としてあり得ない値」とはならない範囲。「ほぼこの範囲内に真値があると考えて間違いない」と考えて大丈夫。
 -p値:仮に回帰係数が0立った場合にデータのバラつきのせいだけでこれぐらいの回帰係数が推定されてしまう確率。やはり5%を下回ると「さすがに回帰係数0と考えるのはキビシイ」と判断される。

その他ほかにも重要な内容があったのだが、ちょっと表とかないと理解できないところもあったのでここでは割愛する。

そんなんで、結構難しかったけど、新たな発見もそれなりにあった本でした。以上☆
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする