最近 ビッグデータ という言葉を よく聞きますね、統計数値が新聞等で報道が多くなりました。報道の中に必ず調査した方法が前提で発表されています。例えば「選挙:出口調査で ○○は当選確実」という前置きがされています。聞き手は「出口調査?最後まで油断できないね」と思うでしょう。
統計学でこれに似た考えがあることに気が付きました。例えば私の道路の通行調査で見ると「三ノ宮方面行きの 標準偏差が27台」とレポートを作成させて頂きましたが、調査がどのような方法で実施したのか 明確に 母(母集団) と 子(標本) 区別説明が大切と思っているのです。
よって 今回の調査の数値には 変更はなく 事実ではありますが 先週の統計数値は 12時間の調査サンプルではなく、6時間の調査をした結果を告知しています。
つまり「母集団」は12時間であるが 実際調査した時間は1時間実施して1時間休憩を行い実質6時間調査をしているのです。 これを6時間の「標本」といいます。調査した数値は標本から得たデータです。
統計学では 母集団の 一部を調査分析することで 全体を推測することとなっています。これを推測統計と言われています。
添付資料の文中において 「発生率と生起率」という文語がありますが 発生率は過去のものに使う が 生起率は未来に使う 確率をいうそうです。(情報学)
時々「統計はインチキであてにならない」と声を聴きますが これも調査者が丁寧な調査方法を明確にしていないことが原因ではと気が付きました。別紙を 再度ご覧くださいますようお願いします。