統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

ビジネスと統計(2)

2014-10-07 14:34:01 | 日記・エッセイ・コラム
全稿では、野菜価格(大根)の統計量要約でBoxPlot を示しました。大根の価格は平均値の上下で価格のバラツキが見られます(前稿:図1)。すなわち、
この様なバラツキのあるデータは正規分布と言えません。正規分布とは平均値を挟んでその上下でのバラツキが同じ様なデータを言います。正規分布であるかないかは、統計分析上とても大切な基本情報ですので、詳しくは下記URLを参照し覚えておいて欲しいと思います。
 やさしい医学統計手法

ビジネス現場でのほとんどのデータは正規分布と言えない場合が多いので、最近では(大標本の場合はとくに)BoxPlot で表現する事が多くなっています。それでは、
BoxPlot の作成の実際を MS-Excel(Excel 2010) で紹介します。
大根価格の場合:
 1.表1(緑色部分)を作成
 2.緑色部分を選択
 3.「挿入」→「その他のグラフ」→「株価チャート(始値・高値・安値・終値)」


Excel での BoxPlot 作成では表1の様に日付を1月1日などと適当に付け、「75%tile、75%tile+QR*1.5、25%tile-QR*1.5、25%tile」を当てはめ株価チャートを作成した後に、日付(1月1日)を大根に変更し、凡例を削除し、中央値を Boxの中に描画すれば BoxPlot になります。ただ、
BoxPlot の上下の縦線(ひげ)は適当に設定しても良いのですが、通常は、上ひげでは「75%tile+QR*1.5」に最も近い値(ここでは97を)、下ひげでは「25%tile-QR*1.5」の最も近い値(ここでは51)を用います。
最大値・最小値や標準偏差値にしたときは必ず明記しておきましょう。詳しくは、
情報統計研究所の「やさしい医学統計手法」を見て下さい。

さあ・・!
BoxPlot を積極的に使ってビジネスデータを要約して見ましょう。

次回に続く!

情報統計研究所はここから