統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

医学と統計(30)

2008-11-27 10:41:25 | 日記・エッセイ・コラム

情報統計研究所へのアクセスはここから。

前回はデータ記述の散布図表現について紹介しました。今回は数値要約の例を紹介したいと思います。データの代表値は「平均値±1標準偏差」(正規分布のときなど)、あるいは、中央値[25%タイル、75%タイル](非正規分布のときなど)を用いて表現します。前回、探索的データ分析では Box Plot で示すことが多くなったと言いましたが、数値記述でも5数要約である「最小値、下側ヒンジ、中央値、上側ヒンジ、最大値」で示すことが多く見受けられるようです。
Boxplots これは1つに統計ソフト(パッケージ)の普及によって、数値要約や図表要約が簡単に出来るようになったことと、もう1つは、正規母集団分布での推測統計から、母集団分布に拘わらないノンパラメトリックの積極的な使用が多くなったことが挙げられます。5数要約での下側ヒンジは第1四分位数、上側ヒンジは第3四分位数であり、下・上クオンタイル(quantile)と呼ばれ、そして、クオンタイルの確率がパーセント点(parcentile)です。