統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

統計のコツのこつ(44)

2017-05-19 10:59:08 | 日記・エッセイ・コラム
杉本典夫 先生から大変参考になるコメントを頂きましたのでご紹介させて頂きます。
 
コメント要旨:
2×2分割表には色々な手法を適用できるため、統計学解説書等ではそれらの手法が体系的に整理されていない傾向があると思います。例えば2×2分割表の場合は次のようになります。
2種類の2分類化された計量尺度項目の相関性を検討したい時。
 
今回の話題であるピポットテーブルのように、
2種類の計量尺度項目を境界値で2分類にした時、2つの項目の間にどの程度の相関性があるかを検討したい場合です。
 
・研究デザイン:横断的研究
・評価指標:四分点相関係数=φ(ファイ)係数
・検定手法:四分点相関係数の検定=Mantel-Haenszelの検定
・推定手法:Fisherのz変換を利用した相関係数の区間推定
 
χ2乗検定は本来は連関係数の検定ですが、これに連続修正(Yatesの修正)を施すと、出現率の正規近似検定と同じものになります。そのため検定対象の評価指標の種類によって、連続修正を施すか施さないかを使い分けると良いと思います。
 
SASやSPSSやJMPやRでは、通常は出現率の区間推定に連続修正を施しません。
 
しかし
連続修正は超幾何分布を正規分布でより正確に近似するためのものですから、区間推定でも施す必要があります。
出現率が低い時は、2つの項目の関係が直線ではなく指数関係に近くなります。
そのため出現率の差の代わりに、リスク比とその検定と推定を用いる時があります。
リスク比を対数変換すると、対数変換した出現率の差つまり対数リスク差になります。
そのためリスク比の検定と推定は、対数変換した出現率の差を正規近似して検定と推定を行っていることに相当します。
 
 
 
 

統計のコツのこつ(43)

2017-05-10 13:29:08 | 日記・エッセイ・コラム
前回の例題「Excel_Sample(1).xlsx」について、ピボットテーブルを「R」で作って見ましょう。
インターラクティブ(ブラウザ上で操作)でピボットテーブルを作成できる便利なツールです(筆者おススメ)。
それでは、前回と同様に「情報統計研究所」のホームページ(Top)から、「Excel_Sample(1).xlsx」をダウンロードして使用しましょう。
 
「R」の実行
***
dat<- read.delim("clipboard", header=T)
 # 前回と同様にして取り込みます
head(dat) # データの確認
 
 # 事前に "rpivotTable" をインストールしておいて下さい。
library(rpivotTable) 
 
  # Age(年齢)とTG(中性脂肪)で試してみましょう。
rpivotTable(dat, row = "Gender", col = "TG") # たったこの一行でOKです。
***
 
実行結果:
 
図1:Age と TG のピボットテーブル
 
 図1の[Count]を変えてみましょう。
 ・[Count as Fraction of Total]      →全体の%
 ・[Count as Fraction of Rows ]     →行  の%
 ・[Count as Fraction of Columuns]→列  の%
 
また、
図1の[Table]を変えてみましょう。
 ・[Horizontal Bar Chart]      :ヨコ棒
   ・[Horizontal Stached Bar Cart]    :積み重ねヨコ棒
 ・[Bar Chart]            :タテ棒
 ・[Stacked Bar Chart]       :積み重ねタテ棒
 
その他にも、
 [Line Chart]や[Area Chart]などがあります。
 
また、
変数も自由に変えられます。
「Age」を「Gender」に変えてみましょう。
 
灰色エリアの「Gender」をクリック保持し、青色エリアに移動させ「Age」を灰色エリアに戻せば
図2のテーブルが得られます。
 
図2:Gender と TG のピボットテーブル
 
如何でしょう・・・、Excelのピボットテーブルより使いやすいかも知れませんね・・・!?
 
情報統計研究所はここから!