統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

医学と統計(7)

2007-04-30 11:25:49 | 日記・エッセイ・コラム

ISL_htm

 

統計データの分析や解析のご依頼は「情報統計研究所」にお問合せ下さい。

情報統計研究所(ISL)のご紹介

順序カテゴリーの分割表における傾向性の検定は、データの比率が一定の増減や増加の傾向が見られるものに適用すべきです。もう一つの事例(参考図書、Rによる医療統計学、岡田昌史監訳)を示しておきましょう。

効果[++, +, -]

P薬剤[29, 44, 78](19.21%,29.14%,51.66%)

A薬剤[41, 51, 62](26.62%,33.12%,40.26%)

ChiSq_trend=4.2443(df=1),p=0.03938(Significant)

この様に、分割表検定一つとっても統計手法の選択次第で全く異なった結果になってしまします。手法の選択に迷ったら情報統計研究所にメールしてみるのも良いかも知れません。情報統計研究所は依頼者と一緒に考え統計的問題の解決に尽力します。

もう一つ、例題(医薬統計解析マニュアル、斧田太公望)を示しておきましょう。

効果[著名改善、改善、やや改善、不変、悪化]

A薬剤[5,23,19,15,4]

B薬剤[4,14,26,21,1]

ここでは、Mann-Whitney U test を適用しますと、U 値=1931.5(p=0.2146)となり、A薬剤とB薬剤の効果には有意差が認められません。ちなみに、ここでは有意差を期待して検定を行ったのでしょうか? あるいは、差のないことを期待して検定したのでしょうか?

例えば、後発薬のように先発薬との有効性に差がないことを期待しての検定ならば、効果に差のないことを積極的に証明しなければなりません。ここでの検定で有意差がなかったからA薬剤とB薬剤の効果は同等であるとは言えません。通常の検定は帰無仮説が棄却できるかどうかを問うもので、これを positive trial と言っています。例えば、「容疑者=真犯人」として裁判中にアリバイが成立すれば無罪となるように、確率的に一定の有意水準を設定して有意差を決めている訳です。

検定で有意差がなかったから「同等である」とは言えません。では、積極的に「同等である」と言うにはどうすれば良いのでしょうか。この様な問題を negative trial と呼んでおり、検定ではあらかじめハンディキャップをつけて検定をスタートさせます。同等であれば、スタート時点でハンディを付けているのですから、ハンディの差のままゴールする筈です。先のMann-Whitney U test の例では10%の差をつけて検定しますと、U 値=3.0885(p<0.001) となって有意差が認められました。すなわち、10%以上劣ることはない同等性が認められたと言えます。


医学と統計(6)

2007-04-26 10:17:24 | 日記・エッセイ・コラム

ISL_htm

 

統計データの分析や解析のご依頼は「情報統計研究所」にお問合せ下さい。

情報統計研究所(ISL)のご紹介

情報統計研究所に寄せられる看護研究の多くはアンケート調査データです。アンケートの要約はグラフによる視覚的な表現が有効ですが、統計的検定や推定の問題も大切になります。所謂、出現度数の比率の差を検定するものです。看護研究に多いアンケート・データも多変量解析の対象となるものが多々あります。医学研究同様に主成分・因子分析を第1に考えてみては如何でしょう。

最近では共分散構造分析であるSEMやGMなどグラフィカル分析手法が気軽に使えるようになっています。共分散構造分析も主成分・因子分析や重回帰分析の延長線上にあると言えます。情報統計研究所を利用して多変量解析をもっと多用して欲しいものです。ところで、

L行×M列の分割表におけるカイ二乗検定で有意差が出れば有意差のある組み合わせを検討します。すなわち、2×M列であれば、どの行に有意差が有るかを調べる必要があります。ここでのカイ二乗検定は出現比率(度数)の差の検定ですが、もし、その比率(度数)に何らかのトレンド(傾向)があると順序カテゴリーの分割表として扱われます。順序カテゴリーとは「満足」「やや満足」「普通」「やや不満」「不満」などとか、「-」「+-」「+」「++」「+++」とか言った大きさや順序がある分割表にまとめられたものです。

ある日、情報統計研究所に次の様な2列×5行分割表(参考図書例題)の質問が寄せられました。

question[1,2,3,4,5]、male[5,15,35,30,15}、female[10,25,30,25,10]

(不満=1、やや不満=2、どちらでもない=3、やや満足=4、満足=5)

このデータを通常のカイ二乗検定を行うとChiSq=6.0058(df=4),p=0.1987 となり有意差がないと判断されます。しかし、このデータの出現率には単調な傾向(q1<q5)がありそうです。そこで、傾向性仮説の検定を行ってみると、

ChiSq_trend=4.9221(df=1),p=0.0265 で有意差が認められました。

ちなみに、SAS-JMPでは「順序ロジスティック回帰」で実行しますが、その結果はChiSq_JMP=4.8129(df=1),p=0.0282 となりました。この様に、平均値差よりも順序を伴った変化を調べるときは、ここでの傾向性の検定を適用すべきでしょう。


医学と統計(5)

2007-04-19 10:28:13 | 日記・エッセイ・コラム

ISL_htm

 

統計データの分析や解析のご依頼は「情報統計研究所」にお問合せ下さい。

情報統計研究所(ISL)のご紹介

インターネット検索で情報統計研究所(HP)にアクセスすると「Internet Computer Network Laboratory」となっています。名前の通りインターネットをコミュニケーションの手段としていますので、医学研究などのデータをメールなどで送っていただきます。データの多くは「エクセル形式」が多いのですが、ファイルメーカ形式やSPSS形式など研究現場で使っているフォーマット・データでも対応できます。

医師からのデータの多くは医学実験データが、看護研究ではアンケート・データが多く見受けられます。そして、医師の統計分析は検定や推定が多いのですが、多くのデータの特徴は多変量であることです。もともと多変量のデータですので一度、多変量解析でデータの全体像をみてはどうでしょう。主成分・因子分析はとても役立つ統計手法です。しかし、正直言って主成分・因子分析は医学であまり採用されていません。結局、馴染みの平均値差の検定や分割表形式の検定が多いのも現実です。

それでも、最近では「パラメトリック」だけでなく「ノンパラメトリック」が多用されるようになって来ました。Reviewerや査読者によるところが大きいと思われます。そう言えば、「mean±SD」だけでなく「median±%tile」の図示も多くなって来ました。商用統計ソフトの親切な機能のお陰でしょうか。また、3群以上の多重比較も常識となっていますが、その手法の選択ではかなりの混乱があるようです。

例えば、LSD法やDuncan法は特別な場合の除き使わない方が良いと思います。Tukey法やHolm法が無難ではないでしょうか。また、分割表によるカイ二乗検定ですが、商用統計ソフトを使えばFisher's exact test の結果が出てきます。情報統計研究所に「5」以下の度数にFisher's exact test を適用するのではないかとの問合せがあります。いったい、いくらの度数までパソコンで計算が可能なのかを確かめたことはないのですが、「20」程度ならまったく計算に問題はないようです。カイ二乗でのYateの補正ですが、「常に行うか行わないか」の問題があります。有名な統計ソフトでも「補正ありとなし」のものがあるようです。この問題の解決はもう少し時間が掛かりそうです。医学などの小標本では補正しておきましょうか?


医学と統計(4)

2007-04-05 11:13:12 | 日記・エッセイ・コラム

ISL_htm

 

統計データの分析や解析のご依頼は「情報統計研究所」にお問合せ下さい。

情報統計研究所(ISL)のご紹介

著名な商用統計ソフトは高価で、正直、個人でたまに使用する程度ではとても手が出ません。大学や企業での使用がほとんどだと思われます。個人で使用する場合、期限付きの試用版を使う手もあります。ほとんどの試用版は30日とか30回の使用限定ですので、覚えたころには使用期限切れとなります。学生だとアカデミック版を安く手に入れることも出来ますが、一般の個人は高価な商用ソフトを高嶺の花とあきらめるしかないのでしょうか。高値の花の魅力に垂涎するばかりです。しかし、

眼前の統計的問題の解決に迫られたとき、多くの人はインターネット検索で「情報統計研究所」を知るようです。特別な統計プログラムを必要としなければ1時間作業当たり¥1500 で統計分析結果を得ることが出来ます。簡単な統計分析から複雑で高度な統計分析まで、医学研究での統計的問題を一緒に考え解決するのが情報統計研究所です。

統計分析を業としてお金を取る業者呼ばわりには、何故か不快なのです。もし、医学の研究現場で統計的問題だけのために研究が足ふみしているのなら、ほんの少し統計分析のお手伝いするだけです。それでも、僅かであってもお金を頂けば業者に違いないのですが「業者、業者」と言われることに違和感があって仕方がありません。 業者呼ばわりにナジメナイ研究所です。

研究現場でのデータは貴重です。今、統計的に期待する結果が得られなくても統計技術の進歩や、研究での新たな発見で、あなたのそのデータは光を浴びるのですから・・・。


医学と統計(3)

2007-04-02 17:39:26 | 日記・エッセイ・コラム

ISL_htm

 

統計データの分析や解析のご依頼は「情報統計研究所」にお問合せ下さい。

情報統計研究所(ISL)のご紹介

情報統計研究所で使っている統計ソフトは何ですか・・、Stat View ですか? などと聞かれます。いいえ・・、「R」ですと答えますと、怪訝な困ったような表情をします。医学統計の分野ではあまり「R」は知られていないようです。情報統計研究所では、その時々で統計ソフト使い分けています。しかし、「R」や「S」は統計分析で欠かせないツールです。「R」はすべて英語ですので、統計の初心者にはとっつき難いかも知れません。しかし、多少の統計学の知識で十分に理解できます。全世界に蓄積された「R」ライブラリーが無償で使えるだけでなく、次々と新しいライブラリーや、問題点が世界中の統計学者やSAによって公開されます。

「R」以外にも対話型の商用統計ソフトも使います。「S-Plus」や「JMP」ですが、「S-Plus」は「S」言語の対話型ですが「S」のプログラムをほぼそのまま「R」で使用することも出来ます。SPSSも有名なソフトですが「S-Plus」か「JMP」があればSPSSを使う機会はあまりありません。しかし、共分散構造分析で有名なAMOSがSPSSとなったので、これに関してはSPSSの使い勝手が良いと言わざるを得ません。20年前だったら、まだFORTRANやBASICの統計ソフトが手軽に使われていました。これらの膨大な財産があったから、そして、PCの発展と普及で、今では何処でも誰でも簡単に統計ソフトを使える様になったと思います。

商用統計ソフトでは用意されたデータテーブルにデータを入力すれば、簡単に統計結果や図表が出力される様になったなっています。それでも統計は難しいと言われます。書店ではやたら「すぐわかる・・・」とか「本当にやさしい・・・」とか「誰でもわかる・・・」とか言った統計の本が沢山並んでいます。どれも、良く似た内容であり「SPSSによる・・・」とか「エクセルによる・・・」とか「JMPによる・・・」とか言った商用統計ソフトの使い方を解説した本も沢山並んでいます。

それでも、情報統計研究所には統計的問題の相談が寄せられます。