ついに統計の勉強を始めた・・・。いまさら?!と思われてしまうが、ずっと後手に回っていたのは事実。SPSSソフトを使いこなせるようになるのが目標!まずは用語からまとてみました。
統計基礎用語
・統計のものさし(尺度)
・量的データ(数的データ):身長・体重など数字で表される
・間隔尺度:「血圧」、「温度」といった数値化して評価する基準。足し算や引き算が可
・比尺度:「体重」といった数値化して評価する基準
足し算・引き算・割り算・かけ算が可
・質的データ:趣味、血液型など数字で表せない
・質的データは2つある
・名義尺度データ:「男性と女性」、「血液型」に代表される優劣といったものではなく、順序がないもののこと
・順序尺度データ:「薬の効果」、「患者満足度」のように順序があるもののこと
・母集団と標本
・全対象:母集団 実際に検証した全体の一部:標本
・母集団から標本を取り出すことをサンプリングという
・サンプリングが重要:母集団と同じ構成割合の標本を抽出する(サンプリング)事が出来て始めて母集団に当てはめること が出来る。
・標本が偏ってしまい目標とする母集団を忠実に反映していないことをバイアスという。
・大規模臨床試験とは?
一般的には数千人を対象にしている
ただ推定される母集団の大きさにも反映される。
患者が1億人のうちの4000人と患者が1万人のうちの1000人であれば後者が大規模臨床試験と言える
・分布の型と代表値
・平均値:全てのデータを足してそのデータ数で割ったもの
・最頻値:もっとも頻繁に出てくる値
膨大なデータにはばらつきがある。社内の男性の平均身長を求める際に1人でも2m級がいれば平均値は引きずられて高く なる。
・データのばらつきを示す代表値が標準偏差(SD)
・正規分布:数的データは釣り鐘型になる
・標準偏差(SD)
・データのばらつきのこと、言うなれば平均値からの距離をデータ数で割ったもの。
・実際
Aさん70点 Bさん25点 Cさん60点 Dさん15点 Eさん80点 Fさん45点 Gさん55点
平均点:50点
偏差:(50-70)+(50-25)+(50-60)+(50-15)+(50-80)+(50-45)+(50 -55)=0
よって偏差(分散)は差を2乗して足すことで絶対値として扱う。この場合、3300となり、7で割ると、471.4 2・・・となる。
さらにルート計算して21.71・・・が標準偏差となる。
・正規分布の見方
・正規分布は標準偏差、つまりデータのばらつきをビジュアル化したもの
・正規分布では平均値を中心にして存在する標準偏差の間にどれだけデータが存在するか決まっている
プラスマイナス1SDの中には68%のデータが入る
プラスマイナス2SDの中には95%のデータが入る
研究をデザインする
・帰無仮説と対立仮説
・否定されるべき仮説が帰無仮説で本来証明したい仮説が対立仮説という。
・ある物事を証明するにあたり、否定する方が簡単!ということが一般的に知られているから。
・帰無仮説が正しいという可能性が5%未満であれば誤差と判断しこの帰無仮説は真実ではないと判断できる。
・ばらつきとバイアス
・ばらつきは小さいに越した事は無いが、根本的な問題にはならない
・選択バイアス:標本を選択する際に生じるバイアス:ランダム化する際に注意
・観察者バイアス:自分がたてた仮説が有利な結果でがでるように不利なデータを除外することでおこるバイアス:盲検の際 に注意
・一重盲検:医師知っているが患者は知らない
・二重盲検:医師も患者も知らない
・エンドポント
・仮説を検証するための評価指標
・その他サロゲートエンドポイント:代用のエンドポント
ツゥルーエンドポント:真のエンドポイント
例:骨粗鬆症で骨折率をエンドポイントにおくようなエンドポイントはおけない(骨折するのを待つことは試験として組み にくい)
その際代用として骨密度をエンドポイントにおく。この場合に骨折率はツゥルーエンドポント、骨密度はサロゲートエ ンドポイント。
・検定
・帰無仮説を否定するための方法の事
・標本から得られたデータを母集団に適応した際にどうなるかと推論する事
・その結果が5%以下であれば100回同じ試験をして95回は差が出るということで、偶然ではないと判断できる
つまり統計的に有意であったと言える(有意とは意味が有るということであって優位、つまり優れている問う訳でな い!)
臨床研究デザインの分類
・症例報告(case report):健康茶を飲んでやせた人がいた。
・症例蓄積(case series):健康茶を飲んだ人15人の中で、5人はやせた。7人は変わらず。3人は太った。
・観察研究と介入研究
・観察研究:患者には手を加えない、ただ観察するだけ;横断研究、症例対照研究、コホート研究
仮説を形成することに重きをおいている!
・介入研究:患者に薬を飲ませたり、運動させたり何らかの介入を加える研究:クロスオーバー研究、ランダム化比較試験
・横断研究
・現在の日本国民の平均BMIを調べたいとき、などに使用される。(国勢調査など)
・時間経過を伴わず、現時点のデータを収集するためのもの。
・仮説の検証には不向き、バイアスがかかりやすい
・症例対照研究:ケースコントロール研究 まれな疾患に使用しやすい
・時間経過を考慮できる観察研究の一種
・現時点から過去に向かってデータを探る
例 喫煙者は肺癌になりやすいという仮説
肺癌の人:症例(ケース)
肺癌でない人:対照(コントロール)
それぞれでさらに喫煙者と非喫煙者の割合を調査し比較する
・バイアスが生じやすい:非肺癌患者の選定の際に非喫煙者ばかりで構成されるとか
・過去のカルテに頼ざるを得ないため記載が無ければ正確な調査が出来なくなる
・現時点では原因が不明の疾患の原因を探るさいに有用
・コホート研究
・ランダムに抽出されたある個体群(制限を加えない)を追跡調査していく観察研究
・現時点から未来に向かって調査を進める
・広範な情報を詳細に集める事ができる研究:ある因子が病期のリスクファクターかどうかを見いだす
・バイアスが少ない
・コストが高い、長期間であり脱落が多い、罹患の確認が難しい、など問題あり
・クロスオーバー研究
・患者内比較をベースにした介入研究
・1人の患者内で2つの介入を比較でき、標本数が少なくて済むというメリットがある
・非常に長い半減期を持つ薬剤では患者内比較を主とするクロスオーバー研究では、持ち越し効果が無いように十分な期間を空ける必要がある。
・効果が永続的なものは比較が出来ない
・新薬の第1相比較試験で用いられる
・ランダム化比較試験
・患者間比較をベースにした介入研究
・被験者をランダムに選ぶランダム抽出(random sampling)とその選んでりた被験者を介入群と対照群にランダムに振り 分けるランダム割付(random allocation)
・選択バイアスを除外できる
・倫理的問題で行う際に十分な注意が必要
・メタアナリシス
・複数の研究結果を統合して、1つの結果を出す
・エビデンスレベルは一番信頼性が高い