Charcot(@StudyCH)です。
今回ご紹介するFisher(フィッシャー)の正確確率検定は、クロス集計表の検定の一つです。主にPearsonのカイ二乗検定が使えない場合に用いる検定方法で、ノンパラメトリックな手法に分類されます。ここではFisherの正確確率検定の特徴をわかりやすく説明します。
どんな時にこの検定を使うか
ある集団のある変数が出現する頻度に偏りがあるか知りたい時にFisher(フィッシャー)の正確確率検定を用います。通常、上記のようにある変数の出現する頻度の偏りを知りたい場合はPearsonのカイ二乗検定を選択します。しかし、クロス集計表で期待度数が5未満のセルが全てのセルに対して20%以上ある時はFisherの正確確率検定を使わなければなりません。
期待度数の計算
2×2のクロス集計表であれば簡単に期待度数を計算できます。例えば、下のような脳卒中患者の転帰先と性別のクロス集計表をもとに計算してみます。
自宅退院 | 自宅退院以外 | 合計(周辺度数) | |
男性 |
4
|
16
|
20
|
女性 |
5
|
8
|
13
|
合計(周辺度数) |
9
|
24
|
33
|
最小の期待度数は、列の合計値と行の合計値の最小値どうしをかけて、全ての合計値で割ることで求めることができます。つまり上の表では、(9×13)/33 = 3.8 となります。この場合、期待度数が5未満のセルが全セルの20%を上回っているので、Pearsonのカイ二乗検定ではなく、Fisherの正確確率検定を使う必要があります。
使用できるデータの尺度や分布
尺度水準が名義尺度のデータ(例外として段階数の少ない順序尺度のデータ)に用います。名義尺度のデータを用いるので分布は気にする必要はありません。つまり、この検定はノンパラメトリックな手法です。
検定結果の指標
統計結果の指標には「p値」を用います。95%信頼区間の場合は p < 0.05 で、99%信頼区間の場合は p < 0.01 で有意差があると判断できます。頻度の大小については「調整済み残差」で判断します。
実際の使用例(SPSSの使い方)
まとめ
Fisher(フィッシャー)の正確確率検定は、名義尺度のデータで、頻度の偏りを調べたい時に、かつPearsonのカイ二乗検定が使えない場合に用います。臨床研究では、極端に標本数が少ない場合にPearsonのカイ二乗検定の代わりに登場することが多い検定です。
その他の統計学的検定一覧
その他の統計学的検定一覧