パラメトリック検定とノンパラメトリック検定の違い


Charcot(@StudyCH)です。

研究初心者が学会で良くベテラン研究者たちから指摘を受けている項目に検定方法選択の誤りがあります。

そのなかでもパラメトリック検定を適用できないデータに使用したり、逆にパラメトリック検定を適用可能なのにノンパラメトリック検定を用いてたりする方が多い印象です。

ここではパラメトリック検定とノンパラメトリック検定とはどのような分類なのかをわかりやすく説明します。

そのデータは正規分布か?

パラメトリック検定は正規分布に従うデータに用いることできる検定です。正規分布では平均と分散がパラメータであり、これらを用いて検定するためパラメトリック検定と呼ばれています。

当然、平均と分散は比率あるいは間隔尺度のデータの代表値なので、これらのデータでにしかパラメトリック検定は適用できません(データの代表値と散布度について)。

いずれにせよ、パラメトリック検定を用いるか、ノンパラメトリック検定を用いるかを判断する最初のステップは母集団の分布が正規分布であるかどうかを見定めることにあります。

具体的には正規分布に従うかどうかについては、シャピロ・ウイルク検定 Shapiroo-Wilk test などを用いて検定することになります。

ノンパラメトリック検定は包括的

ノンパラメトリック検定は正規分布に従っていなくても使用できます

この検定は母集団分布が不明であることを前提に検定します。一方で、正規分布に従っていれば用いることができないかというとそうではなくて、正規分布に従っていたとしても、母集団分布が不明であることにして用いることができます。

ただし、本来なら対立仮説を採択するはずが帰無仮説を採択する可能性(これを第Ⅱ種の過誤という)が大きくなります。

例えば、作業療法介入の前後でADL能力に差があるか否かを知りたい場合、本来なら差があるところを「差があるとはいえない」と判定してしまう可能性があるということです。

パラメトリック検定とノンパメトリック検定の比較

どのような統計量、尺度水準、母集団分布の時に、パラメトリック検定とノンパラメトリック検定のどちらを用いるのかについて表にまとめました。


パラメトリック検定 ノンパラメトリック検定
対象とする統計量 平均値 代表値
分散 散布度
積率相関係数 関連性係数,順位相関係数

度数
尺度水準 間隔尺度,比例尺度 名義尺度,順序尺度
間隔尺度,比例尺度
母集団の分布型 正規分布を仮定
等分散性を仮定
不問
標本サイズ 少ないと検出力低下 不問

代表的な検定方法

代表的な検定方法についても表にまとめたので参考にして下さい。ノンパラメトリック検定であっても尺度水準によって使用できる検定が違うことに注意して下さい。


パラメトリック検定 ノンパラメトリック検定

比率・間隔尺度 名義尺度 順序尺度以上
適合度

χ2検定 χ2検定
1標本コルモゴロフ・スミルノフ検定
独立性 相関係数の検定 χ2検定
フイッシャーの正確確率検定
χ2検定
フイッシャーの正確確率検定
比率の差

χ2検定
フイッシャーの正確確率検定
マクネマー検定
コクランのQ検定
χ2検定
フイッシャーの正確確率検定
マクネマー検定
コクランのQ検定
母比率

二項検定 二項検定
対応のない2標本の代表値の差 平均値の差のt検定

マン・ホイットニーのU検定
2標本コルモゴロフ・スミルノフ検定
ファン・デル・ワーデン検定
中央値検定
対応のある2標本の代表値の差 平均値の差のt検定

符号検定
符号付順位和検定
対応のないK標本の代表値の差 一元配置分散分析

クラスカル・ウォリス検定
中央値検定
対応のあるK標本の代表値の差 乱塊法

フリードマンの検定

まとめ

手持ちのデータがパラメトリック検定とノンパラメトリック検定のどちらを用いるかを考えるとき、そのデータの尺度水準、母集団分布、そして標本の大きさ(数)を知ることが大切です。

端的に言えば、そのデータが十分に大きく尺度水準が比率・間隔尺度であれば母集団分布を確認して、正規分布にしたがっていればパラメトリック検定を選択します。そうでない場合はノンパラメトリック検定を選択します。

検定の種類は多岐にわたりますが、上記の表を参考にしてください。

それでは皆さまの研究がうまくいくことを願って。
Charcot(@StudyCH)でした。All the best。