Mann-WhitneyのU検定


Charcot(@StudyCH)です。今回ご紹介するMann-Whitney(マン・ホイットニー)のU検定は中心分布の差を検定するノンパラメトリックな手法です。この検定は、パラメトリックな手法である2標本t検定(対応のないt検定)を使うことができないデータに対して選択することになります。この記事ではMann-WhitneyのU検定の特徴をSPSSを使った実践例も含めてわかりやすく説明します。

どんな時にこの検定を使うか

2つの集団の変数を比較したい場合で、正規分布に従ってない時はMann-Whitney(マン・ホイットニー)のU検定を用います。

例えば、運動指導した集団(介入群)と運動指導しなかった群(対照群)の2ヶ月後の運動習慣のアンケートを行なったデータがあって、それぞれの得点の中央値を比較したい時に使います。このように比較対象が違う集団であるところがこの検定のポイントです。

使用できるデータの尺度や分布

正規分布に従わず、尺度水準が比率尺度、間隔尺度および順序尺度のデータを用いることができます。2群間の大きさ(人数)が同程度でなければならず、あまり数が少ないと適用することができません(目安として10例以下)。

もしデータが正規分布に従う場合は、パラメトリック検定である「2標本t検定」を使うことになります。正規分布に従うデータをノンパラメトリックな手法で検定することも可能ですが、いくつか問題がありますので正規性の検定を怠らないようにして下さい。

検定結果の指標

検定結果の指標は値を用います。95%信頼区間の場合は p < 0.05 で、99%信頼区間の場合は p < 0.01 で有意差があると判断できます。

実際の使用例(SPSSの使い方)

模擬データを使ってSPSSによるMann-Whitney(マン・ホイットニー)のU検定を実践してみましょう。B地区の高齢者に運動指導を行なった群と、運動指導を行わなかった群の2ヶ月後の運動習慣のアンケートを行なったデータが手元にあるとします。

アンケートは「毎日運動する=1、週4回以上運動する=2、週2〜3回運動する=3、週1回運動する=4、全く運動しない=5」という5段階で得点化しました。両群のアンケート得点の中央値に差があるかを検定してみます。

この例では帰無仮説と対立仮説を以下のように設定します。

帰無仮説 (H0) :運動指導群の中心分布 = 非運動指導群の中心分布
対立仮説 (H1) :運動指導群の中心分布 ≠ 非運動指導群の中心分布

  1. データをSPSSに読み込みます。この時、2群のデータを2列に並べるのではなく、介入の有無の列を作り、対応する体重の値を入れます(下図)。


  2. メニューの「分析 → ノンパラメトリック検定→ (SPSSバージョンが新しい場合は過去のダイアログ)→2個の独立サンプルの検定 (2)…」を選択します(下図)。


  3. 「アンケート得点」を検定変数に、「運動指導の有無」をグループ化変数に移動させます(下図①)。
  4. グループの定義をクリックすると「グループの定義」ダイアログが出現します。グループの変数を入力して下さい。今回のデータでは運動指導ありを「1」、食事指導なしを「0」と割り振ったので、0と1を入力します(下図②)。
  5. 「続行」で「グループの定義」ダイアログを閉じたら,オプションをクリックして「オプション」ダイアログを開きます。必要に応じて記述等軽量にチェックして下さい(下図③)。
  6. 続行」で「オプション」ダイアログを閉じたら、「OK」ボタンを押せば検定が開始します。


  7. 結果のダイアログがでたら、「漸近有意確率(両側)」で、p < 0.05(あるいは < 0.01)を満たしているかを確認します。


今回の結果だと「.826」とでたので p < 0.05 を満たしていません。帰無仮説を棄却することができなかったため、運動指導介入の有無で運動習慣アンケート結果の中央値の間に有意な差があるとはいえないと結論できます。

まとめ

Mann-Whitney(マン・ホイットニー)のU検定は、正規分布に従っておらず、比較対象が異なる集団であれば用いることができます。臨床研究デザインでいえば,ランダム化比較試験準ランダム化比較試験などで多く使われる検定方法です。

実は正規分布に従うデータにおいても用いることができますが、その場合、第2種の過誤が生じる可能性があるので注意が必要です(詳しくは「パラメトリック検定とノンパラメトリック検定の違い」を参照して下さい)。

その他の統計学的検定一覧