Shapiro-Wilk検定(正規性の検定)


Charcot(@StudyCH)です。今回ご紹介するShapiro-Wilk(シャピロ-ウィルク)検定は、正規性の検定の一つで、データが正規分布しているかを判断するために用います。ここではShapiro-Wilk検定の特徴をSPSSを使った実践例も含めてわかりやすく説明します。

どんな時に使うか

ある変数が正規分布しているか否かを知りたい時にShapiro-Wilk(シャピロ-ウィルク)検定を使います。ある変数が正規分布しているか(正規性)は、ヒストグラムを描いて釣鐘状の分布が得られるかを観察することでも判断できます(下図)。


上のヒストグラムはある施設に勤務する男性職員の身長のデータです。中央が盛り上がった、釣鐘状の形をしています。これで正規分布していることは分かるのですが、もしヒストグラムを描いて判断できない場合にこの正規性の検定を行います。

使用できる尺度や分布

尺度水準が比率か間隔尺度(例外的に項目数の多い順序尺度)のデータを使用します。分布はこの検定で確かめるので、不明で大丈夫です。

検定結果の指標

統計結果の指標には値を用います。95%信頼区間の場合は p < 0.05 で、99%信頼区間の場合は p < 0.01 で統計的有意だと判断できます。

実際の使用例(SPSSの使い方)

実際のSPSSによる解析方法を模擬データを使って説明します。今回は、ある施設に勤務する男性職員の身長のデータが手元にあるとします。このデータは上のヒストグラムと同じデータです。このデータが正規分布しているか否かを実際に検定してみましょう。

この例では帰無仮説と対立仮説を以下のように設定します。

帰無仮説 (H0) :データが正規分布に従う
対立仮説 (H1) :データが正規分布に従わない

  1. データをSPSSに読み込みます。
  2. メニューの「分析 → 記述統計 (E) → 探索的 (E)…」を選択します(下図)。


  3. 「身長」を「↪」で「従属変数 (D)」に移動させます(下図①)。
  4. 「作図 (T)...」をクリックすると、「作図」ダイアログがでてきますので、「正規性の検定とプロット (O)」にチェックをつけて下さい(下図②)。
  5. 「続行」で「作図」ダイアログを閉じたら(下図③)、「OK」ボタンを押せば検定が開始されます(下図④)。


  6. 結果のダイアログがでたら「Shapiro-Wilk」の「有意確率」をみて、 p < 0.05(あるいは < 0.01)を満たしているかを確認します(下図)。



今回の結果では、「有意確率」は「.059」なので帰無仮説が採択されました。このデータは正規分布に従わないとはいえない、つまり正規分布に従うと判断できました。

少しややこしいのですが、p < 0.05 であった場合は「正規分布に従わない」、p ≧ 0.05 であった場合は「正規分布に従う」となるので間違わないようにして下さい。

まとめ

Shapiro-Wilk(シャピロ-ウィルク)検定は、比率や間隔尺度のデータが正規分布に従っているか否かを知りたい時に用いる正規性検定の一つです。そのデータが正規分布に従っているかどうかで、パラメトリックな手法かノンパラメトリックな手法のどちらを用いるかが決まります(詳しくは「パラメトリック検定とノンパラメトリック検定の違い」を参照して下さい)。

その他の統計学的検定一覧