Charcot(@StudyCH)です。
今回ご紹介する一元配置分散分析(One-way ANOVA)は分散分析の一つです。分散分析とは3つ以上の標本(または変数)の平均の差を検定する手法で,パラメトリックな手法に分類されます。ここでは1元配置分散分析の特徴をSPSSを使った実践例も含めてわかりやすく説明します。
どんな時にこの検定を使うか
要因が1で水準が3つ以上の時に、水準間である変数の平均の差を知りたい場合に1元配置分散分析を行います。例えば標本を脳梗塞の初発、2回目、3回目で分けたとすると「脳梗塞の発症回数」が「要因」になります。また、「初発,2回目,3回目」の各項目が「水準」となります。
この例の場合、水準の数は3つなので、脳梗塞の発症回数が初発、2回目、3回目の人たちの間で、発症時年齢に差があるかどうかを知りたい時には1元配置分散分析を使って水準間のいずれかに差があるかを検定します。
使用できるデータの尺度や分布
正規分布に従い、尺度水準が比率尺度,間隔尺度(例外として段階数の多い順序尺度)のデータを用いることができます。3つ以上の水準(標本)のデータが適用となります。
もし、正規分布に従わないデータであればノンパラメトリック検定であるKruskal-Wallis検定を使うことになるので注意して下さい。
もし、正規分布に従わないデータであればノンパラメトリック検定であるKruskal-Wallis検定を使うことになるので注意して下さい。
t検定の繰り返しはNG
3水準以上ある変数に対して、各水準間にt検定を行うことはできません。例えば、A、B、Cの3つの水準があったとして、AとBの差、BとCの差、AとCの差をt検定で確認するのはNGだということです。AとB、BとCおよびAとCの時にもt検定では95%有意水準で検定しているため、5%ずつの判定の誤り(第Ⅰ種の過誤)が生じます。つまり、有意水準95%で3回t検定を行うと、0.95 × 0.95 × 0.95 = 0.857375 となり、1 - 0.857375 = 0.142625で、有意水準は約86%まで下がり、判定の誤りの確率は約14.3%まで上がってしまうことになります。このような検定を繰り返すことによる問題を「検定の多重性の問題」と呼びます。
検定結果の指標
検定結果の指標はp 値を用います。95%信頼区間の場合は p < 0.05 で、99%信頼区間の場合は p < 0.01 で有意差があると判断できます。分散分析の場合は、有意差があることを主効果が有意であったと表現します。
実際の使用例(SPSSの使い方)
模擬データを使ってSPSSによる一元配置分散分析を実践してみましょう。H病院に入院中の脳卒中患者の発症回数と発症年齢データが手元にあるとします。発症回数は初発、2回目、3回目の3水準です。水準間で発症年齢に差があるかを実際に検定してみます。
この例では帰無仮説と対立仮説を以下のように設定します。
帰無仮説 (H0) :初発の年齢平均 = 2回目の年齢平均 = 3回目の年齢平均
対立仮説 (H1) :H0が成り立たないとき
- データをSPSSに読み込みます。この時、3群のデータを2列に並べるのではなく、発症回数の列を作り、次の列に対応する発症年齢の値を入れます(下図)。
- メニューの「分析 → 平均の比較 (M) → 一元配置分散分析 (O)…」を選択します(下図)。
- 「発症時年齢」を従属変数リスト (E) に、「発症回数」を因子に「↪」で移動させます(下図①)。
- 「オプション (O)」をクリックすると「オプション」ダイアログが出現します。「記述統計量 (D)」、「等分散性の検定 (H)」、「Welch (W)」にチェックを入れて下さい(下図②)。
- 「続行」で「オプション」ダイアログを閉じたら(下図③)、「その後の検定 (H)」ををクリックして「その後の多重比較」ダイアログを開きます。とりあえずここでは「Tukey (T)」と「Games-Howell」にチェックを入れておきます(下図④)。
- 「続行」で「その後の多重比較」ダイアログを閉じたら(下図⑤)、「OK」ボタンを押せば検定が開始します(下図⑥)。
- 結果のダイアログがでたら、まずは「等分散性の検定」で「有意確率」が p < 0.05を満たしているかを確認します。もし、0.05以上なら等分散しているため、一元配置分散分析の結果をみます。一方で0.05未満であれば等分散していないため、Welchの検定の結果をみます(下図①)。
- 分散分析、Welchの検定いずれの検定でも「有意確率」をみてp < 0.05を満たしているかを確認します(下図②,③)。「有意確率」がp < 0.05であれば、水準間のどこかに有意な差があると判断できます。
- 次に多重比較検定の結果をみます。上記の等分散性検定で等分散していればTuky HSD、等分散していなければGames-Howellの「有意確率」をみてそれぞれの水準間でp < 0.05を満たしているかを確認します(下図)。
今回の結果では等分散性の検定の有意確率が「.432」で等分散していましたので、分散分析の結果をみることになります。分散分析の有意確率は「.859」でp < 0.05を満たしていないため、帰無仮説が採択されました。したがって、発症回数(水準)間の年齢に主効果はないと結論できます。
もし、一元配置分散分析で有意な差が認められても「3つの水準間のいずれかに有意差がある」ということまでしか分からないので、水準毎の差を比較したい場合は事後検定として多重比較検定を行います。今回と同様に、等分散している場合はTukey HSD、等分散していない場合はGame-Howellを使って問題ないと思います。
まとめ
一元配置分散分析(One-way ANOVA)は、正規分布に従い、3つ以上の水準間の差を比較したいと時に使用します。医学研究では多くの場合、分散分析後に事後検定として多重比較検定を行なって水準毎の差を検定します。事後検定もSPSSで簡単にできるので、上記の方法を見ながら試してみて下さい。
その他の統計学的検定一覧
その他の統計学的検定一覧