Pearsonの積率相関係数


相関係数は、統計学において、二つの変数間の関係の度合いを数値化する重要な指標です。この記事では、その中でも特に一般的に用いられるPearson(ピアソン)の積率相関係数に焦点を当て、その特徴や使用方法、SPSSを用いた実践例を通して、統計分析における相関関係の解析方法について詳しく解説します。この知識は、科学的な研究だけでなく、ビジネスや社会科学の分野でのデータ分析にも応用可能です。

どんな時にこの検定を使うか

Pearsonの積率相関係数は、二つの量的変数間の直線的な関連性を評価する際に用いられる統計的手法です。この検定は特に、変数が正規分布をしているという仮定の下で有効です。

例としては、医学分野において、患者の年齢と特定の疾患リスクの間の関係性、心理学におけるストレスレベルと睡眠の質の間の相関、または経済学における教育レベルと年収の関連性など、多岐にわたる研究で利用されます。この検定は、単に相関が存在するかどうかを示すだけでなく、その強さや方向性を定量的に明らかにするために重要です。しかし、この相関係数が因果関係を意味するわけではないため、データの解釈には注意が必要です。

データの尺度や分布 

正規分布に従い、尺度水準が比率か間隔尺度のデータ(例外として順序尺度のデータを用いることもあります)を用いることができます。同じ集団の(対応のある)2変数以上のデータである必要があります。正規分布を仮定する検定なのでパラメトリックな手法に含まれます。

検定の指標 

相関係数と、相関係数の有意性(値)を用います。相関係数の解釈は目安として以下のものがあります。| r | は相関係数の絶対値です。
  • | r | = 1.0 〜 0.7:かなり強い相関がある
  • | r | = 0.7 〜 0.4:強い相関がある
  • | r | = 0.4 〜 0.2:やや相関がある
  • | r | = 0.2 〜 0.0:ほぼ相関がない

実際の使い方(SPSSでの実践例)

B市A施設の男性職員の体重と中性脂肪のデータが手元にあるとします。それでは実際に体重と中性脂肪との直線的な関係性がどの程度かPearson(ピアソン)の積率相関係数を求めてみましょう。

この例では帰無仮説と対立仮説を以下のように設定します.

帰無仮説 (H0) :体重と中性脂肪の間に相関はない
対立仮説 (H1) :体重と中性脂肪の間に相関がある
  1. データをSPSSに読み込む.体重と中性脂肪のデータを2列に並べる。
  2. メニューの「分析 → 相関 (C) → 2変量 (B)... を選択。


  3. 「体重」と「中性脂肪」を「↪」で変数に移動します(下図①)。
  4. 「相関係数」のPearson (N) にチェックします(下図②)。
  5. 「有意差検定」 の両側 (T) にチェックします(下図③)。
  6. 「OK」ボタンを押せば検定が開始します(下図④)。

  7. 結果のダイアログがでたら「Pearsonの相関係数」、「有意確率(両側)」で、p < 0.05(あるいは < 0.01)を満たしているかを確認します(下図)。


今回の結果だと相関係数が「.342」で、有意確率が「.000」なので p < 0.01 を満たしていますね。|r|が0.2〜0.4の範囲なので、B市A施設の男性職員の体重と中性脂肪の間には有意にやや相関があると結論できます。


まとめ

Pearson(ピアソン)の積率相関係数は、正規分布に従う2つの変数間の直線的な関係の強さを知りたい時に使用します。データは必ず正規分布に従うものでなくてはなりません。データが正規分布に従わない場合はSpearmanの順位相関係数もしくはKendallの順位相関係数を使う必要があります。正規分布に従うか否かを事前に確認して、これらを混同して用いないように注意して下さい。

その他の統計学的検定一覧