Spearmanの順位相関係数


Charcot(@StudyCH)です。

相関係数は2つの変数の直線的な関係性をみたいときに使われます。相関係数にはいくつかの種類があって、今回ご紹介するSpearman(スピアマン)の順位相関係数はそのうちの一つです。ここではSpearmanの順位相関係数の特徴や使用方法について、SPSSでの実践例を含めてわかりやすく説明します。

どんな時にこの検定を使うか

集めたデータのある変数とある変数の直線関係の強さを知りたい時で、変数が正規分布に従っていない場合にこの検定を使います。例えば、ある集団の体重(正規分布に従う)とアンケート調査の得点(正規分布に従わない)との関係を知りたいときなどに相関係数として表します。

データの尺度や分布 

正規分布に従っておらず、尺度水準が比率、間隔尺度、順序尺度のデータを用いることができます。同じ集団の(対応のある)2変数以上のデータである必要があります。正規分布を仮定しない検定なので、ノンパラメトリックな手法に含まれます。

 検定の指標 

相関係数と、相関係数の有意性(値)を用います。相関係数の解釈は目安として以下のものがあります。| r | は相関係数の絶対値です。
  • | r | = 1.0 〜 0.7:かなり強い相関がある
  • | r | = 0.7 〜 0.4:強い相関がある
  • | r | = 0.4 〜 0.2:やや相関がある
  • | r | = 0.2 〜 0.0:ほぼ相関がない

実際の使い方(SPSSでの実践例)

B市A施設の男性職員に朝食摂取についてのアンケートを行なったデータが手元にあるとします。アンケートは「毎日朝食を食べる=1、週4回以上朝食を食べる=2、週2〜3回朝食を食べる=3、ほとんど朝食を食べない=4」という4段階で得点化しました。

それでは実際に体重とアンケート得点との直線的な関係性がどの程度かSpearman(スピアマン)の順位相関係数を求めてみましょう。ちなみにSPSSではKendallの順位相関係数も同時に求めることができます。

この例では帰無仮説と対立仮説を以下のように設定します。

帰無仮説 (H0) :体重とアンケート得点の間に関連はない 
対立仮説 (H1) :体重とアンケート得点の間に関連がある
  1. データをSPSSに読み込む。体重とアンケート得点のデータを2列に並べます。
  2. メニューの「分析 → 相関 (C) → 2変量 (B)... を選択します(下図)。


  3. 「体重」と「朝食摂取状況」を「↪」で変数に移動(下図①)。
  4. 「相関係数」のKandallのタウ b とSpearman にチェックします(下図②)。
  5. 「有意差検定」 の両側 (T) にチェックします(下図③)。
  6. 「OK」ボタンを押せば検定が開始(下図④)。


  7. 結果のダイアログがでたら「相関係数」、「有意確率(両側)」で、p < 0.05(あるいは < 0.01)を満たしているかを確認します(下図)。


今回の結果だとKendallで相関係数が「.022」で有意確率が「.475」、Spearmanで相関係数が「.029」で有意確率が「.466」なので、どちらの検定でも有意な相関はほとんどないという結果でした。このようにKendallの順位相関係数、Spearmanの順位相関係数のいずれもSPSSで検定できますが、Spearmanの順位相関係数の方が一般的です。

まとめ

Spearman(スピアマン)の順位相関係数は、正規分布に従がわない2つの変数間の直線的な関係の強さを知りたい時に使用します。データが正規分布に従う場合はPearsonの積率相関係数を使う必要があります。正規分布に従うか否かを事前に確認して、これらを混同して用いないように注意して下さい。

その他の統計学的検定一覧