母集団と標本


 「母集団」と「標本」は統計解析の基本事項です。統計解析をはじめる前に必ず覚えておかなければなりません。ここでは「母集団」と「標本」の意味や関係についてわかりやすく説明します。

母集団:対象とする全ての人やもの

 母集団とはあなたが対象としたい全ての人(あるいはもの)を指します。もし,あなたが変形性膝関節症の患者さんを対象に研究を行いたいとしたら,母集団は「変形性股関節症の診断を受けた全ての人」になります。全ての人を調べられれば良いのですが,現実的にはそうもいきません。ですから母集団から標本を抽出してその特性を調べるのです。

有限母集団と無限母集団
 全例を調査できる母集団を有限母集団といいます。例えば2015年の新潟件佐渡ヶ島での変形性膝関節症発症件数や特性を把握したい場合,母集団を全て調査することが可能です。
 その一方で,全例を調査することが困難な母集団を無限母集団といいます。先ほどの例でいえば期間や地域を決めずに変形性膝関節症発症件数や特性を知ることは困難になり,無限母集団を対象としていることになります。たいていの研究対象はこの無限母集団となります。

標本:母集団を代表する一部の人やもの

 標本とはあなたが調べたい母集団の一部分の人(あるいはもの)です。変形性膝関節の症患者さん全員を調べることは困難ですが,数十人,頑張れば数百人の患者さんであれば調査できるのではないでしょうか。そうして調査した(集められた)人たちは,母集団の代表であり,そこから代表値や散布度(データの代表値と散布度について)などの特性値を求めて,母集団の特性を推定するのです(下図参照)。


その標本はどの母集団を反映しているか?

 母集団の上にユニバース(調査対象集団)を置く考え方もあります。例えば,あなたは日本のA地域の変形性膝関節症の患者さんを集めて調査しました。その標本はどの母集団を反映しているでしょうか。おそらくその特性値はA地域の母集団を反映しているでしょう。一方で,考え方によっては日本国内の変形性膝関節症患者の特性を反映しているともいえます(下図参照)。



 このように三段階で集団の特性を考えるさいは,標本から推定された母集団の特性が本当にユニバースの特性を反映しているか慎重に吟味する必要があります。

まとめ

 母集団が不明なので(調査できないので)標本を集めて母集団の特性を知るわけです。母集団と標本の関係を知ることは研究デザインを考える際にも重要です。やみくもに標本を集めても,それがどんな母集団を反映しているか分からなくなります。また標本の特性値に偏りが生じてしまい,本来想定していた母集団の特性を反映していない可能性もあります。統計の基礎をある程度知ってから研究に望んで下さい。