選択バイアス が研究結果に影響を与えるのを防ぐために,研究対象者の割り付けにランダム化(無作為化)という方法がとられます。バイアスについては「研究結果に影響を与えるバイアス)」を参照して下さい。ランダム化には,単純ランダム化,ブロックランダム化,層別ランダム化, 適応的ランダム化,クラスターランダム化の5つがあります。この5つのランダム化について以下に説明したいと思います。
単純ランダム化 simple randomization
通常,ランダム化比較試験では,介入群と対照群の参加者数が同数となるように割り付けを行います。各群の人数が偏ると,その後の統計解析がうまくいかなくなるからです。単純ランダム化は,参加者一名が来るたびに介入群に入れるか,あるいは対照群にするかを2分の1の確率でランダムに割り付けていく方法です。各群,どちらに割り付けるかは,乱数表などを用いることで決めることができますが,今はコンピュータ上で乱数を発生させて割り付けるのが一般的です。
コンピュータは乱数を作れるか?
コンピュータが作る乱数は擬似乱数と呼ばれており,実は乱数ではありません。ここでいうランダムとは,特定の対象者が介入群と対照群のどちらに割り付けられたかを予見できないことですが,コンピュータが作る乱数は,計算プログラムさえ分かってしまえば予見できてしまいます。しかし,できるだけ予見できないように複雑にプログラムされており,実用上は問題ないと考えられています。
利点と問題点
単純ランダム化は,とてもわかりやすいランダム化の方法で,簡単に行えることが利点といえます。しかし,単純がゆえに問題点もあります.この方法では性別や年齢といった研究結果に影響を与える因子が加入群と対照群に均一に分布せず,偏ってしまう可能性があります。また,各群が同数に割り付けられるとも限らず,人数が偏ってしまう可能性もあります。この方法は偶然によって対象者属性や人数の偏りが生じやすいのです。
ブロックランダム化 block randomization
ブロックランダム化とは,単純ランダム化が介入群と対照群を2分の1の確率でランダムに割り付けるのに対し,あらかじめ一定人数毎のブロック (乱塊) をつくり,その中でランダムに割り付ける方法です。例えば,介入群をA群,対照群をB群として,2名ずつのブロックを作ったとします。その組み合わせはAA,AB,BA,BBの4通りとなります。しかし,AAやBBの組み合わせは,2名が同一の群に割り振られてしまいますので,この組み合わせには割り振らないことにします。2名ずつのブロックに残ったAB,BAの組み合せ (これをパーミュテーションブロックといいます) を並べ替えてランダムで割り付けていくことでランダム化を行います。
利点と問題点
この方法では,介入群と対照群の数をほぼ同数にすることができるという利点があります。一方,どちらの群に割り振られたかをマスクした試験であっても,なにかの拍子に2名のうち1名でも割り振られた群がわかってしまった場合,自動的にもう一方の群も予見できてしまうという問題点もあります。
しかし,この問題はブロックサイズを大きくすることで対処が可能です。例えば4名を1ブロックとすると,6通りのパーミュテーションブロックができるので,4名中1名が割り振られた群が分かってしまっても,次の1名がどこに割り振られるかを予見することが難しくなります。ブロックサイズを大きくすればするほど,この問題は無視できるのですが,あまりブロックサイズを大きくしすぎると,各群の人数に偏りがでる可能性があるので,実際にはブロックサイズ自体をランダムに変更する方法 (例えば4ブロックと8ブロックをランダムで選ぶなど) がとられます。
しかし,この問題はブロックサイズを大きくすることで対処が可能です。例えば4名を1ブロックとすると,6通りのパーミュテーションブロックができるので,4名中1名が割り振られた群が分かってしまっても,次の1名がどこに割り振られるかを予見することが難しくなります。ブロックサイズを大きくすればするほど,この問題は無視できるのですが,あまりブロックサイズを大きくしすぎると,各群の人数に偏りがでる可能性があるので,実際にはブロックサイズ自体をランダムに変更する方法 (例えば4ブロックと8ブロックをランダムで選ぶなど) がとられます。
層別ランダム化 stratified randomization
層別ランダム化とは,偶然によって偏ることで結果に影響を与えてしまうような要因 (例えば性別,年齢,体重,人種,疾患の程度) を考慮した上で,ブロックランダム化を行う方法です。例えば対象者全員の男女比が 1 : 2 であったとします。介入群と対照群ともに男女比が 1 : 2 になるように割り付けるには,男性と女性を別々にブロックランダム化を行います。すると,男性,女性ともに介入群,対照群に半数ずつ割り付けられることになるので,各群ともに男女比 1 : 2 の比は維持されます。
利点と問題点
この方法によって,偶然によって結果に影響を与える要因が偏ることを防ぐことができます。加えて,介入群と対照群のバランスをとりたい要因が複数あったとして,例えばそれが性別と年齢 (65歳 以上と65歳未満) であれば,65歳以上男性,65歳未満男性,65歳以上女性,65歳未満女性と4つの層を作ればいいです。
一方で,あまり要因が多くなると,層の数が多くなって1 つの層に属する対象者数が少なくなってしまうという問題があります。そうすると,ブ ロックランダム化の問題点である,最後のブロックの途中で試験が終わってしまうと対象者数のバランスが保証できなくなってしまうため,せっかく層別したのに要因のバランスが崩れてしまうという事態になりかねません。このため層別ランダム化に用いる要因は,結果に強い影響を与える要因のうちせいぜい3つまでにするべきだという考え方もあります。
一方で,あまり要因が多くなると,層の数が多くなって1 つの層に属する対象者数が少なくなってしまうという問題があります。そうすると,ブ ロックランダム化の問題点である,最後のブロックの途中で試験が終わってしまうと対象者数のバランスが保証できなくなってしまうため,せっかく層別したのに要因のバランスが崩れてしまうという事態になりかねません。このため層別ランダム化に用いる要因は,結果に強い影響を与える要因のうちせいぜい3つまでにするべきだという考え方もあります。
ランダム化の手順は作為的か無作為的か?
ランダム化 (少し前は無作為化と呼ばれることが多かったようです) は,実はとても作為的な手順です。なぜなら,われわれは統計学的にある要因が結果に影響を与えているかどうかを研究によって明らかにしたいのですから,それ以外に結果に影響を与える要因を作為的に排除する必要があります。そのため,ランダム化は作為的な作業だということになります。近年,無作為化ではなくランダム化という表現が使われるようになった背景にも「作為的な無作為化」という自己矛盾を避けるためのようです。
適応的ランダム化 adaptive randomization
適応的ランダム化とは,単純ランダム化やブロックランダム化の割り付け途中で介入群と対照群の人数が大きく食い違 ってしまい,バランスをとるため次から参加する方たちは人数が少ないグループに割り付けるといった,途中の割り付け結果に適応しながら次の割り付けを決める方法。
利点と問題点
適応的ランダム化は層別ランダム化のように複数の要因の組み合わせで考えるのではなく,それぞれの要因ごとの合計数でバランスを考えるので,割り付けの際に考慮する要因の数が増えて最終的にバランスが崩れてしまうという問題は起こらないことが利点です。しかし,その方法にはいかさまコイン (でる目の確率を変動させる) や,最小化法 (最初の一人は2分の1の確率で割り付け,それ以降は各グループの参加者数を割り付けの際に考慮する要因で合計し,もっとも合計数の少ないグループに割り付けを行う) といった複数の方法があり,使用が容易ではない点が問題といえます。
クラスターランダム化 cluster randomization
クラスターランダム化とは,割り付けを行う単位が個人ではなく,地域やグループといった塊り (クラスター) を単位として行うランダム化のことです。
まとめ
ランダム化といっても様々な方法があることが分かりました。実際は完全にランダムにするのではなく,「偶然」の要素をできるだけなくすための手法が好まれます。研究環境にどのような因子が関与するのかを考えた上でランダム化の手法を決定して下さい。
研究に必要な知識(関連記事一覧)
研究に必要な知識(関連記事一覧)