実験計画に関する留意点(バイアスについて)


科学は①観察を基にして事象を分類し,②実験などを通して複数の事物の関係性を示し,③その関係性を主軸に背後にある法則やモデルを予想すること,をその本分とするといわれている.したがって,目に見えないもの(観察できないもの),すなわち価値観や愛といったことは,基本的に科学では取り扱うことができない.これが科学はかならずしも万能ではない,と言われる理由でもある.科学は人間社会を豊かにする強力なツールであることは論を待たないが,様々なツールの中のひとつにすぎないことをまずは銘記する必要がある.

  

観察とは目の前におこる事実をよく観ることであり,観察に思索を交えてはいけない.したがって自分の主義・主張を一度取り除き純粋な目をもって目の前の事象を描写する態度,これが科学の根本である.先入観や仮説を,観察結果によっては覆すことも科学では頻繁に起こりえる.あくまでも事実という土台に立脚していく,論を重ねていくのが科学である.

  

本講義ではさまざまな研究テーマを設定した上で実験を行っていくが,たとえば「足指屈筋強化は足関節ストレッチに比べて平衡機能をより改善させる」という研究疑問を科学的に結論付けて行く上で,どのような実験デザインを組んで行く必要があるのかについて考えてみよう.ここでは;

 

1)どのような対象者に

 

2)どのように介入を行い

 

3)どのような指標(ものさし)を用いてバランスを評価するのか,

 

といったことを,まず考えていく必要がある.「足指屈筋強化、あるいはストレッチが平衡機能に与える影響」という研究テーマに対して,一定の確度(確からしさ)を持って結論付けを行うためには,これら全ての項目が規定される必要がある。これを「研究デザイン」と呼び,これによって研究結果をゆがめてしまうバイアス(系統誤差:システマティックエラーとも呼ばれる)を可能な限り最小にするのである。換言すると、研究実施のために妥協してしまった結果、「研究テーマ」と「研究結果」との間に生じてしまう系統的な偏りがバイアスである。

 

以下,バイアスを含めた誤差の問題について,①偶然誤差,②バイアス(系統誤差),③交絡因子による誤差,の順に説明して行く.

 

①偶然誤差:真の値に対して測定値がランダムにばらついている様子,ということができる.たとえば,身長166cmのA氏を,テープメジャーで10回計ったときの値が;165cm,167cm,165.5cm,168.5cm,167cm,168cm,163cm,162cm,166cm,164cm

 

であったとき,測定値は真の値の周りをランダムにばらついていることが分かる.こういった誤差を偶然誤差と呼ぶ.

 

また本来二者の間に関連が無いのにも関わらず,偶然に関係性があるかのように見える場合も,偶然誤差による影響と考えることができる.たとえば,携帯電話の使用と中耳炎の出現率の調査の結果,中耳炎を持つ患者群の携帯電話使用率が90%であり,中耳炎を持たない健常群の携帯電話使用率が70%であった.しかし別の研究者が同様の調査を行なった結果,中耳炎を持つ患者群の携帯電話使用率は90%であったが,健常群の携帯電話使用率が89%だった.このふたつの研究を見ると,健常群の携帯電話使用率が,70%になったり89%になったりでばらついている.実際は,一番目の研究のサンプル(健常群)にはたまたま携帯電話を使う人が少なかったために,このような混乱を生じたのである.関係が一見明らかになっても,こういった偶然による影響をまず考える必要がある.

 

偶然誤差を最小限にするためには,測定方法の標準化,自動化,あるいはトレーニングによる測定技術の改善などを行うことが考えられる(上記身長の例).あるいはサンプルサイズを増やすことで対応することも可能である(上記中耳炎の例).しかし偶然誤差がゼロとなることは無いことは覚えておく必要がある.

 

②バイアス(系統誤差):ある事象を記述する際に,それを何らかの色眼鏡を通して記述してしまうため,得られる結果を系統的(一方向)にゆがめてしまうことがある.こういった色眼鏡によって生じる誤差,言い換えれば偏りを系統誤差(バイアス,システマティックエラー)という. 

 

系統誤差を簡単に説明すると,真の値に対する測定値の偏りである.たとえば体重60kgのB氏を,体重計で10回測ったときの値が;

 

62kg,63kg,65kg,61.5kg,67kg,61kg,60.5kg,62.5kg,63kg,64kg

 

であったとき,測定値は真の値よりも常に大きく測定されている.このように,測定値が常にどちらか一方向に偏っているとき,これを系統誤差と呼ぶ.

 

バイアスには、大きく分けて3つある.

 

I.           選択バイアス:観察する集団(study population)が本来目的とする集団(target population)を代表しておらず、ある偏った特徴を有しているときにおこる誤差をさす。たとえば、血圧の年齢差を比較しようとしたとき、若年群は体育大学生から、中年群は事務職員から、老年群は病院に入院している患者からデータを取って比較した場合、結果には大きな偏りが生じることが予想される。また、腰痛患者への理学療法効果を長期的に調査するとき、理学療法施行群と非施行群を患者の理学療法の希望の有無に従って分類してしまうときにも注意が必要である.希望者は理学療法に期待や好印象を抱いている場合が多いためである。このようなとき、観察集団には選択バイアスがある、ということができる。

 

II.         情報バイアス:観察集団から情報を得るときに、それが誤った情報の取り方によって結果が偏ってしまうことがある。このときの誤差を情報バイアスによる誤差ということができる。たとえば、心拍数の測定者が魅力的な測定者だったとすると、緊張により心拍数が通常より上昇してしまうことがある。これは情報バイアスのひとつである。

 

III.       交絡バイアス:選択バイアスを避けるために選択基準を設けても,ランダムサンプリングが行えない研究がほとんどである.そのため対象者を群別したとき交絡因子が偏って群間に存在してしまうことがある.これが交絡バイアスである.交絡因子とは,たとえばパチンコ店の店員は他の職業を持つ人に比べ,肺がんの発生率が有意に高い,という関係性が見られたとする.その際,この関連の背後にある修飾因子は何であろうか?こういった修飾因子を正式には交絡因子と呼び,リスクファクター(ここではパチンコ店に勤めること)と関連を持ち,かつ結果(ここでは肺がんの発生)の真の原因子である.この例では,実際の原因はパチンコ店に充満するタバコの煙である.関係性を検証する際にはこういった交絡因子を常に意識しておかなければならない.

 

選択バイアスを最小限にする方法について

 

選択バイアスを最小にするための工夫は、①母集団を適切に代表する集団を選ぶ、②サンプリングの工夫を行う、③ドロップアウトを防ぐ、などが提案されている。

 

☞選択バイアスを最小にするための工夫

 

①    母集団を適切に代表する集団を選ぶ:選択基準(取り込み基準と除外基準)を設ける.

 

取り込み基準(Inclusion criteria)の決定:母集団の特性をあらわす条件のこと.これを指定した上で、その基準にしたがってサンプリングしていく。たとえば、日本人男性の腰痛頻度を知りたい場合と、介護職に従事する男性の腰痛頻度を知りたい場合では、取り込み基準が大きく異なってくる。

 

除外基準(Exclusion criteria)の決定:取り組み基準を満たす人の中から、データの質を低下させたり、ドロップアウト(観察中に研究から脱落すること)しそうな人をあらかじめ取り除いたりするための基準。たとえば、健康な人と認知症の人からアンケート調査を実施する場合,得られるデータの質に違いが認められるだろう。また健康な人と癌に患ってしまっている人では、ドロップアウト率が異なることが予想される。したがって研究対象者から後者を除くことによってデータの質や量を確保する。ただ除外基準を設けすぎると、被験者数の確保が困難になることや,結果を一般化する際に制限が残るため、除外基準は必要最小限にすることが推奨されている。

 

②    サンプリングの工夫を行う

 

サンプリングには簡易サンプリングと確率的サンプリングに分けられ、簡易サンプリングは上記選択基準を満たした人でアクセスすることの可能な人をサンプルとして用いることである。しかしこれではアクセスする際に起きる選択バイアスが生じる可能性が残るため、ランダムサンプリング-すべての人が等しい確率で対象者に選ばれる方法-で行うことが理想である。ただ実施可能性としては著しく簡易サンプリングに劣るため、ほとんどの研究ではランダムサンプリングを行えないのが実際である。

 

③    ドロップアウトを防ぐ

 

あらかじめ決められた選択基準に従ってサンプリングを行っても、さまざまな理由で観察時に被験者が現れなかったり、測定不能であったりすることが多い。このドロップアウトが、ある群において他の群よりも高いと、両群の間には被験者の属性に関するバイアスが生じうる(例:どちらかの群が他方に対してより積極性に劣る)。このため、ドロップアウトを防ぐべく工夫を凝らす必要がある。

 

 交絡バイアスを最小限にする方法について

 

交絡バイアスを最小にするための工夫は、①無作為割付、②対象者の限定、③マッチング、④統計的方法,などが提案されている。

 

☞交絡バイアスを最小にするための工夫

 

①    無作為割付(Randomization or Random allocation)

 

2群以上のグループを対象として観察を行う場合に、交絡因子がどちらか一方の群に偏らないよう、無作為に被験者を割り付けていく方法である。交絡因子が特定できないときに有効である.

 

欠点として,治療効果が経験的に分かっているときに,無作為に治療群と非治療群に分けてしまうことに倫理的な問題が生じることがある.

 

②    対象者の限定(Restriction, Specification)

 

交絡因子が存在する群のみ、あるいは存在しない群のみを対象として観察を行う方法である。たとえば、理学療法による腰痛改善効果を調べたいときに、交絡因子として考えられるのは薬物療法の有無である。したがって、薬物療法を行っていない人のみに限定して、理学療法の効果を観察するものである。

 

対象者の限定の問題点として、被験者数の確保が困難になること、研究結果の一般化が難しくなること,ということがあげられる。また交絡因子が特定できないときは限定化を行うことができない.

 

また上述の研究結果でもし理学療法単独群では腰痛改善効果が見られなかったとしても、薬物療法と理学療法を併用したら腰痛改善効果が得られる、ということも考えられる。これは交互作用(Interaction effect)と呼ばれ、ある介入(この場合は理学療法)が他の要素(ここでは薬物療法)の有無によって効果に違いが見られるとき,交互作用がある,という.このような交互作用が予想されるときに、対象者の限定を行ってしまうと研究結果の質が問われることとなる(本来は薬物療法と併用することで理学療法には腰痛減弱効果があるにもかかわらず,上述の限定をおこなった研究結果が「理学療法は腰痛減弱効果が無い」と示唆されることも大いにありうる)。

 

③    マッチング

 

交絡因子のレベルを、比較する群間で一致させるやり方である。たとえば上述の研究では、薬物療法としてボルタレン軟膏の使用頻度別にレベルを分け、理学療法群と非理学療法群にそれぞれ同じレベルのボルタレン使用頻度をもつ対象者を個別に選んでいく方法である.これはペアマッチングと呼ばれる。他に頻度マッチングと呼ばれる方法もあり、両群で個別にペアを選ばず、両群の交絡因子(ここではボルタレン使用)の出現頻度や平均値などが一致するように、まとめて対象者を選んでいく方法である。

 

欠点は時間がかかること、あらかじめデザインを周到に練る必要があることなどがある。

 

一般的には,年齢(±3)と性別をもっとも大きな交絡因子と考えマッチングをおこなうようである.またBody Mass Index(肥満度,痩身度の指標)なども,研究で扱う変数の種類によってはマッチング条件に含めることも少なくない.

  

④    統計的方法

 

データを集めた後で交絡因子の頻度や程度をもとにデータを層化した上で,分析をおこなう方法を層別分析と言う.この方法はマッチングがデータをとる前に行われるのに対し,データを取り終えた後で行われるため柔軟性が高い.半面,層化をあまりに多くの交絡因子で行うと,層の中にはデータの存在しないものも出てくるため,一度にコントロールできる交絡因子の数は少ない.たとえば,理学療法が腰痛に与える影響を調べる際,交絡因子として薬物療法(3段階),性別(2種類),筋力(5段階)の全ての因子で層化をおこなうと,3×2×5=50の層が生まれてしまう.これでは,全ての層に十分な数のデータを確保することはかなり困難となる.

 

もうひとつの方法は多変量解析(重回帰分析,ロジスティック回帰分析など)と呼ばれる方法で,いくつもの交絡因子を同時に扱うことのできる統計的解析法である.欠点は,層化解析に比べ,得られた結果がバイアスに弱いということである.