データ収集に関する留意点(測定の再現性と妥当性)


測定は,目の前の患者等の状態を知り治療に展開していくための資料とする目的で行われる.あるいは,集団の特徴を表現するために用いられることもあるだろう.たとえば,臨床ではあらゆる測定・計測によってデータを集め,そのデータを元に診療活動をおこなう.ある内科医が:

 

「最近体重が減少し食欲が無い」

 

という訴えのある患者に対して,血液検査,尿検査等を実施し,その値から糖尿病という疑いをもつ過程を想像してみよう.そのとき,100mlの血液中,尿中のグルコース(ブドウ糖)の量や,赤血球の中にあるヘモグロビンとグルコースの結合物(ヘモグロビンA1C)の割合に,この内科医は着目しているだろう.しかしこの値が臨床検査技師の腕によってまちまちであったとしたら(e.g.誤って200mlの血液中,尿中グルコースを測定してしまったら..),これらの測定値は使えない.患者の状態を知るための資料価値,信憑性にかけるからである.近年のオートメーション化によって臨床検査が自動化されている背景を考えると,このようなことは現在ではほぼありえないといっていいだろう.したがって,医師は臨床検査値の結果を信頼して,その他の病歴や臨床所見などを参考に診断を確定する.

 

一方理学療法の世界では,セラピストの手による計測が主に行なわれるために,計測者の「腕」や「経験」による測定値のばらつきが問題となる.測定のたびに値がばらばらでは,理学療法の効果を確認することができないからである.欧米の理学療法士は臨床から得た測定値に基づいて診断を下し,適切な治療プログラムを立案したり,必要な場合は外科や内科への紹介状,レントゲン撮影,ボルタレンなど消炎鎮痛剤の処方を出すこともある.したがって,自分の腕を万全にするための努力に怠りがない.これは日本のセラピストにとっても重要なことである.

 

同時にこのような測定は臨床的,科学的に意味のある測定かどうかが重要である.たとえば,腰痛で来院した患者にとって,股関節の屈曲・伸展可動域や回旋可動域を測定されることに意味があるだろうか.あるいは変形性膝関節症の患者の担当理学療法士は腹筋筋力や腰椎の柔軟性の測定ばかりをしている.これらの測定は,疾病の状態や重症度を測っているわけではない.ではこの測定は無意味なのだろうか.実は前者の測定は,治療を行なう介入ポイントを探るための測定であり,そこに問題があれば介入することで治療効果を期待できるから行っているのである[Fogel, 2003 #934].

 

平衡機能について考えてみよう.平衡機能を測定するといっても,平衡機能の測定には,重心動揺検査,片足立ちテスト,Functional reach, Timed Up and Goといった定量的なものから,Berg Balance Scale,ロンベルグ検査のような定性的なものまで様々である.それぞれの検査は,平衡機能のある一側面を切り取って測っているため,ひとつの検査結果をもってすべての平衡機能を代弁しているわけではない.また測定対象の選択によって,検査結果を解釈することに意義がある場合と無い場合があるだろう.たとえば,健常人の平衡機能をTimed Up and Goで測定し,この集団の平衡機能の特徴を捉えたいとする.その際,5歳から80歳までの健常人を対象とすれば平衡機能の良いものも悪いものも混在し,年齢の違いによる一定の傾向が認められるだろう.しかし20台の若年成人を対象にデータをとれば,ほぼすべての被験者の数値は5-6秒以内におさまってしまうため,実際には存在するであろう若年者における平衡機能のばらつきを資料として表すことが難しくなってしまう(これを天井効果Ceiling effect,または床効果floor effectと呼ぶ).

 

また測定する対象は,定量的な計測が可能な運動機能ばかりに限らない.意欲や過去の怪我の状況を情報として知ることも測定である.しかし意欲とは心のある次元の状態を表すものであり,それを定量化することは非常に困難である.したがってアンケートなどを用いて「あなたは~について興味がありますか?」などの質問をし,Yes/Noなどで答えさせる定性的な方法が主流である.しかし何を持って意欲とするのか,意欲をYes/Noの2段階で決めることができるのか,と問われたときに答えに窮してしまう場合は少なくないであろう.

 

したがって測定をおこなう際の留意事項として最も重要なことは,①測定精度(再現性),②測定の意義(妥当性),③知りたい情報と計測項目との乖離,である.

 

ここまでの学習で,データの種類には大まかに分けると定性的なデータ(Qualitative scale)と定量的なデータ(Quantitative scale)に分けられることが感覚的につかめたはずである.以下に,定性的データ,および定量的データの種類を示す.

 

定性的データ

 

名義尺度(Nominal scale):生物の種類やYes・NOなど,そのものに名義を与えることによってカテゴリ化したもの.たとえば腰痛の既往をYes・NOで答えその頻度を示す場合(腰痛歴あり60名,腰痛歴無し40名),名義尺度を用いる.

 

順序尺度(Ordinal scale):事象を順序だてて表現した尺度であるが,その各順位の間に一定の間隔はない(その差や距離がまちまち).たとえば運動競技の順位(一位,二位,三位,,,),治療効果を悪化―1,不変0,改善1,など.それぞれの順位の間に一定量の間隔が見られないが,大小には意味がある.

 

定量的データ

 

間隔尺度(Interval scale):スケールの間に一定の間隔が認められるため,順序尺度と異なり順位間の差や距離を扱うことができる.しかし絶対ゼロ点が無いため(あるいはゼロ点があったとしても任意なため),比率を扱うことはできない.たとえば摂氏温度における5度と10度の差は,90度と95度との差に等しい.しかし,摂氏温度のゼロ点は絶対ゼロ点ではないため(1気圧の環境で水が凍る温度をゼロ度,沸騰する温度を100度と定義されている),5度から10度への変化が100%の上昇と表現できない.アンケートで満足度などを5段階評価(1非常に不満,2不満,3どちらでもない,4満足,5非常に満足)し,順位間の間隔(距離)を一定とみなせるとき(あるいは客観的根拠があるとき)は,これを順序尺度ではなく間隔尺度として扱うこともある.

 

比例尺度(Ratio scale):スケールの間に一定の間隔が認められ,かつ絶対ゼロ点があるもの.したがって比率も扱うことができる.たとえばものの長さや重さ,数量(0,1,2,,,),金額(無料,200円,2万円,,,)などがある.身長を例にとる.赤ん坊の身長が50cmから60cmに10cm伸びればそれは20%の伸び率になるが,ボブサップの身長が2mから2m10cmに10cm伸びても,それは5%の伸び率にしかならない.身長はこのように,スケール間の間隔に意味があるだけでなく,比率の表現にも意味があるため,比例尺度と呼ばれる.

 

測定の再現性

 

では測定値のばらつき,とは何だろうか?これは一言で言えば,測定した値がどの程度安定しているか否かであり,一般的には測定の再現性(信頼性,定度)と呼ばれている.臨床では測定値の再現性を調べたりすることはまず無いと思うが,研究ではこの再現性を予備研究(パイロットスタディ)で調べた上で本実験に入るのがルールである.いい加減な計測によって得られた値から結論づけをすることは考えられない.臨床においても測定の再現性を高めることは重要である.測定の再現性を高め,「ラーメン職人」ならぬ「MMT職人」や「バランス測定職人」になるよう努力することにより,診療の質を上げるだけでなく,仕事への自信が生まれ,周囲からも一目おかれるようになるだろう.

 

測定の妥当性

 

もうひとつ,測定する際に重要なものが妥当性である.これは真の値から測定値が一定の方向へ偏った状態を指すバイアス(系統誤差)と関連がある.すなわち系統誤差が少なければ少ないほど,その測定値は妥当性が高い,ということができる.たとえば理学療法研究や保健科学研究では,放射能による被爆を避けるためにレントゲン撮影の代わりに,角度計を使用して脊柱の彎曲を測定することがある.その際,角度計による彎曲値とレントゲン画像による彎曲値(真値)を比較することによって,両者にどの程度開きがあるのか,別の言い方をすれば,どのくらいバイアスがあるのかを吟味する.

 

臨床では,すでに妥当性の確立された評価方法を用いて計測を行なっていることが多く,普段妥当性について意識することは,信頼性を意識するよりも少ないかもしれない.しかし,うっかりミスによって妥当性が低下することは良くあることである.

 

例1:ある病院の理学療法士Aさんは,肩関節周囲炎の患者10名の肩関節の伸展可動域が,健常人10名のそれとほとんど違いが無いことに驚いている.なぜかというと患者さん達は,手が後ろに回らず洋服を着るときに痛む,を主訴としており,臨床的には明らかに関節可動域に違いがあるように感じるからである.Aさんが肩関節可動域測定でおかしたうっかりミスを考えなさい.

 

測定の再現性,妥当性を改善させるための方法

 

①    測定方法の標準化

 

測定方法や手順が曖昧なまま計測を実施すると、その測定者の癖がでることがある。たとえば背臥位で股関節屈曲関節可動域を測定するとき、固定軸をベッド面として測定する癖のある測定者によって得られたデータは測定者バイアス(Observer bias:情報バイアスのひとつで、測定者が原因で起こるものを指す)によってゆがめられてしまう(この場合は股関節屈曲可動域が常に大きく計測される傾向がある)。したがってマニュアルを作ることによって測定方法の標準化をすることが望まれる。また測定値と真の値との違いの程度、すなわち真度(accuracy)をキャリブレーションによって常に高めておくことも重要である(例:動作分析機器のキャリブレーション)。

 

②    測定トレーニングによる技術改善

 

測定に熟練していない場合、癖が出やすいことが考えられる。したがってトレーニングを行い、常に偏りが生まれないようチェックする必要がある。

 

③    測定手段の改善や自動化

 

関節可動域測定に使われるゴニオメーターの修理や改良、あるいは自動的に関節可動域を測定するシステムを用いることによって、測定者バイアスを防ぐ方法である。また自動化によって対象者の緊張などによって生じる対象者バイアス(subject bias:情報バイアスのひとつで対象者が原因で起こるものを指す)も最小限にすることができる。

 

④    測定者や対象者に対して盲検化を行う

 

測定者が研究内容や目的を知っている場合、測定者バイアスが生じる可能性が高い。たとえば、ストレッチによる足関節背屈角度の影響を調べたい場合、測定を行うものが研究目的を知っていると、ストレッチ施行群の背屈角度を意図的に大きな値で測定してしまう可能性がある。したがって測定者には研究内容を知らずに計測させ,これを盲検化(blinding)と呼ぶ。

 

対象者が測定の際に緊張してそれが結果に影響を及ぼしたり、治療内容を知っていることによって対象者バイアスがおきることがある。これを防ぐためのひとつの方法として、患者に計測のことや治療内容を知らせずに実施することも盲検化のひとつである。

 

測定者、対象者両方に盲検化を行うことを特に二重盲検法と呼ぶ。