データ分析に関する留意点


これまで研究計画立案,およびデータ収集についての解説を行った.データを収集した後に行うことは,データの分析,および結果の提示である.

 

分析の仕方

 

目の前のデータをどのように処理するかについては,すでに研究計画の段階で決まっているのが理想的である.つまり,研究計画の段階で決めていた方法にしたがって分析を行うのが原則であり,後付けで分析手法をむやみやたらに変更してはいけない.その理由は,自分に都合のよい結果が出るまで分析手法をやたらと変更してしまうことを黙認してしまうと,公表される研究結果の客観性が低下してくるからである.つまり公表されたものが全て研究者にとって都合の良い結果(ポジティブデータ)ばかりであれば,ネガティブな現象をも含む実際の事象との乖離が進んでしまう.そして客観的観察を真理探究の目的とする科学の方法論から外れ,主観によって真理探究を目指す哲学と何ら変わりの無い方法をとっていることになってしまう.

 

しかし一方では,あらゆる角度から今まで知られていない関係について探索的に分析をしていく方法もある.研究計画の段階で予想できなかった傾向,たとえば男性被験者の年齢が女性被験者の平衡機能よりも有意に高く,両者をまとめて分析できないケースでは,男女別に分析を行いそれぞれの特徴を分けて記述することは問題ないであろう.またある変数についてまったく予想していない傾向が分析の過程で発見された場合は,その原因や他の変数との関係についてより詳細に分析を進めていく価値があろう.

 

一般的な分析の手順としては;

 

1)属性変数(性,年齢,BMI,過去の運動歴,喫煙歴など)の平均値±標準偏差,あるいは割合(男女比や運動歴有りの割合など)を表に示す.

 

2)比較する変数のうち間隔尺度,比率尺度については,分布が正規分布に従っているか確認をする.これらが正規分布に従っている場合とそうでない場合とでは,選択する分析手法が異なるからである.

 

3)適切な分析手法を選択し,分析を実行する.その際,単変量解析よりも多変量解析を優先しておこなう.

 

1)の属性変数の平均値±標準偏差,あるいは割合を示す理由は,研究対象集団が,母集団の特性といかに近似しているかを示し,その研究結果を目的母集団の特性として一般化できるかどうかの根拠とするためである.たとえば平衡機能の実験を行う計画を立て,その研究目的が「健常成人の平衡機能を知ること」であったとしよう.しかし実際に研究対象とした集団の平均年齢は20代前半であった.これは研究目的である,健常成人の平衡機能を知るためには,幾分不適切な対象である.なぜなら,健常成人には30代から少なくとも60代の年齢も含めるべきだからである.したがって,実験の結果から健常成人の平衡機能を示唆することは難しく,むしろこの研究対象集団が想定する母集団は,若年健常成人ということになろう.このように,実験結果が目的としている母集団に一般化できるかどうか,という問題は,一般化可能性(Generalisability)と呼ばれ,それは属性変数の平均値等で示唆することができる.

 

2)間隔尺度,比率尺度については,被験者の数が多ければ多いほど正規分布に従っていることが予想される.しかし場合によってはその分布が偏っていることがある.分析モデルによってはデータの正規分布が原則となっているため,分析の前に分布の正規性を確認する必要が生じてくる.SPSSなどの統計ソフトでは,Shapiro-Wilk検定,あるいはKolmogorov-Smirnov検定が用意され,データ分布の正規性を確認できる.両検定ともにp≧0.05であれば正規性が確保されたといえる.データが名義尺度,順序尺度の場合はこれらの検定をおこなう必要は無い(i.e.男女などの二値データはそもそも正規分布しようがない).

 

3)適切な分析手法を選択し,分析を実行する.

 

(ア)  データの正規性が確保された場合(パラメトリック手法).2群を比較する場合はt検定,二つの変数の関連を見たい場合はPearsonの相関分析を用いる.有意水準は通常5%,あるいは1%とする.3群間以上の比較の場合は分散分析(ANOVA)を用いる.群間のばらつき(分散)が各群内のばらつきよりも大きい場合(i.e.分散分析表の結果:p<0.05)は,ポストホック分析(多重検定)によって,各群間の違いをそれぞれ検定する(e.g. Scheffeの方法).群間のばらつきが各群内におけるばらつきを超えない場合(i.e.分散分析表の結果:p≧0.05)は,その時点で分析を終了する.3つ以上のグループ間の比較に,t検定を各群間で繰り返しおこなう方法(i.e. A群vs B群,B群 vs C群,C群 vs A群)は,統計学的には推奨されない.その理由は,第一種の過誤(本当は群間に違いが無いにもかかわらず違いがあると結論付けてしまう過誤)を起こす確率が仮説(i.e.検定)の数が増すにしたがって上昇することが理論的に分かっているからである.しかし3群以上のグループ間の比較の際,分散分析を経ずに直接Tukey法(多重検定)を用いることは問題がないとする立場もある.

 

(イ)  データの正規性が確保されなかった場合,または名義尺度や順序尺度を用いている場合(ノンパラメトリック手法).2群を比較する場合はMann-Whitney U検定,Wilcoxon Signed-Rank検定を用いる.2群間の相関を求める場合は,SpearmanまたはKendallの順位相関係数を用いる.有意水準はパラメトリック手法と同様,通常5%,あるいは1%とする.3群間以上の比較の場合はKruskal-Wallis検定を用いる.結果が有意な場合は(p<0.05),パラメトリック手法と同様,ポストホック分析(多重検定)によって各群間の違いをそれぞれ検定する.多重検定ではSteel-Dwassの方法を用いることが推奨されているものの,統計ソフトによってはこれが不可能な場合もある.その際は,各群間でMann-Whitney U検定,あるいはWilcoxon Signed-Rank検定を行う(i.e. A群vs B群,B群 vs C群,C群 vs A群).その際,第一種の過誤を起こす確率が仮説(i.e.検定)の数が増すにしたがって上昇することが理論的に分かっているため,有意水準を検定の数で割ることによってより保守的な判断をおこなうようBenferroniによって提案されている.たとえば3群間の比較をおこなう場合は検定を3度行う必要があるため,有意水準5%の場合は5%÷3≒0.016,有意水準1%の場合は1%÷3≒0.003と変更した上で,結果を評価する.

 

(ウ)  たとえば,術後の変形性膝関節症の患者の6ヵ月後のADLを予測する因子として,年齢,性別,大腿四頭筋筋力,膝関節可動域,自己効力感(i.e.自信)の5因子を考えているとする.その場合,半年後のADLを従属変数(アウトカム)として,5つの因子との関連を個別に相関分析をおこなう方法が考えられる.しかしそれによって得られた結果は,あくまでも二つの変数の間に生じた関係を表しているに過ぎず(e.g. ADLと大腿四頭筋筋力),その関係を修飾する他の因子,たとえば年齢,膝関節可動域,自己効力感の影響は加味されていない.単変量解析ではその他の修飾因子を検討することができないため,得られた結果を解釈する上では制約が大きい.重回帰分析,ロジスティック回帰分析,因子分析,主成分分析などは,これら修飾因子の影響を加味した上で[1],注目している変数とアウトカムとの関係を示してくれるだけでなく,それぞれの因子がどのようにアウトカムに関与しているかを一度に示してくれる.多変量解析は,今後保健科学分野の研究では一層重要度が増してくることが予想される分析手法である.

 

結果のまとめかた

 

観察(計測)により得られた結果を論文にまとめる際に留意すべきことは;

 

1)研究目的に答えることのできるデータを示すこと

 

2)観察された結果をわかりやすく要約すること

 

である.決して,結果を故意に捻じ曲げたり,自分にとって都合の良いデータばかりを並べてしまってはいけない.ただ生データを読者に分かりやすい形に‘翻訳’することは必要である.たとえば,平均値を使うことによって集団の特性をひとつの値に翻訳すること,あるいは,統計を用いてグループ間の比較を客観的に行った結果を示すことで,読者の理解は助けられるだろう.さらにグラフや表を効果的に用いてデータを視覚化することによって,読者の理解は一層進むだろう.重要なことは,読者が結果を読んだあと,読者自身で結論づけするに十分な量のデータを,有意味なかたちに翻訳・サマライズして示すことである.

 

また,自分に都合の悪いデータを掲載しないのは良くないが,重要でない枝葉末節までこまごまとここに示すのは,読者の理解を妨げるだけである.何を訴えたいのか,その優先順位に従ってデータを示し,限られたスペースを有効に使う必要がある.またここでは,一般的には著者の解釈を付け加えない.それは【考察】のセクションでおこなう作業だからである.たとえば,「相関係数がr=0.75であった.」と記述するのはよいが,「相関係数がr=0.75であり,両変数の関連は非常に強いことが示唆された」と記述するのは,解釈が伴っているため不可である.このような解釈は考察でおこなう.

 

グラフや表を効果的に使うことによって,読者の理解は深まる.しかし,使い方には一定のルールがある.すなわち;

 

データはグラフ,あるいはテーブルのどちらか一方で示すことはできるが,同じデータをグラフと表の両方を用いて提示することは避ける.

 

グラフを必要以上にカラフルにしたり,三次元表示などで装飾したりすることを控える.内容よりも見た目ばかりが強調されるからである.色を使用するよりも,グラデーションや模様などを使って,シンプルに表現する.

 

棒グラフ,折れ線グラフ,ヒストグラムなどの軸(縦軸,横軸)の原点はゼロとする(ゼロ点で縦軸と横軸が交叉するようにする).もしゼロ以外に原点を設ける場合は,縦軸と横軸が交叉しないグラフを作成する.

 

表を作成する際,縦線は原則として使用しない.

 

表やグラフのタイトルは,本文を読まなくてもそれが何を示しているのかわかるよう,具体的かつ詳細に記述する.

 

グラフのタイトルはグラフの下に,表のタイトルは表の上に記述する.

略語は原則として使用しない.やむを得ず使用する場合は,フットノート(脚注)として,「略語 PT:Physiotherapist」などと表示する.

 

[1] これを統計用語では,調整(Adjustment, control)と呼ぶ.