これは僕の勉強整理メモです。間違え等ございましたらご指摘ください。
今までのお勉強日記はこちらです。
[2つの結果の比較をどうするか]
統計的有意性を検定(統計学お勉強日記②を参照)するには様々な手法がありますが、なかなか理解しにくい用語もあり、その全容をつかむのは困難です。また統計的有意差は実は手法により意図的に生み出すことができるという側面も持ち、とりあえずエビデンスを活用するという観点からすれば、統計的手法をどう理解するかではなく、どのような場合にどのような統計手法が適しているかを把握するだけで十分だと個人的には思います。僕が理解できた範囲で、今回は実際の臨床試験に用いられている統計解析手法についてまとめてみます。まずはパラメトリックとノンパラメトリック、から確認です。
パラメトリック(正規分布する):症例数が多くばらつきが少なければ正規分布しやすくなります。この場合パラメトリックStudent t-testやPaired t-testが使用可能です。このような検定では比較的有意差がでやすいといわれています。
ノンパラメトリック(正規分布しない):症例数が少なく、ばらつきが大きければ正規分布しにくくなります。この場合Mann-Whitney‘s U testやWilcoxon signed-rank
testを用います。正規分布に従うか迷う場合はノンパラメトリック解析を選択すべきと言われています。有意差が出にくいノンパラメトリック解析を用いることで、有意差の過大評価を避けるためです。
では具体的に対応のある場合、対応のない場合とパラメトリックかノンパラメトリックかで、どのような検定手法を用いればよいかまとめます。
「対応のある」…投与前後比較など、同一個体の2種類の観測値を比較検定。薬を飲む前と後で変化はあるのか?
■パラメトリック:Paired t-test:対応のあるt検定
対応するデータの差の平均値が0からどの程度偏っているかを検定する方法です。
■ノンパラメトリック: Wilcoxon signed-rank test:ウィルコクソン符号付順位検定
データの分布形態を問わずに使うことができ、正規分布の適合性が不明な場合はこちらを用いるのが無難といわれています。
「対応のない」…2群の平均値の比較など、同一でない2種類の観測値を比較検定。独立した2群のデータに有意差があるか?
■パラメトリック:Student t-test:スチューデントのt検定
平均値を比較して検定します。症例数が多く、ばらつき(2群の分散が一緒)が均一なときに使います。
■ノンパラメトリック:Mann-Whitney‘s U test:マン・ホイットニ検定(MWU)
中央値を比較して検定します。症例数が少なく、ばらつき(2群の分散が一緒)が異なるとき使います。正規分布に従うかどうか不明な場合はこちらを用いるのが無難だそうです。
[χ2乗検定:χ2 test]
2群間が0-1型の(あり、なし)データの場合、χ2 testを用います。例えば男女比(男=1、女=0)喫煙歴(あり、なし)や疾患既往歴(あり、なし)など。比較的簡単に計算できるχ2乗検定ですが、繰り返し検定を行うと偶然有意差が出やすくなる確率(αエラー:本当は差が無いのに差があると判断してしまう)が出やすくなります。
[2つ以上の結果を比較する…分散分析]
例えばA、B、C、D、E、Fという6種類の医薬品の比較をすべて行う場合、6C2=15通りの比較を行うことになりますが、有意水準5%で繰り返し仮説検定を行うとする。15通りの比較の中で少なくとも1回以上有意となる確率は1-(1-0.05)15=0.5367で約54%となってしまいます。このように2群間同士を繰り返し多重検定すると有意差が出やすくなるため(αエラーの増大)、多重検定を行うのはナンセンスです。このような場合に分散分析という手法を用います。分散分析ANOVAとは、3群以上の平均値間比較を行う方法です。
■対応のない3群間の検定
パラメトリック:One way ANOVA
ノンパラメトリック: Kruskal-Wallis test
■対応のある3群間の検定
パラメトリック:One way repeated measures ANOVA
ノンパラメトリック: Friedman test
[Kaplan-Meier法の生存曲線]
Kaplan-Meier法の生存曲線は、ある因子の有無で分けた2群において、死亡までの期間または観察打ち切りまでの期間を表します。死亡するまでの時間だけでなく、イベントが発生するまでの時間(癌再発や心筋梗塞発症など)にも使用できます。また、打ち切りが扱えるのが生存分析の利点といわれています。
打ち切り例とはエンドポイントに至っていない追跡症例のことで 観察期間を終わった時点で生存している症例や他の原因で死亡した症例消息不明例などです。打ち切りが多いと問題があることもあり、特に消息不明例の場合には死亡の可能性も含みデータの信頼性が低くなることがあります。Kaplan-Meier法において、2群間の差は、Log-rank test(全期間を通じての生存曲線の差を比較するノンパラメトリック検定)あるいは一般化Wilcoxon検定で行われます。
[多変量解析(Multivariate analysis)]
「多くの個体について、2つ以上の測定値(身長や体重、年齢、病期、BMI、教育水準など)がある場合、これらの変数の相互関連を分析する方法の総称」です。独立変数(x) とは、学歴、病状分類、性別など結果:y に影響を与える因子のことをさします。従属変数(y) とは、生存の有無、発症の有無など、xの影響による結果の値、結果の状態をさします。
■独立変数(x)結果yに影響を及ぼすと考えられる様々な因子。
■従属変数(y)生存の有無や発症の有無等の結果の値。
結果の値(従属変数:y)に対して複数の因子(独立変数:x)の影響を知りたい場合に多変量解析を使います。主にCox回帰比例ハザード分析、ロジスティック回帰分析、重回帰分析などが使用されます。
Cox回帰比例ハザード解析
時間的要素を考慮しなければならず、従属変数が0-1の2値型(ある、なし)の場合にもちいます。試験デザインは主にランダム化比較試験やコホート研究などで採用されていることが多いです。従属変数(y)イベントが起こった群(1)と起こらない群(0)の2群に対して、時間的要素も考慮して複数の独立変数(x)の影響度合いを解析する方法で、相対危険はハザード比で表されます。
ロジスティック回帰分析
時間的要素がなく、従属変数が0-1の2値型(ある、なし)の場合、例えば症例対照研究などで用います。1つの従属変数(y)に対して複数の独立変数(x)の影響度合いを解析する方法で相対危険はオッズ比で近似されます。
重回帰分析
時間的要素がなく、従属変数(y)が点数、身長、採血値などの量的データ、独立変数(x)も量的データの場合(2値ではなく連続値)に用いられます。連続値を解析する手法なので重大なアウトカム発症の有無などを検討する重要な臨床試験に用いられることは稀です。
Cox 回帰とロジスティック回帰の比較してみます。共通点としてリスク因子がエンドポイントの発生確率を何倍引き上げるのかを示す推定値を算出できます。ロジスティック回帰ではオッズ比(補足参照)、 Cox 回帰ではハザード比で求められます。ロジスティック回帰では、観察開始後一定期間以内に起きたエンドポイント発生の有無のみが情報として用いられるため、エンドポイント発生までの時間的要素はありませんが、Cox 回帰では、エンドポイント発生までの期間がモデルに組み込まれているため、観察期間全体を通しての時間的要素のある比較が行われます。
[ランダム化比較試験での統計解析例]
例えば2群間の死亡リスクを統計解析する場合
■生存率の推定・・・Kaplan-Meier法の生存曲線を用いた生存率の推定
■生存率の差の検定…Log-rank test
■相対危険の推定…Cox回帰比例ハザード解析
インパクトのある重要なランダム化比較試験では時間の経過による死亡有無のような2者択一アウトカムという例が多いため、このような3段階がオーソドックスな統計手法と言えます。論文の結果の表から発生率を用いて直接相対リスクを算出しても最終的なハザードリスクと微妙に一致しないのはこのような統計解析による調整がなされているためです。コホート研究でも同様の手法が採用されていることがあるようです。コホートもランダム化がされていないだけで、時間の経過と2者択一アウトカムという試験デザインが可能だからです。一方で症例対象研究では、既にアウトカムの発症あり、なしを集めていますので時間の経過は関係ありません。この場合ロジスティック回帰モデルが用いられます。特に症例対象研究では条件付きロジステック回帰分析と言う手法が用いられるようです。
(補足)オッズ比とは
オッズ比とはある事象が起こる確率と起こらない確率の比です。たとえば宝くじが当たる確率が10%としましょう。当たらない確率は90%ですからオッズ比は
10%/(100%-10%)=0.11となります。
オッズ比は相対リスクと同じように関連を示す指標として使用できます。要因と疾患の関連がなければオッズ比は1となり、要因への暴露が疾患の増加と関連すれば1よりも大きくなり、逆に疾患が減少すれば1よりも小さくなります。
以下の症例対照研究の例をもとに肺癌は喫煙と関連するのか推定します。
|
肺癌あり(ケース)
|
肺癌なし(コントロール)
|
喫煙あり
|
80人
|
20人
|
喫煙なし
|
20人
|
80人
|
この例ではケースにおいて喫煙への暴露割合は80%でした。
ケースにおける要因へのオッズ比は80/20=4
またコントロールでは喫煙への暴露割合は20%でした。
コントロールの要因へのオッズ比は20/80=0.25
したがってこの研究でのオッズの比は4/0.25=16となります。
|
肺癌あり(ケース)
|
肺癌なし(コントロール)
|
喫煙あり
|
a人
|
c人
|
喫煙なし
|
b人
|
d人
|
簡単にケースとコントロールのオッズ比を公式化すると
オッズ比=a×d / b×c となります 80×80/20×20=16となりますね。たすき掛け比なんて呼ばれています。
0 件のコメント:
コメントを投稿