[お知らせ]


2013年5月22日水曜日

製薬企業の医薬品情報パンフレットの取り扱い方


製薬企業の作成したわれわれ医療従事者向けの医薬品情報に関するパンフレットはメーカーの都合のよい情報が一見わかりやすく、実はその妥当性を考えようとした時にとても分かりにくく書いてあると言えます。今回はメーカーの主催する勉強会や情報提供などでMRさんから手渡される製品情報パンフレットの考え方をまとめていきたいと思います。

新薬などの発売において製薬企業が展開する営業活動は実に巧みで、見た目もきれいな製品情報パンフレットは眺めているだけで、「ほうほう、こんなに効果があるのか」と勉強した気にさせられます。これが新規作用機序の薬剤であれば薬剤師としては大変興味深い資料であることに間違えありません。ただその解釈には少し注意が必要です。

[基本的なデータの考え方]
製品情報パンフレットには人を対象とした臨床試験の臨床成績が掲載されていることが多いですが、よくあるパターンが、「この薬剤は血圧を○○下げました」とか「HbA1cを○○下げました」みたいなコメントに、どでかくグラフがついていて、「有意差あり」みたいな感じの情報が掲載されていることがあります。ラットやマウスのような動物実験のデータのみ記載されている資料はここでは論外とします。(※動物実験等の基礎研究は大変重要でありますが、その結果を人にも応用可能であると考えるのは理論が飛躍しすぎています)

まず確認していただきたいのが何と比べて下がったのかということです。
投与前後を比較したデータは危険なパターンです。たとえば投与前と投与後で有意に血圧が下がったというデータが示されていたら、もしかしたら、このデータを取る際に食事療法や運動療法を併用していたかもしれませんし、何よりもプラセボ効果というものが排除できません。このような比較は意味がありません。必ずプラセボと比較してどうなったか?という検討が必要です。特に治療の効果を検討する場合は対象患者を無作為に治療群とプラセボ群に分けるランダム化比較試験という試験デザインが一般的です。こうすることで患者背景が偏ることなく試験を実施できます。さらに患者さんや医療者が実薬かプラセボかをわからなくするために2重盲検法という手法でブラインド化することがプラセボ効果を抑えるうえで有効です。

実はこれでもまだ少し問題があります。プラセボと比較してどうなったか、の他に、どんな指標を改善しているか?ということです。意味のない指標を改善していても薬として存在する意義はありません。仮に血圧をプラセボと比べて20mmHg 下げました。というデータだったとしたら、その20mmHg にどんな意味があるのでしょうか。高血圧の治療目標は血圧を下げることによって将来的に起こり得る脳卒中などの脳血管疾患リスクを低下させることにあります。したがって血圧を下げることは手段であって目的ではないのです。目的でない指標を改善したところで、「ふーん」という以外にコメントのしようがありません。「で、結局脳卒中リスクはどの程度下がるの?」という疑問の答えにはならないのです。このように血圧のような「代用のアウトカム」を改善するというデータはしばしばメーカー資料に引用されています。骨密度や血糖値、HbAC1の改善にどれほどの意味があるのか。よくよく考えねばなりません。本来であれば骨密度ではなく、骨折リスクが、HbAc1ではなく糖尿病合併症や総死亡が、というように真のアウトカムがどの程度改善されるのか、ということが大事なのです。僕の経験上真のアウトカムについて言及した製薬企業の製品パンフレットは少ないです。

[たとえ真のアウトカムが改善したと記載があっても…・]
近年発売されたω3脂肪酸エチル粒状カプセル(EPADHA製剤)は「高脂血症」に適応を持つ薬剤でその製剤パンフレットの臨床成績(海外データGISSI-Prevenzion)には42か月投与において、トリグリセリドがプラセボに比べて有意に低下しているグラフが大きく示されています。その下には総死亡、突然死、心血管死亡の3種類のグラフの記載があり、それぞれ、プラセボに比べて6か月と12か月時点で有意に抑制されていることが示されています。トリグリセリドは代用のアウトカムですが、それ以外は真のアウトカムといえそうです。
■プラセボとの比較
■総死亡、突然死、心血管死亡とそれぞれ真のアウトカムと言える指標の改善
これだけを見れば、先ほどの確認ポイントは見事クリアしており、この薬剤は効果が期待できそうな感じがします。しかしながらこのデータにはやはり問題があるのです。メーカーパンフレットの使い方として、そのデータが引用された引用文献をもとに原著論文をあたってみるという作業が必須ですが、原著論文を読むのはなかなか時間のかかる作業です。以下のようにふるい分けを行うのが僕流のメーカーパンフレットの取り扱い方です。捨てずにためておいても邪魔ですしね。
■動物実験のみのデータやプラセボ比較でないものは論外。それ以上読まず捨てる。
■代用のアウトカムしか検討していないものはほとんど参考にならないのでこれも捨てる
■真のアウトカム(特に死亡)を評価しているものは原著まで読む

では実際に引用されていた論文を見てみましょう。この論文はフリーで全文が入手できますのでダウンロードしてみてください。

【文献タイトル・出典】
Early Protection Against Sudden Death by n-3 Polyunsaturated Fatty Acids Aftter Myocardiol Infraction time-Course Analysys of Resylt of Gruppo Italiano per lo Studio della Sopravvivenza nell’Infarto Miocadisco(GISSI)-Prevenzione
【論文は妥当か?】
研究デザイン:ランダム化比較試験
[Patient] 心筋梗塞発現後3か月以内(平均16日以内)の患者11323人(女性14.7%、平均年齢59.3歳±10.6歳、総コレステロール211mg/dl±42、糖尿病14.9%、BMI3014.7%、血行再建術 ベースライン:5%⇒42か月後24.0%、コレステロール低下薬の使用 ベースライン:4.7%⇒42か月後45.5%)
[Exposure] ω3系不飽和脂肪酸1g/
[Comparison]コントロール(ω3系不飽和脂肪酸投与なし)
[Outcome]総死亡・非致死的心筋梗塞、非致死的脳卒中の複合エンドポイントと、心血管死亡・非致死的心筋梗塞、非致死的脳卒中の複合エンドポイント
■患者背景は同等か?:Teble1の患者背景には研究集団全体のデータしか示されていない
■盲検化されているか?:されていない:オープンラベル
■サンプルサイズは十分か?:結果に有意差があるので十分だと思われる
intention-to-treat解析されているか?:されている
■追跡期間:3.5
【結果は何か?】プライマリアウトカムは以下の2つ
42か月後の総死亡・非致死的心筋梗塞、非致死的脳卒中の複合エンドポイントはE群で12.7%、C群で14.1%でありE群はC群に比べて15%低い
ハザードリスク:0.8595%信頼区間0.740.98
42か月後の心血管死亡・非致死的心筋梗塞、非致死的脳卒中の複合エンドポイントはE群で9.8%、C群で11.0%でありE群はC群に比べて20%低い
ハザードリスク:0.8095%信頼区間0.680.94
【結果は役に立つか?】
プライマリアウトカムの結果だけを見るとなるほど、確かに減少しています。ただ気になるのが患者背景です。心筋梗塞発症後平均16日という超ハイリスク集団です。これは血行再建術がベースランで5%であるのに対して、42か月後では24%へ上昇していることからもわかります。適応症は「高脂血症」となっていますが、この研究自体がハイリスク集団を対象としており、高脂血症といわれるような状態の患者すべてに期待できるようなものでもありません。またオープンラベル試験であることも問題で、患者背景をみても魚の摂取量や生野菜の摂取量、オリーブオイルの摂取量などがバースラインと比べて42か月後で上昇しています。さらに問題なのはコレステロール低下薬の使用がベースラインで4.7%だったものが、42か月後には45.5%まで上昇しており、ω3系不飽和脂肪酸単独の効果を見るにはやや難しい状況となっています。このように妥当性にやや問題が多いため、この辺りを考慮すればプライマリアウトカムの結果に有意差は無くなる可能性が非常に高いといえます。

試験の妥当性そのものも低いと言わざるを得ないのですが、一番の問題は、パンフレットに引用されていた総死亡、突然死、心血管死はこの研究ではいずれもセカンダリアウトカムに設定されていた指標であくまで仮説生成の指標に過ぎず、薬剤効果を決定づけるものでは全くないということです。

[ランダム化比較試験のアウトカムとサンプルサイズ]
一般的に臨床研究(ランダム化比較試験)において最も優先順位が高く、偶然の影響が少ない治療効果判定のための指標をプライマリアウトカム(一次アウトカム)と呼びます。一つの臨床研究で検証できる仮説はこのプライマリアウトカムだけであり、それ以外のセカンダリアウトカム(二次アウトカム)や、年齢別、既往症別などで検討したサブグループ解析の結果は仮説を生み出すための指標に過ぎず、偶然の影響を受けやすいといわれています。

薬の効果を人類すべての人を対象に実施すれば確実なデータが取れますが、実際に不可能です。臨床試験は限られた参加者(サンプル)を対象に、患者全体における効果を推論するというスタンスで結果の統計解析が行われています。
例えば中身の見えない容器の中に黒と白のビー玉が全部で100個入っていたとします。仮に容器から10個取り出して黒が8個、白が2個出て多とします。容器の中には黒玉が80個、白球が20個入っていると言えるでしょうか?実際には50個ずつはいっていいて、偶然黒が8個も出てきて、白が2個しか出てこなかったという可能性も考えられます。
100個のビー玉が人類全体で10個のビー玉が研究参加者=サンプルです。取り出数を10個から20個へ増やせば、黒と白の比率がビー玉全体の比率に近くなることが経験的にお分かりいただけると思います。すなわちサンプルサイズを10から20へ増やすことで偶然の影響を抑えることができますね。

実際にはサンプルサイズは以下の情報をもとに決定されます。
■検出するべき効果の差(効果量)
■1つの群における効果の推定値
■統計的有意水準α
■期待する統計学的パワー(1-β)
■片側検定か、両側検定か

αとは有意水準のことで、実際には差がないのに差があると誤って結論する確率のことです。このような過誤はαエラーと呼ばれ、その基準として一般的には0.055%)を用いることが多く、P値(有意差)に相当するものと解釈して問題ないと思います。ここでは簡単に「偶然に差が出る確率」と言い換えると覚えやすいです。裏を返せば20回に1回は差がないはずなのに差が出てしまうということで、αエラーは侮れません。(臨床試験の20回に1回はαエラーが出ていることになる)
βとは実際には差があるのに差がないと結論する確率のことです。サンプルのサイズが小さいと、実際には差があるのに、差が出ないことがあります。これをβエラーと呼びます。1-βは実際に差が出ることを差が出ると正しく結論する確率で、これが高いほど結果の検出力が上昇します。一般的には統計学的パワー80%等の数値が用いられます。


α=0.05、パワー0.8でサンプルサイズを計算するということは、実際に差がないのに誤って差が出る確率が5%で、差があることを正しく結論できる確率が80%となることを示しています。さらに実際には2群間の治療の差(効果量)をどの程度見積もるか、片側か両側か、2群のうちで低い方の治療率の期待値を設定しサンプルサイズが決定されていきます。僕は統計学を専門的に学んだわけではありませんので、このあたりの詳細は分かりませんが、この5つの要素とそれぞれのサンプルサイズが一覧表になったものが統計学の教科書に引用されているといいます。ここではαエラーとβエラーをおさえるだけで、この先の理解に支障はありません。

一つの臨床試験ではこのようにしてサンプルサイズが決定されて、臨床試験で評価したい指標=アウトカムのデータの取り扱いが決定されています。αやβといった数値はプライマリアウトカムのみに適用できる数値であり、それ以外の指標にはそのまま適用できません。たとえばアウトカムが2つであればαエラーの確率は0.05×20.1となります。10%ともなると、かなり偶然の影響を受けることになりますよね。ですからこの場合0.05÷20.025を仮の有意水準として解釈する必要があります。この2で割るという補正をボンフェローニ補正といいます。セカンダリアウトカムに対して、あるいは複数のアウトカムを設定してる場合はαエラー5%という確率をそのまま適用できないのです。このパンフレットに引用されている総死亡、突然死、心血管死の数値は0.05で有意差ありと本来はしてはいけないのです。

またサブグループ解析は、患者全体を解析するわけではなく、年齢別、既往疾患別、性別などの層別で解析を加えるものですが、サンプル数が減少するため統計学的パワー(1-β)が減少します。したがって本来差があるのに差が出にくいというβエラーが起きやすくなります。それだけではなく、せっかくランダム化して背景因子をそろえたものが層別化により偏りが生じている可能性もあるのです。さらにサブ解析は解析指標が多数にわたります。12個のサブグループで解析し、12個のアウトカムがあるならば、20回に1回エラーが出てしまうαエラーの可能性も上昇するのです。たとえば生まれた月で死亡リスクのサブ解析を行えば8月生まれだけ死亡リスクが高いというような結果も出てくる可能性があるのです。サブ解析の結果を僕流に一言で示すなら「有意差が出やすく(αエラーの上昇)、また出にくく(βエラーの上昇)、結果の妥当性は信用に値しないが、仮説として軽視すべきではなく他の類似の研究を調べてみる必要がある」という感じでやってます

[製薬メーカーのパンフレットをきっかけに…]
プライマリアウトカムに有意な差が認められなかった臨床試験論文においてはセカンダリアウトカムで差が生じたことが強調されたり、群間比較なのに治療群の前後の比較で効果を強調したりと試験の結果と論文の結論に大きく相違をきたすことがあります。

Boutron et al. Reporting and interpretation of randomized controlled trials with statistically nonsignificant results for primary outcomes JAMA. 2010 May 26;303(20):2058-64

さらに製薬企業がスポンサーの臨床試験ではプライマリアウトカムにあまり良い結果が出ないときはサブグループ解析の結果を誇張されるケースもあのです。

Sun X et al. The influence of study characteristics on reporting of subgroup analyses in randomized controlled trials : systematic review  BMJ 2011 Mar 28;342:d1569

いったい何がプライマリアウトカムなのか、メーカーパンフレットは何も語っていません。とにかく良い結果だけをでかでかと伝えているだけです。また臨床データの対象患者も今、目の前の患者と同等なのかという面もまったく考慮されていません。実際にメーカーパンフレットが今目の前の患者の役に立つことなどほとんどありえないのです。ただ、こういったパンフレットは、実際のところどうなんだろうという新たな疑問を与えてくれ、原著論文をひも解くことで、実際に臨床へどう生かせば良いか、この結果は自分が関わる患者さんの役に立つかどうかという思考を与えてくれます。大事なのはメーカーパンフレットを眺めながらお弁当を食べるのではなく、パンフレットという材料を肥やしにその薬剤効果が妥当か、その効果は何か、その効果は役に立つか、ということを調べるきっかけになっているということに気付けるかどうかということです。

0 件のコメント:

コメントを投稿