Blogger版　地域医療の見え方: ランダム化比較試験とは何ぞや

僕のブログでもよく登場するランダム化比較試験。以前にこの試験に関する論文の見方を簡単にご紹介したことがあります。EBMについて（２）ランダム化比較試験論文の吟味　論文を読むという観点からまとめたつもりなので、いまいちわかりずらいかもしれません。そもそも“ランダム化比較試験”とは何ぞや、と思われる方も多いのではないかと思います。簡単に言ってしまえば、「薬の有効性について検討するための実験方法として一番妥当性の優れた研究方法」といえるのかもしれません。実際、様々なガイドラインにおいてもランダム化比較試験のエビデンスレベルは最高位に位置しています。

[ヒヤリハット件数を記録し続けることに意味はあるのか？]

調剤薬局に勤務している薬剤師の方ならお分かりいただけると思いますが、日々の日常業務において、調剤ミス（調剤過誤ではなく、薬局内での薬剤取り違えミス）をヒヤリハット事例、なんて呼んでます。“ヒヤリ”とした事例“ハット”とした事例というものを合わせて単にヒヤリハット事例なんて言っていますが、僕的にはセンスの無いネーミングだと思います。こうした事例は全国的にも分析収集され一般公開されています。

公益財団法人日本医療機能評価機構：薬局ヒヤリハット事例収集分析事業　僕自身もこのシステムへ参加をしていたこともあり、薬局内での事例収集を結構本気で取り組んでいたこともありました。ある程度規模の大きい調剤薬局企業では会社独自に事例を収集し情報共有しているところもあるかと思います。こういった取り組みは日本薬剤師会の学術大会などでポスターにまとめて発表された経験のある方も多いと思います。

僕もこういった事例収集はどんな間違えの傾向があるのかなど、一定の期間、短期的に取り組むのは有用な情報になりえると思いますが、ルーチンに毎月、件数を報告しているのはまったくもって時間の無駄だと思います。それもミスの件数のみの集計というのは、それを管理している人の自己満足に過ぎません。それに付き合わされる管理薬剤師はたまったもんではありません。まあこれは僕の主観ですが、ミスの件数の集計には意味があることなんだ、という主張をぶち破るために僕は以下のような考えを企てたことがあります。まあこの提案は半分冗談でしたし、結局採用されませんでしたが、ランダム化比較試験についてちょっと、この例をもとにその基本的な考え方をご紹介したいと思います。間違ってたらすみません。ご指摘いただければ幸いです。（※例に示した統計量は説明のために用いたもので、実際に計算して導かれたものではありません。）

[「ミスの集計に意味があるんだよ」というのは何に基づいた根拠なのか]

自分の主観的な意見で、こうすればいい、ああすればいいとかいいっている人がいますが、何を根拠にいいのか、まるきり理解不能なことがあります。何の根拠もなしにミスの集計を毎月継続することが大事なんだという主張はまったくもって理解不能です。そもそもなんのために集計しているのか、ミスの傾向を把握し、重大な過誤を未然に防ぐための集計です。そんなものは短期での集計で問題なく、薬局の採用薬剤の半分以上が入れ替わるとか、毎月人員が異動しているとか、よほどのことでないかぎり、その集計結果は変わりません。これは僕が集計して客観的な数字を自分で確かめたことなので、多分そう言えます。通常の調剤業務は毎月来局する患者層に大きな変化がない限り、安定してミスの件数も推移していきます。人員が異動すれば不慣れな分ミスも増えますが、これは、あたりまえのことなので、集計をとって、先月よりも件数が増えているから、こりゃ大変だ、会議をしなきゃ、なんて発想になるのはまったくもって時間の無駄です。こういうことを言い出す方はたいてい集計表しか見ていない人たちです。現場にいればその原因は明らかです。なのでミスの件数を毎月毎月集計して、考察をつけて報告書を出す、なんて作業を延々続けるのは時間の無駄以外の何物でもありません。それでも“意識づけに必要なことなんだ”とか、“ミスが増えないのはこの取り組みのおかげだ”と言い張る人のために、以下のような検証実験をしてみたらいいと思います。

[ミスの集計という取り組みは有効か？]

この方法で本当に検証できるかわかりませんし、以下の事例は仮想事例です。あくまでランダム化比較試験のイメージが伝わればよいかなと思っています。

[仮想事例]あなたは日本全国に200店舗展開する大手調剤薬局企業の一店舗の管理薬剤師をしています。店舗は慢性的な人員不足で、日々の日常業務で精いっぱい。でも丁寧に仕事をすることでこれまでに大きな過誤はおきていません。ただ忙しい業務のため、どうしてもヒヤリハット事例は数多く出てしまいます。月末の忙しいとき、上司から電話が鳴りました。今月のヒヤリハット集計が提出されていないんだけど今日中に送ってくれ…」

この忙しいときにミスの集計表だと…とキレそうになるあなたはこの取り組み自体の廃止を提案しようと試みます。頭の固い上司をどのように説得すれば良いのでしょうか。ある調査をしてみることにしました。

[取り組みをした店舗と取り組みをしなかった店舗を比較する]

まず、グループ全体で200店舗もある会社なので、そのヒヤリハット集計データも膨大です。そのために、そこから20店舗をランダムに選び、その20店舗をさらにランダムに2つのグループに10店舗づつわけます。グループＡの店舗群はヒヤリハット集計を継続します。グループＢの店舗群はヒヤリハット集計の取り組みを完全に廃止します。そして、調剤過誤の件数を比較するのです。

200店舗→20店舗→ヒヤリハット集計を継続する10店舗（グループＡ）

ヒヤリハット集計を中止した10店舗（グループＢ）

なぜランダムに振り分けるのか、店舗ごとに薬剤師のレベル（たとえば勤続年数など）や処方箋枚数が異なり、たとえばグループＡに処方箋枚数がやたら少ない店舗が偏ったり、ベテラン薬剤師が偏ったりすれば、ヒヤリハット集計の取り組みとは別の要因で調剤過誤の件数に影響が出てしまうからです。ランダムに振り分ければこのようなばらつきは理論上平均化されてフェアな比較ができるというものです。評価のバイアス（偏り）を避け、客観的に効果を検証するにはこのランダム化がキーポイントになります。ランダム化されていない試験は、その試験そのものに偏りがあり、結果の評価に大きく影響を及ぼす可能性があるのです。

この実験の概要は以下のような感じです。

どんな対象▶企業全体200店舗からランダムに抽出した20店舗のデータ

どんな介入▶調剤ミスは従業員間で情報共有したうえに調剤ミスの件数をひたすら記録し、その数を集計し考察を付け加えるヒヤリハット集計レポートを毎月作成

何と比べて▶丁寧に仕事をして、調剤ミスは従業員間で情報共有する。特に集計はしない

何を評価するか▶実際に発生してしまった調剤過誤件数とその発生割合

グループを2つに分けて6ヶ月間ほど実験を続け各グループの調剤過誤件数と処方箋件数で割った過誤の発生率を求めます。結果は以下のようになりました。あくまで仮想ですよ。実際に半年で過誤が10件は多いですよね…。

■グループＡ：過誤の発生件数▶10件/9200件（0.10％）

■グループＢ：過誤の発生件数▶14件/9300件（0.15％）

グループＡ、すなわち集計を継続していた店舗群では取り組みをやめた店舗群に比べて

0.15%－0.10%＝0.05%件数割合が減ったことになります。この差を絶対差といいます。

また相対的には0.1/0.15＝0.67でグループＡの過誤件数割合はグループＢに比べて67%であり、その件数割合は33%も減少したことになります。

この結果をまとめて、ヒヤリハット集計の継続は取り組みをしない場合に比べて、33%の件数の割合を減らすことができました。これはすごい取り組みです！なんて称賛するのはまだ早いです。そもそも絶対差はたった0.05%ですから…。

[結果の数値は偶然でないといえるのか？]

■グループＡ：過誤の発生件数▶10件/9200件（0.10％）

■グループＢ：過誤の発生件数▶14件/9300件（0.15％）　[Ｐ＝0.54]

この結果が偶然でないといえるのでしょうか。たまたまこのような結果になっただけだ、と突っ込みたくなりますが、ここで有意差という言葉が登場します。”有意差あり”を簡単にいえば「偶然という確率はあまりにも低い」です。ちなみに偶然という確率は経験的に0.05、すなわち5%といわれています。有意差をＰ値と表しますが、Ｐ≦0.05と表記されれば、その結果は偶然ではないといえるのです。この有意差、実際にはｔ検定なるものを行い統計的計算を行うのですが、僕にはこのあたり全く理解していないのでここではふれませんが、有意差の意味を知るだけで、2つの数値の差に意味があることなのか判断できるという意味で大変重要な値です。仮にこの0.10%と0.15%という結果においてP=0.54という結果が導かれたとするならば、この結果の差は偶然である確率が54％ということになり、もはやコインを放り投げて裏か表が出る確率と同等みたいなことになっているのです。

[たかだか20店舗の結果がはたしてグループ全体に当てはまるのか？]

200店舗すべてを調べるわけにはいかないのでそこから20店舗分のデータを抽出したわけですが、このサンプリングしたデータの結果がはたしてもとの200店舗すべてに言えることなのかという突っ込みも期待できます。

ここで95%信頼区間という言葉が登場します。

■グループＡ：過誤の発生件数

▶10件/9200件（0.10％：95%信頼区間0.06％～0.20％）

■グループＢ：過誤の発生件数

▶14件/9300件（0.15％：95％信頼区間0.07％～0.18％）

[Ｐ＝0.54]

95％信頼区間は最小値～最大値という範囲で示されますが、いったい何の範囲かというと、20店舗で得られた結果が200店舗全体に当てはめた時、はたしてどの程度のずれが生じるのか、そのずれ幅を示しています。このずれ幅の範囲の中に真の値が95％の確率で存在しますよ、ということになります。厳密な定義とは異なるかもしれませんが、サンプリングされた限られたデータの平均値から母集団の真の値を類推すると、こんな感じの範囲ですというものを示しています。この結果でいえばグループＢは大きく見積もると0.18％、グループＡも大きく見積もると0.2％、どうでしょう、取り組みを継続したグループＡで過誤の割合が増えてしまいました。

ランダム化比較試験は医薬品の有効性を検討するうえで大変重要な試験デザインです。ランダム化比較試験とその結果の解釈方法が分かればある程度論文を読み進めることができます。ある程度その概要がつかめたら試験の批判的吟味を行うことで結果の妥当性をより細かく評価することができます。EBMについて（２）ランダム化比較試験論文の吟味

たとえがあまり良くなかったかもしれませんが、ランダム化されているか、比較対照は何であったか、結果は何か、その結果は偶然ではないか、その結果は母集団を反映しているのか（95％信頼区間）、薬学部教育でもあまり触れられてこなかった部分だと思います。ご参考になれば幸いです。