③「信頼区間」は?

仮に再発の割合が60%だとします。

(A)10人追跡して6人再発したから60%である
(B)1000人追跡して600人再発したから60%である

この2通りの計算式があった場合、結果の信頼性が高いのはどちらでしょうか。当然②の、追跡者数が多いほうが信頼性は高くなります。追跡者数が10人と小規模の場合、たまたま再発者がかたまって発生した、あるいは、たまたま再発者が含まれなかったというように、偶然の影響を受けやすくなります。

もし、世界中のうつ病の患者全員を追跡できたなら、真の再発者数を知ることが可能でしょう。しかし現実には不可能なので、研究では一部の人を選んで追跡調査を行います。このとき、実際に追跡調査をする集団のことを「標本集団」といい、その背後にあるうつ病患者全体の集団のことを「母集団」といいます。

母集団の結果については知り得ないため、標本集団から母集団の状態を推定するわけです。その信頼性の指標として、「信頼区間(CI:Confidence Interval)」というものを統計学的に計算します。

少し専門的になりますが、統計学的には「95%信頼区間」がよく用いられます。

これは、「100回同じことをくり返した場合、そのうち95回はどのくらいの範囲に入ってくるか」を推定したものです。後述しますが、求めるための計算式があります。

たとえば、(A)の10人規模の研究を100回くり返した場合、計算によると、95%信頼区間は31%~83%とかなり広くなります。このことは、10人中の再発者が3.1人から8.3人まで広い範囲の値をとることを意味し、60%(すなわち6人)とはかなり違う値になる可能性があります。

では、(B)の1000人規模の研究を100回くり返した場合はどうでしょうか。計算してみると、95%信頼区間は57%~63%と狭くなります。1000人中の再発者が570人から630人までの範囲に入り、60%(すなわち600人)に近くなりました。

うつ病の再発率が60%といわれる根拠は? 「この薬で死亡率が3倍」といったセンセーショナルな表現や情報は誤りである可能性が高い理由_4

小規模の研究から導かれる結果は偶然のばらつきが多く、信頼区間の幅が広くなります。一方、大規模の研究から導かれる信頼区間は狭くなります。信頼区間の幅が狭いということは、それだけ真実の値に近いことを意味します。

この信頼区間を求める計算は少し複雑ですが、「割合(比率)の信頼区間」などとネット上で検索すると、自動的に計算してくれるサイトがいくつも見つかりますので、興味のある方は試してみてください。