読者です 読者をやめる 読者になる 読者になる

生物物理計算化学者の雛

主に科学に関する諸々を書き留めています。

福島県甲状腺癌発生率(1/8万)は過去の平均発生率(1/100万)と有意に異なるのかをフィッシャーの正確検定でチェック(結果:有意な違いがあるとは結論できない)

2013/08/21 福島県の甲状腺がんのスクリーニング検査で約19万3千人中44人ががんと確定、または疑いとなったニュースを受けて続きの記事を書きました
検査をすると見つかる甲状腺がんって結構多い(超音波検査で0.5%の発見率)

2013/02/13 そもそもこの記事の前提とした甲状腺癌罹患率、統計的な取扱い手順は正しくないことがわかりました。追記したリンク先のほうがより有用な情報が得られますので、甲状腺癌について知りたいかたはこちらを参照してください。
PKA先生の、甲状腺検診はもっと普及してもいい という話
PKAnzugさんによる集団甲状腺検査結果の考察などなど




福島県民調査「子供の甲状腺癌と診断(約8万件から1件)」2012年9月11日 メモ

http://togetter.com/li/371528

福島県民調査の途中経過として、検査対象8万人に対して1人の甲状腺癌が発見されたという報告がありました。
これは過去の甲状腺癌発生率100万人に対して1人と比べて大きく、原発事故の影響ではないかという声があります。
(検査に当たった福島県立医科大学は、原発事故による放射線の影響とは考えにくいとしています。)

ここでは平常時の発生率を100万分の1とし(実際は年齢等のファクターによりこの発生率よりも高い数値の方が現実を反映している可能性がありますが、保守的な確率として100万分の1を仮定します)、検査で見つかった8万分の1という確率が原発事故の影響が無いと仮定しても単なる偶然でも起こり得るのか、それとも原発事故の影響を受けた有意な違いを反映しているものであるかを統計学的に検定します。

ここではFisherの正確検定を使って統計処理プログラムRによる解析を実行します。

#Rによるフィッシャーの正確検定の実行
> fisher.test(matrix(c(1000000,1,80000,1),nrow=2))

        Fisher's Exact Test for Count Data

data:  matrix(c(1e+06, 1, 80000, 1), nrow = 2) 
p-value = 0.1427
alternative hypothesis: true odds ratio is not equal to 1 
95 percent confidence interval:
   0.1592401 972.6936639 
sample estimates:
odds ratio 
  12.50004 

検定の結果は「原発事故以前の発生率と今回の福島での発生率が同じ」であったとしても今回の検査結果(8万人から1人の甲状腺癌が見つかる)が得られる確率は14.27%あり、信頼度を95%と考えるのであれば原発事故前後での甲状腺癌発生率に有意な違いがある」という結論は現時点の検査の途中経過からは得られないということになります。

今回の福島県での調査は36万人を対象としたものの途中経過であり、当然ながら今後の検査結果によっては原発事故の影響が有意に示される可能性はあります。(信頼度95%であれば、36万人に対して癌患者が3人以下であれば有意な違いは無く、4人以上見つかると有意な違いがある可能性がでてきます)

なお仮に今後の調査により4人以上の甲状腺癌患者が見つかったとしても、前提とした過去の発生率100万分の1が本当に妥当であるか等様々な考慮すべき要素があるため、原発事故の影響が出たことの確証を得ることは難しいということも記しておきます。

(私は統計学を専門とはしておらず、この検定手順、結果の解釈に間違いがある可能性はあります。何か間違い等あればご指摘ください。)



9/14 追記
はてブコメントなどから、今回の計算方法では本当に知りたいものを計算しているわけではないとわかりました。
100万人に1人を
fisher.test(matrix(c(1000000,1,80000,1),nrow=2))
としていますが、これでは「100万人に1人の患者が出たデータと8万人に1人の患者が出たデータを比較」していることになり、「100万人に1人の発生率との比較」とは異なります。(たとえば同じ1/100万であっても
fisher.test(matrix(c(10000000,10,80000,1),nrow=2))
は違う結果を与えます)
きちんとした評価には稀なイベントの確率を表すポアソン分布を用いる方がよさそうです。

また統計学の検定とは別に、疫学的にはいろいろと考慮すべき要素があるというまとめがあります。
http://togetter.com/li/241058
http://togetter.com/li/372396
かなり勉強になりました。



2013/02/13 追記
http://sankei.jp.msn.com/life/news/130213/bdy13021312510005-n1.htm
コメントにあったこの記事によると、新たに2人に甲状腺癌が見つかり、約3万8000人中3人が癌と確定、7人が癌の疑いで検査中という状況になっています。

上記のtogetter記事 PKAnzug先生による「甲状腺癌は実はその気になって探せばすごく多い」って話。によると、(主に高齢者の解剖結果から甲状腺癌が見つかる確率は)「報告例によって揺らぎがあるが、少ない報告で10%くらい、最も多い報告では28.4%」、「学生にお互いに甲状腺エコーの練習をさせていました。その中で4年分の学生約400人(大半は20代前半)から甲状腺癌を2例見つけています。」とあり、そもそもこの記事で仮定した「100万人に一人の発生率」というのは現実より極めて低い確率だったことになり、私のこの記事の計算はそもそも仮定から間違っていたことになります。

私なりにいろいろと調べてみた結果をまとめますと以下の通りです。

  • 甲状腺癌にかかっている人は100万人に1人どころでなくかなり多い
    • ただし癌があっても症状が出ないまま寿命を迎える場合が大半で、実際に症状が出て癌が見つかる人は極めて少ない
  • 癌が発生してから検査で見つかるサイズに成長するまで数年かかるため、福島原発事故から2年足らずの現時点で見つかる癌は原発事故とは無関係

私は医学・統計学を専門としていないのでこれ以上詳細な議論は避けますが、専門の方の以下の解説が参考になると思います。
PKAnzug さんの、文春記事関連、甲状腺癌・検査事情説明(含む、経過観察)
PKAnzugさんによる集団甲状腺検査結果の考察などなど
PKA先生の、甲状腺検診はもっと普及してもいい という話