No.019 特集:医療ビッグデータが変える医学の常識

No.019

特集:医療ビッグデータが変える医学の常識

Expert Interviewエキスパートインタビュー

シャローナ・ホフマン氏

── グーグルやフェイスブックを利用すると、データが収集されてプロフィールに加えられることはよく知られていましたが、医療データは隔離されて守られているものだと思っていました。

それほど守られてはいません。アメリカにはHIPAA(Health Insurance Portability and Accountability Act=医療保険の携行性と説明責任に関する法律)という医療プライバシーに関する法律があり、医療機関や保険会社はそれを遵守することが定められています。ですからデータ・ブローカーが情報を得ているのは、そこからではないでしょう。また、政府のデータベースも匿名化されています。にもかかわらず、専門家によると、性別と郵便番号と生年月日の3つさえわかれば、人口の80~90%は個人を特定されるといいます。それらに加えて、政府の匿名化されたデータ、どこかで自動車事故により足を切断したといったニュース、薬局で市販の薬品を買ったといった購買データなどを組み合わせれば、個人を特定することは容易です。そして、そうした再識別技術も多く出回っています。

── 医療のビッグデータは、研究に使われる以外の側面も大きいということでしょうか。

そうです。マーケティングを始めとして、さまざまなタイプの医療ビッグデータに目を配る必要があります。有名な話ですが、ある少女の妊娠を、父親より先にインターネットが知っていたという例がありました。彼女がインターネットを利用すると、ベビー用品の広告が多出する。けしからんと思った父親が広告主のデパートに「娘はまだ14歳だ」と文句を言ったところ、少女の購買履歴からアルゴリズムがそう判断していたことがわかりました。店から「お嬢さんとよくお話しされた方がいいですよ」と返されたというのです。

── もはや隠せるものは何もないという感じですね。

プライバシーも大きな問題ですが、バイアスや正確さも課題になります。これは、結果を導くための元のデータが十分に正しいものであったかどうか、ということです。バイアスの例で言えば、先だってイェール大学で開かれた会議では、いろいろな研究を目にしました。しかし、イェール大学病院のような教養ある裕福な患者が集まるところで行われた研究結果を、貧困で教育レベルも低い地域の患者にも当てはめることはできるのでしょうか。そうしたバイアスがあることには気をつけなければなりません。これは、真に多様性に基づいたデータを利用しなくてはならないということです。そして、正確さを損なう例としては、先ほど言ったような医師側のストレスがあります。診察をしながらたくさんの欄に入力したりクリックしたりしなければならない。そのエラー率は時には2桁に上るため、そのまま研究に使って結論を導き出すことは危険です。また、現在はX線検査の画像診断をAIが行えるようになりましたが、診断を行うAIが学習してきたデータが果たして正しいのかという問題もあります。

── ビッグデータを利用した研究結果が、実際にはどんなデータを使ったものなのかは、一般にはよく見えません。

データが適切でなかったという例は山ほどあります。また、研究自体の設計に問題があるというケースは、ビッグデータに限らず少なくありません。すぐに思い浮かぶのは、「中絶すると、自殺願望など精神面での問題が高まる」という研究結果です。中絶反対派がこれを過大に取り上げた結果、一部の州では中絶手術前に医師は警告を与えなくてはならないという法律まで作られました。ところがこの研究では、精神面での既往症を持つ対象を除外していなかったことが後で明らかになっています。ほかにも、「はしかやおたふく風邪などのワクチンが自閉症を引き起こす」という研究結果もありましたが、これは非常に限られたデータしか利用していないものでした。こうした問題のある研究結果により、ワクチン反対派の親が増えたため、学校ではしかが蔓延するといった事態も起きています。

ナノテクミュージアムから最新情報をお届けします。FacebookFACEBOOK