健康サービスを考える(その2):医療・健康データについて

センサ技術を利用した健康サービスを考えてみるシリーズの第2回として、データの利用に関して考えてみようと思います。

最初にデータ分析においての、私の拙い考えをさらけ出し、そのベースの上で、考えられる医療データの利用の課題と、取り組まれ始めているであろう、生体データと医療に関する環境データの収集について考えます。

はじめに

昨今「ビッグデータ」というバズワードとともに、医療・健康データに関してもその有効利用が喧伝されています。「日本再興戦略」にも「医療の質の向上や研究基盤の強化を進めるため、国が保有するレセプト等データの利活用を促進する。」と書かれています。反面「レセプト・データは使えない」という声があるのも事実です。

データ利用の考え方

私は統計が得意でもデータ・アナリストでもありませんが、データの利用の仕方について私なりに考えている点を書きます。目的変数と説明変数をどう設定するかが鍵だと思っています。

目的変数と説明変数

回帰分析には説明変数と目的変数があります。統計的にモデルを作り、それに説明変数を入力すれば目的変数が得られます。まだ起こっていないことであれば、目的変数は「統計データをもとにした予測」と言うことができます。既存のデータからは、予測値がどのくらい正しかったか、という偏差もわかります。

目的変数は、セグメンテーションして比較することができます。例えば目的変数が売上であれば、A地域とB地域、顧客層Aと顧客層B、また過去と現在のようなセグメンテーションが可能です。

説明変数は、施策を打つための対象になります。モデルの中でその説明変数の寄与が大きいのであれば、目的変数を操作する(売上を上げる)ための第一選択になります。また、今まで見逃していた説明変数の寄与が意外と高かった、というような発見もあるかもしれません。

データの処理

データの処理にあたっては、目的変数を設定する必要があります。その上での「目的」は人間が決める必要があります。(ビジネスの目的とKGIの関係。)

目的変数が決まったら、セグメンテーション、説明変数を決めるための軸(例えば売上なら商品、時間帯、顧客層)、モデル化手法を(いくつでも)決めてあげて、計算機を回してあげれば翌朝には(数日かかるかもしれません)複数のモデルができていると思います。それを眺めて使えそうなモデル、セグメンテーション、軸を選んであげることになるのだと思います。

そして寄与の大きい説明変数を目的変数にして、さらにドリルダウンする、ということも考えられます。

しかしデータ分析の成果として有名なのは、古典的にはウォルマートの「ビールと紙おむつ」、最近ではローソンの「リピーターとエッグタルトパイ」だったりするので、「総当たりで相関係数を計算して、意外な相関を見つける」ということも、切り口としてはありかもしれません。

データを貯めておくということ

結局データ利用の目的や分析の軸は人間が決めるのですから、将来にまた違った目的や軸での分析をしたくなることが考えられます。その時に過去のデータを利用できれば、すぐに新たな知見を発見できるかもしれません。(後ろ向き研究。)

そこで現状必要なデータのみをストアするのではなく、計測できているものを全て生のままストアするようにします。後から目的に合わせて加工することができますから、ログのような形で構いません。

また、データの加工やまるめをしてしまうと、将来目的の分析できないことが考えられます。センサなどのデータであれば、フィルタを掛けないことと、センサや機器の型名もデータに併記することを考えます。

とはいえ、ウェアラブルなセンサだとバッテリーの問題もありますので、理想通りいかないかもしれませんが。。。

各医療データの特色

医療データに関して、レセプト・データ、医療データ、健康データに分けて考えてみたいと思います。それぞれのデータについて「主体者と目的が異なる」ということが私の観点です。

レセプト・データ

レセプトとは、病院が保険請求するときの明細のことです。「日本再生計画」で利用が提唱されているレセプト・データですが、その主体者は厚労省と健保団体で、目的は医療費の削減です。

データの利用事例では、データをもとに候補を抽出してジェネリックに切り替え促進したり、重複投薬を検出したりして、医療費を削減した事例があります。

医療データ

医療データの主体は医師を始めとする医療従事者で、既存のデータとしてはカルテ、画像、看護記録、オーダー等々があります。それらが、前章に挙げたような分析が可能な状態なのか私は知りません。電子化されていたとしても、ベンダーごとに異なり、また病院ごとにカスタマイズされていそうです。

データを分析するとなると、その目的変数は治癒率や予後で、施策としてはクリニカルパスの改善ということになると思います。

本章の冒頭の「レセプト・データは使えない」というのは、レセプト・データを医療データとして使う場合の、医師の声です。使えない理由としては、以下が挙げられています。

  • 本来の病名とレセプトの請求病名が異なる。
  • 処方した薬のすべてを患者が飲むわけではない。
  • アウトプット(検査データ、画像データ)と紐付できていない。

医療従事者の目的からすると、「レセプト・データからは目的変数も説明変数も適切に拾えない」ということになるかと思います。

現場の目的に合った、分析可能なデータを蓄積できるようにすることが理想ですが、なにより医療従事者の手間を増やさないようにしないといけません。

健康データ

健康データの主体は生活者自身、その目的は「自分自身あるいは家族が健康であること」にほかなりません。目的変数は「大きな病気になる(ならない)」ことに置けそうです。

とはいえ、健保団体が年一回の検診データと、病気になったことを把握できるレセプト・データを管理しており、事実上の主体は健保団体とその指導を受ける企業と言えそうです。

先の経産省の資料にはタニタさんの事例が載っています。

  • 社員の健康づくりのため、毎朝のラジオ体操、運動管理・健康指導、メンタルサポート等を実施することで、1人あたり医療費も同業他社が2年間で9%伸びたのに対し、9%削減され、約250万円の投資に対して300万円の削減効果あり
  • タニタでは、従業員向け健康管理の徹底や健康に配慮した社員食堂により、業種平均と比較して一人当たり医療費をー18%削減。

活動量計を社員に配布している事例は、ローソンさんを始めとし、他の企業でもあるようです。(中には活動量でコンペさせる事例も。)ローソンさんについてはこんな記述もあります。

ローソンでは、従業員の健康管理を徹底するために、特定健診を受診しなかった従業員とその上司のボーナスをカットする制度を運用開始。

また日経ビジネスオンラインのデンソーさんの事例には、健康管理の経営効果に関する記述がありました。

デンソー健保では、重症な病気による欠勤での年間損失額は合計8億6000万円と計算されている。これに対し、腰痛や不眠などの「軽症不健康」による生産損失額は年間200億円。経営に及ぼす影響はこちらの方がはるかに大きい。

(管理者層向けの記事の、一部の抽出であることにご注意ください。)

健保、企業による推進力は確実に経済効果を生むようです。しかし成果として医療費の削減や経営効果が強調されるのは、生活者としては今一つ腑に落ちません。また、企業で検診と指導を受けるお父さんはよいのですが、その家族まで効果があるのでしょうか。

生活者自身が自分と家族のためにデータの管理をするのがよさそうです。

データの利用

最後に生体センサでの計測によるデータについて考えみます。

医療における生体データ

毎日.jpさんにTRONの坂村先生の記事がありました。(ページは既に削除されています。)

「坂村健の目:医療とビッグデータ」(毎日新聞 2013年08月22日 東京朝刊)

そのNICUは、最近話題の「ビッグデータ」処理技術をすぐにも生かしたい現場でもある。心電図、呼吸、神経機能、血中酸素濃度などの生理データから、各医用機器のデータまで、NICUの新生児は毎秒1200以上の極めて多量なデータの発生源となっているからだ。

しかし現在のNICUは、これらのデータを活用できるようになっていない。

以上のようにNICU(新生児集中治療室)におけるデータ利用の現在状況を述べた後、先進的な事例としてカナダ、オンタリオ工科大のキャロライン・マクグレーガー教授の研究を挙げています。

2009年からはトロント小児病院のNICUと協力して臨床試験までこぎつけており、これまでに400人以上の新生児からデータを得て、ビッグデータ処理で遅発型新生児敗血症、未熟児無呼吸発作、未熟児網膜症を医師よりも早く発見できる可能性を実証できたという。また、米ロードアイランド州の産婦人科乳幼児病院からも協力を得ることに成功し、これまでに250人のデータを得て、蓄積した生理データをもとに病気の予測を行う研究も行っている。

坂村先生は「現在は各医用機器がリアルタイムデータを内部でまとめてしまうようにブラックボックス化していることもあり、この分野の研究は我が国ではあまり進んでいない。」とおっしゃっていますが、冒頭に示されたような生体データであれば、現在でも取り出すことは十分可能です。

規模の大きいNICUの医師が、同様の研究をしたいと医療機器メーカーやIT企業に打診すれば、すぐに研究を開始できるでしょう。しかし知見を得るには、優秀なアナリストの視点が必要になります。連続性のある生体データをどう説明変数にするかが鍵のように思います。

(実は10年近く前に、生体データをどのくらい貯めるのか、どう検索するか、一生懸命考えていました。しかし当時は、先のようなデータ利用の考え方がなかったので、なんにもできませんでした。爆)

オンタリオ工科大学マクレガー博士の研究についてはIBMさんのページにも記事がありました。この事例が先進的なのは、工科大学の先生が病院と(そしてIT企業と)協力して研究を進められたことだと思います。

健康における生体データ

活動量計のようなセンサを社員に配って、社員のデータを集める事例は、NTTさん、ドコモさん、富士通さん等で行っていたと思います。もちろん他の企業や健保団体も行っていると思いますが、上記のIT企業はビジネスと関係各者の利害が一致して、健保や病院との協働がしやすいのではないかと思います。そしてデータを集めるために大多数の社員を動員できます。(これらの企業は、医療データについての取り組みもしているのでしょう。)

2013年10月のITPro EXPO 2013にて富士通さんの講演を聞いたのですが、その中で糖尿病予測のムービー(テレビ番組)を見ました。曰く、過去のデータから糖尿病の予測モデルができており、病気になる前に産業医が指導できる、というものでした。この資料の15ページにありますが、健康診断時の主に血液検査のデータのようですね。(番組中では3000次元と言っていたように思います。)

現在、我々が自分のデータを採れるのは身長、体重と活動量くらいです。しかし近い将来、脈波などの生体データが簡単に採れるようになるでしょう。しかしそれらのデータと、目的変数である病気との関連は、ほとんどわかっていません。わかるようにするためには、まずデータを貯めなければなりません。

環境データ

「ビッグデータ」の文脈では、環境データ(温度、湿度、照度等)の利用も言われています。曰く、農業や醸造においてベテランの技の再現性を高める、といったような利用法です。

CEATEC Japan 2013でもオムロンさんが、温度、湿度、照度、色温度、気圧、振動、紫外線量が測れるセンサを展示していました。私はこれをみて、NICUで使えるのではないか、と説明してくださった方にお話しました。

NICUには、37週未満で生まれてきた早産児がいます。NICUではクベースとよばれる保育器の中にいますが、まだいるべきお母さんのおなかの中とは環境(温度、湿度、明るさ、音)が大分異なります。温度、湿度はクベースが調整していますが、明るさ、音も新生児の発達に影響を及ぼすのではないかと考えられています。これらを計測し、分析すれば、新生児に最適な環境がわかるのではないでしょうか。(クベースの天蓋は、開閉時になるべく音がしないように設計されているようです。)

クベースだけでなくコット(天板に囲まれていない新生児用のベッド)、NICUだけでなくGCUでも、環境データの分析は有意義であると思います。

(このアイデアは2000年くらいから持っています。先の坂村先生の記事にも環境の視点はないようです。マクレガー博士はどうでしょうか。)

ICU(集中治療室)に関しても「ICU症候群」という言葉があります。ICUに入院された患者さんが精神的に不安定になる症状のことです。その原因として、薬の他にも光、音などの環境面が考えられています。NICU、GCUに次いでICUも環境データの測定と分析の対象になりそうです。

余談ですが、ICUなどで患者さんの枕元で「ピッ、ピッ、ピッ、」となる機械。音でお知らせするのが大事なのはわかるのですが、せめてスピーカーだけでも患者さんの足元に移動して、医療従事者の方にだけ聞こえるようにはできないものでしょうか。

まとめ

「ビッグデータ」を医療、健康に利用する、という考えが喧伝されています。しかしデータの主体者、利用目的、既存のデータの粒度などがまちまちで、現状では課題が多いようです。政府は2014年から取り組むと言っていますので、課題がクリアされることを望みます。

健康データに関しては、企業と健保が共同すると推進力があるようです。さらに企業がIT系で自社のビジネスと関連するとさらに進みます。しかしその目的が、真の主体者である生活者の目的と異なったり、従業員の家族までへの展開が今一つであったり、生活者中心になっていないようです。

生体データに関しては、本邦では始まったばかりです。まず分析するにたるデータを貯めるところから始めなければなりません。(取り組んでいる研究者や企業はあると思います。)

健康サービスと生体データの収集に関する課題については、次回考えようと思います。

コメントを残す