日本の医療・ビッグデータを一覧する (その1)
0これまでのエントリで何度か医療領域について、データサイエンス・ビッグデータが果たすことのできる役割を言及してきました。
今日のエントリでは、2014年現在、日本でどのような医療データがあるのか、特に民間にとって利用できるデータにはどのようなものがあるのか、見てみます。ここでは、医療業界の外にいるユーザーにとっても分かりやすいように、若干単純化してあります。
HISデータ (Hospital Information System)
HISデータには、様々なものが含まれます。電子カルテのデータ、オーダリング(処方や検査の指示書)、臨床検査データ、画像、レセプトなどです。包括医療費支払制度におけるDPCデータもこの中に含まれます。
(DPCは、Diagnosis Procedure Combination の略で、ものすごく簡単にいえば、どういう病気に対して、どんな診断と処方をしたか、を時系列的に一覧化するものです)
長所
- (精度)HISデータはとにかく高精度で、臨床医が触れるデータの殆どそのままのものです。臨床利用されるため、とにかく詳しく、データの正確性は信頼できます。患者について、複数のデータソースをまとめることができるので、多角的に見ることが可能です
- (時系列比較)時系列を追って、トラッキングも可能です
- (範囲)病院に来ている全ての患者が対象なので、入院患者も、外来患者も、両方捕捉できます
短所
- (標準化)基本、病院ごとにフォーマットは違います。そのため、病院間の比較や、広域データは扱いにくいです
- (規模)従って患者数のサンプルサイズが制限され、せいぜい数万~数十万オーダーです
- (範囲)その病院に来なくなった患者は、かかりつけ病院の変更であれ、引っ越しであれ、死亡であれ、捕捉できません
民間企業としては,MDV Medical Data Visionが130病院、約500万人分のデータを提供しています。
資料: 株式会社メディカルデータビジョンhttp://www.mdv.co.jp
DPCデータ
厳密にはHISデータに含まれますが、これだけを扱っているデータ会社もあるので、別だしで解説します。
DPCはDiagnosis (診断) Procedure (処置・処方) Combinationの略で、診断群分類の意味です。大体この疾病・怪我であれば、こんな処置をします、というグルーピングのことです。このデータは、診断群分類包括支払制度という、病院が国から診療報酬を受け取る制度のために作られました。
なぜこの制度ができたかの解説は別のきかいにするとして、データとしては、どんな疾病・怪我の人に、何をしました、という事が記録されているものです。
長所
- (規模)1500以上の病院がこの制度を導入しているので、サンプルサイズが大きいです
- (標準化)データが標準化されているため、色々な横比較が可能です (検査が少なく投薬が多すぎる、入院期間が平均より10日短くて済んでいる、など)
- (精度)ある程度詳しい情報です (HISには負けますが、それでも十分に様々なことが出来ます)
- (時系列比較) 日付の情報があるため、時系列で比較することが出来ます
短所
- (範囲)入院患者のデータしかありません (外来患者は、DPCの対象ではないからです)
- (範囲)横比較可能とはいえ、病院ごとのデータなので、病院に来なくなった患者は捕捉できません。引っ越しや、複数病院間の名寄せも基本的には不可能です
民間企業では、グローバルヘルスコンサルティング社が有名です。スタッフ紹介のページには年々奇抜なメンバーが追加されていますが、、、複数施設をDPCで比較して治療成績やコストを見える化・比較するサービス(「EVE」)など、今まではブラックボックスだった医療活動の生産性を向上させているプレイヤーとして注目されています。
下記は同社サービスのEVEによる分析例です。
在院日数の病院間比較
DPC別在院日数、症例数、DPC増減収比較
レセプトデータ
レセプトとは、ドイツ語のRezept = Prescriptionから来ている単語で、医療機関が診療報酬を保険者に請求する時の医療報酬明細書です。病院が請求するものを医科レセプト、薬局が請求するものが調剤レセプトです。
レセプトには、受診患者ごとに下記のような情報が含まれます。
- いつ=診療年月
- 誰=患者の年齢、性別
- どの病院・薬局に=医療機関のベッド数、経営体、診療科など
- どんな病気で=診断された全ての疾病名(確定/疑い)
- どの位の期間いて=診療実日数・入院日数
- 何をして =指導管理、在宅、投薬、注射、処置、手術麻酔、検査、画像診断
- いくらかかったのか=請求点数
資料: 株式会社日本医療データセンター ホームページ http://www.jmdc.co.jp
長所
- (精度) 医療機関による入力なので、内容は正確です
- (標準化) フォーマットが決まっているので、扱いが簡単です
- (時系列比較) 患者情報が含まれるので、複数年にわたる分析が可能です
- (範囲) 入院も、外来も、薬局にきた患者も、全て捕捉できます
医科レセプトの電子化率は95%を超えているので、捕捉率がとても高いです - (範囲) 入手さえできれば、東京から大阪に引っ越しした人でも、かかりつけ医が複数ある人でも、名寄せしてデータセットに加える事が出来ます
- (規模) 従って、国民の殆どが対象にいなります
短所
- (精度) ざっくりした内容なので、詳しい症状や、検査値などはわかりません
NDB (ナショナルデータベース)
ナショナルデータベースは「高齢者の医療の確保に関する法律」にもとづいて、2009年から構築が開始し、2011年から第三者提供が開始された厚労省のデータベースです。
ここには、DPC、特定健診データ、レセプトなどが個人を名寄せした状態で格納され、事実上、病院にかかった国民の全てのデータが格納されています。勿論、利用にあたっては個人を特定できないような処理が厳重に施されます。
このDBは格納されているデータがあまりにセンシティブであるため、基本的には民間が営利目的で使用することは出来ません。あくまでも厚労省や学会が利用するものです。
資料:ITBPO http://www.itbpo.jp
次回以降のエントリでは、これら以外のDBを解説します。