我国健康医疗大数据的现状、问题及对策

2017-06-09 14:25:47 爱德腕带 阅读

作者:许培海 黄匡时

一、健康医疗大数据的基本概念

 

不同学者对健康医疗大数据的定义不同。俞国培等认为,将医疗健康大数据分成医院医疗大数据、区域卫生服务平台医疗健康大数据、疾病监测大数据、自我量化大数据、网络大数据和生物大数据共6类。颜延等认为,医疗健康大数据是医疗人员对病人诊疗过程中产生的数据,包括其基本情况、行为数据、诊疗数据、管理数据、检查数据、电子病历等。现有定义对健康医疗大数据存在误区:一是将临床数据和健康医疗大数据等同,二是忽略非临床数据。

 

本文认为,健康医疗大数据泛指与健康和生命有关的所有数据。从形式上来看,包括代表内容的数字符号、影像、文字等,体现在与健康状况有关的病历、居民健康档案和人口基础信息。具体而言,健康医疗大数据是指人从出生、婴幼儿保健、疫苗注射、入学体检、工作体检、就诊、住院、饮食、运动、睡眠死亡等一系列生命过程所产生的数据,主要分为因就医所产生的临床数据和因生活过程所产生的非临床数据(见图1)。

 

从内容来看,健康医疗大数据包括出生数据(体重、血型、基因等)、临床数据(电子病历、电子处方、药物服用)、运动数据、体检数据、饮食数据(含饮酒数据)、睡眠数据、死因数据等,围绕个体的健康医疗大数据衍生出公共卫生方面的数据,包括血液传播、食品安全和疾病预防等。图1展示了健康医疗大数据的三维特征。

 


二、健康医疗大数据的基本特征

 

从数据格式、内容、来源看,健康医疗大数据具有海量性、多态性、微观性、隐私性、追踪性、全面性、冗余性等特征。

 

海量性 理论上,健康医疗大数据可涉及一个国家或地区全部医院或所有人群,具有TB甚至PB级的数据量,也可以只是一个地区几家医院或一部分健康人群的数据,甚至只是一个医院的全部临床医疗数据。现实状况是,一个中型医院一年医疗数据(包括影像数据)就可达到几十TB,删除主要的影像数据后,仍有大概数百G以上数据量,且医院很多年份或临床科室数据已互联互通,不是单个部门的数据。

 

多态性 健康医疗大数据的表达格式包括文本型(如人口特征、医嘱、药物使用、临床症状描述等数据)、数字型(检验科的生理数据、生化数据、生命体征数据等)和图像型(医院中的各种影像学检查如B超、CT、MRI、X光等图像资料)。多态性的医学数据区别于其他领域数据的最根本和最显著特性。

 

微观性 健康医疗大数据是每个个体健康医疗大数据的集合。个体的人口特征、行为特征、诊疗经历、体检数据、饮食数据、运动和睡眠数据的汇聚构成健康医疗大数据。因此,整个社会的健康医疗大数据天然是微观性的。

 

隐私性 健康医疗大数据分析中隐私保护需要注意两方面:一是用户身份、姓名、地址和疾病等敏感信息的保密;二是经分析后所得的私人信息的保密。

 

追踪性 个体的健康医疗大数据包括一个人从出生、婴幼儿保健、疫苗注射、入学体检、工作体检、就诊、住院、饮食、运动、睡眠死亡等一系列生命过程所产生的多点数据。许多临床数据也是时间序列,如心电图数据是连续性时间的观察数据,很多慢性疾病也需要通过追踪数据来分析成因。

 

全面性 健康医疗大数据在个体健康信息内容上通常是广覆盖的,不仅指躯体健康,还包括心理、社会适应、道德品质,相互依存、相互促进、有机结合。

 

冗余性 健康医疗大数据存在大量相同或类似信息被记录下来,如常见疾病的描述信息,与病理特征无关的检查信息。

 

三、我国健康医疗大数据现状

 

人口基础数据库建设取得新进展 人口基础数据库是整个健康医疗大数据的核心。全国所有省份均已建设了全员人口数据库,6个省份达到人口全覆盖,其余省份人口覆盖率不低于92%,国家建立了全国全员人口的备份数据库,存储了13.85亿条人口个案信息。

 

居民健康档案和电子病历覆盖面显著提高 目前我国已有北京、上海、辽宁等15个省市建立居民电子健康档案库,6个省份实现省内共享,93个地市实现市内共享,1074个区县实现电子健康档案区域内共享。全国所有省份均已开展电子病历系统建设,上海、河南、湖南、重庆、新疆生产建设兵团等5个省市建立了省级电子病历。

 

区域性健康医疗大数据初具雏形 市、县级居民电子健康档案数据库的建设已达到60%。27个(93.1%)省份尚未建设数据库;90个市(32.14%)、909个县(41.28%)仅建成居民电子健康档案数据库;65个市(23.21%)、494个县(22.43%)居民健康档案数据库和电子病历数据库均已建成。其中,119个市和365个县已实现居民电子健康档案在区域内的共享交换。

 

非临床健康数据兴起 随着移动健康医疗的兴起,运动手环、睡眠枕、睡眠床垫等新兴可穿戴或家用健康设备所采集的非健康数据日益增多。各种形式的特殊疾病数据库正在互联网兴起。

 

医院数字化加速推进  “十二五”期间,我国医院数字医疗建设快速进展,通过居民健康卡、远程医疗等信息惠民工程深入推进,预约挂号、健康门户、检验检查报告查询、健康档案查询、健康管理App等服务功能逐步应用。

 

四、我国健康医疗大数据存在的突出问题

 

当前我国健康医疗大数据存在数据缺乏互联互通、非临床的健康数据缺乏、全生命周期的追踪数据缺乏、数据隐私保护堪忧等问题。

 

数据缺乏互联互通 人口大数据系统的最基本信息还没有实现全部的互联、互通,共享基础信息如姓名、性别、出生年月、身份证号等也没有完全收集,人口的自然、社会、经济属性信息的实时开发利用还面临很多挑战和实际困难。

 

非临床的健康数据发展滞后 非临床的健康数据包括运动数据、饮食数据(含饮酒数据)、睡眠数据、日常生活作息数据等严重缺乏。

 

全生命周期的追踪数据尚未成熟 出生和死亡微观数据库均尚未成熟,从出生到死亡有76年多的时间差,目前健在或已死亡人口的出生信息缺乏。

 

数据隐私保护堪忧 传统数据库通过基于数据粒度的安全性控制实现安全隐私保护,但大数据的操作还欠缺有效的安全保护措施。

 

五、关于发展我国健康医疗大数据的对策

 

全面加快健康医疗大数据基础工程建设 大力推进健康医疗数据集聚,加快国家人口数据库、电子健康档案、电子病历相关健康医疗服务数据整合,形成国家健康医疗大数据中心。

 

促进健康医疗大数据应用体系建设 建立国家级慢病、传染病等健康医疗专项疾病大数据中心,建立完善健康医疗大数据综合决策支持系统,强化大数据业务关联、挖掘分析、趋势预测、异常提示等功能。

 

积极推动互联网健康医疗发展 实施健康医疗中国云服务计划,促进“互联网+健康医疗”的创新发展,积极探索开放健康医疗数据资源的途径和机制。

 

大力推进健康医疗大数据科研应用 构建新药研发、老药新用以及药物副作用预测的数据模型,支持重大疾病与慢性病护理相关的人工智能技术、医用机器人、移动健康医疗、大型医疗设备及健康器械等研发,促进个性化治疗的精准医疗发展。

 

全力打造健康医疗服务新业态 培育健康医疗大数据应用新经济增长点,鼓励多方合作、创新体制机制、激发市场活力、释放数据红利,推动医疗卫生异源异构数据科学应用,推进健康医疗信息系统集群分布式开源开放。



点击这里给我发消息
点击这里给我发消息