浦东新区区域卫生信息平台的数据治理现状

2016-09-22 11:19:54 爱德腕带 阅读

大数据时代,是一个以数据为核心资源的时代,加快推进大数据在医疗服务模式创新中的深度应用,是医疗服务创新发展面临的重大时代课题。大数据的价值提炼离不开高质量数据的支撑。数据治理是提升数据质量的有效方法,它并不是一个新概念,有数据的地方就存在数据管理,而数据治理是在数据管理和使用层面之上进行规划、监督和控制。随着大数据应用的迅猛发展,对数据质量的重视也提升到了一个新的高度。


“十二五”期间,上海市浦东新区完成了区域卫生信息平台的建设,平台目前采集了区属45家社区服务中心、22家社区卫生服务分中心、18家二三级医院以及13家其他卫生机构的医疗卫生数据近10亿条数据信息,这些数据主要包括了患者信息、诊疗信息、用药信息等,从规模、速度、多样性和价值等方面都符合大数据的特征,随着平台大数据不断分析利用,医疗数据质量管理及相关系统的开发与研究必将成为医疗行业信息化进程中一个必不可少的环节。本文结合数据治理的体系框架,对目前平台中的数据管理问题进行总结,并对后续数据管理和发展方向提出设想。


1数据治理概念


"数据治理是对数据资产管理行使权力和控制的活动集合"。在数据资产管理体系知识中,数据治理处于数据资产管理的核心位置,如图1所示。数据治理不仅是一系列技术的方法论,更是一套与管理机制相结合的体系框架,需要管理层组建专门的治理和控制团队,制定一系列策略、流程、制度和考核指标体系,监督和协调各个部门和谐运行。数据治理和持续改进贯穿了数据生命周期的整个过程,是确保大数据战略持续成功的基石。


数据资产管理

 图1数据资产管理


2浦东新区数据治理经验


在区域卫生信息平台中,我们往往是借助技术手段,解决数据的“乱杂错丢骗”,平台的数据管理团队经常被看作“数据质量警察”,重复的进行数据的清洗和纠错,数据管理成本高,也难以达到预期效果,更有可能导致被误解为“数据治理官僚化”。在数据治理体系中,更需要关注战略和机制。浦东新区在提升数据质量的过程中,结合数据治理的理念和措施取得了一定的成效。


2.1 加强认识数据治理的战略意义数据治理是一项贯穿全局的系统工程,需要管理者、业务人员、技术人员等多方协作才能完成。从目前来看,数据毋庸置疑是各个医院的宝贵资源,要做好数据治理第一步就是认识到数据治理的重要性。


自从2013年开始,浦东卫生信息中心已经意识到数据质量管理的重要性,只有正确的数据才能提供正确的服务,否则再多的努力也只能导致“Garbage in, garbage out"。围绕数据真实可用的目标,从技术到管理制度,提出了一系列的管理办法,在区域卫生信息平台中先试先行,保证在系统建设、运行和维护的各个环节,提升对数据治理的重视。


2.2 成立数据治理小组,建立相应机制数据治理组织是开展数据治理工作的主体,一般包括管理层,业务人员和技术人员。数据治理组织可以设置三种角色,数据治理委员会、数据治理业务组、数据治理技术组。


浦东新区结合实际情况,成立了卫生数据治理体系,如表1所示。在区域层面,由卫计委领导及各处室一把手组成数据治理委员会,业务处室及业务专家作为数据治理业务组成员,信息中心作为技术支撑。在各医疗机构内部,由分管领导作为第一责任人,业务科室牵头,技术部门提供信息化支撑,共同协助数据治理工作。数据治理委员会制定了区域卫生数据的管理机制,并在每个季度召开通报会议,明确阶段性的目标,确定数据治理规范、流程和标准等。数据质量业务组保证系统的业务数据正确,负责检查和整改数据。数据治理技术组负责数据采集、交换、清洗、转换等技术上的顺畅并正确执行。


表1 浦东卫生数据治理小组体系

浦东卫生数据治理小组体系

2.3 业务部门从应对型的数据清洗转变为主动型的数据治理区域信息平台的主要建设任务是数据的汇聚、共享、交换以及展现,同时也是其他应用的数据源。解决数据质量问题最主要的方法就是在完善上传数据质量的同时,对库内原有历史数据进行清洗,这导致很多技术人员误认为修改数据中的错误、对错误数据和垃圾数据进行清理,就是数据质量管理。这种理解是片面的,其实数据治理是一套完整的执行体系,对数据的整个生命周期进行监管。


浦东的区域卫生平台,也经历过数据不可用和数据失真的阶段。直到2015年,随着数据治理战略和机制的建立,管理层决定通过平台进行社区绩效考核及公立医院补偿的基础数据采集,才打破这一恶性循环。目前,数据质量监控平台已经作为区域卫生信息平台中不可缺少的一部分。数据质量监控按照业务无关的规则和业务相关的规则,分别发现数据质量问题,第一时间推送给数据治理小组成员,借助监控平台,业务组成员可以主动发现数据的缺失问题并及时反馈及时组成员,双向良性互动有助于数据质量的提高。


3待解决的问题


3.1 元数据库基本建立,指标统计口径的仍然未统一近年来,随着医疗信息化的发展,特别是电子病历建设标准的普及,医院使用的各类生产系统也都逐步采用成熟统一的共识标准,一方面为医生提供了较好的工作平台,同时也为平台的实现数据共享,建立元数据库奠定了良好的基础。但在区域卫生信息平台应用的过程中,往往是遇到同一个数据源得出的同一个指标,各个部门的计算结果往往是不同的。一个就诊人次指标,可能因为按照就诊卡计算,按照发票数计算,按照处方数计算,得到不一样的结果,那么在决策支持的时候,就会发生数据量纲不一致,分析结果误差的影响。因此,除了根据各生产系统的建设标准,建立元数据库以外,更需要各条线的业务部门在数据治理过程中统一指标的计算口径,在区域内达成共识。


3.2 隐私数据的安全工作数据安全工作指的是数据的备份、恢复、脱敏、监控、审计等。对于数据的存储安全,各行各业都已经有了丰富的经验。但在数据隐私和敏感数据处理方面,国内的研究和应用较少,缺乏很好的应用案例,在医疗行业中存在大量的隐私数据,这部分数据即使汇聚到了平台上,还没有很好的方案进行处理和保护。


4大数据时代的数据治理设想


4.1 数据的责任意识在数据治理中,数据的认责也是十分重要的一环,数据的生产者和数据的使用者都有自己的权利和责任,在通过数据创造价值或牟取利益的同时,也应当承担相应的责任,确保数据的安全。而随着对数据安全的关注越来越迫切,我们更需要一种有效的方式,让他们为数据担起责任,知道有所为、有所不为。


4.2 全局数据治理全局数据是基于场景化的概念,具有场景化、开放性、可度量、及时性、价值化的特点,以及收集数据、治理数据和应用数据三大能力的大数据。全局数据的概念中再次强调了数据治理的重要性,我们需要一些更智能的方式对大数据进行有效管理。这不仅意味着在入端保证质量和管护,在出端保证隐私和安全,今后的数据治理其实是一种体系,是一个关注与信息系统执行层面的体系,这一体系目的是整合知识和意见,通过将流程、策略、标准和组织的有效组合,对信息化建设进行全方位的监管。


5总结


从技术驱动到数据驱动,再到场景驱动,信息时代的驱动力一直在变革,唯一不变的是人们对数据质量要求的不断提升,数据即是系统的生命线和系统的价值。数据管理不是一蹴而就的任务,更是一项长期的系统工作。随着IT到DT(Data Technology)的趋势认同,数据治理研究和应用变得越来越迫切。人类需要经过治理的数据去做智慧的驱动和决策,只有全体人员重视数据质量和积极参与数据治理,数据才能发挥真正的价值。


(来源:《中国数字医学》杂志2016年第9期 作者:施天行 张寅 王晓丽  单位:上海市浦东新区卫生信息中心)

点击这里给我发消息
点击这里给我发消息