大型医院影像分级存储架构下归档的策略及应用

2017-02-14 10:54:50 爱德腕带 阅读

随着计算机技术、网络技术以及数据成像技术的快速发展,医院影像文件的存储已成为大型医院信息化发展中的一个迫切需要解决的问题。国家法律法规要求医院需要长时间保存医院数字化影像数据;但是由于医学数字化影像数据自身小文件多、不容许使用有损压缩算法,导致随着很多大型医院的医学影像文件在以较快的增速上涨,在线影像存储系统容量不断告急。此外,很多医院信息技术人员存储管理的知识和技术能力不足等原因,在医学影像文件存储方式上,仍使用较为保守的方式,即不断使用性能较高但价格较为昂贵的磁盘阵列来存储影像文件。针对上述情况,大型医院急需考虑对医疗影像系统产生的海量影响文件进行归档和长期保存,实现海量历史医疗影像文件的自动化管理,释放宝贵的影像系统在线存储资源,减少业务系统的在线存储压力,以达到更快响应业务操作的目的。


1  大型医院医学影像文件存储的现状


1.1 医院影像文件的特点


1.1.1 数据量大 以江苏省人民医院统计数据为例,每天产生的影像文件量约100GB,一年在线存储约需40TB,并且随着医疗设备以及计算机技术的提升,影像文件容量还将快速上涨。


1.1.2 保存时间长 由于医疗影像文件具有法律的效应,患者影像文件在生成后,绝对不允许对其进行任何改动。按照国家相关规定,医院必须将病人的医学影像文件保存超过15年时间。

 

1.2 目前医院影像文件存储的问题


1.2.1 医院影像文件增量大 对于大型医院来说保存全院的影像文件需要海量的存储,并且近些年随着医学影像设备、计算机技术的发展,医学影像数据质量越来越高,影像数据容量也越来越大,大型医院影像数据的增速也越来越大。


1.2.2 医院影像文件存储策略不科学 为了使临床医生能够实时快速调阅病人的影像数据,基本均选择以高性能、读写快的磁盘阵列为主。但是,随着数据量的增加,传统磁盘阵列的简单叠加扩容已不能很好地满足目前医院影像存储和使用的要求。


2    医院影像文件归档的方案


2.1 影像文件归档的设计原则 医院医学影像文件具有的特点:首先是数据量极大,其次是海量存储,最后是小文件居多这三点,都要求存储有着较高的性能。但如果将这些数据都存在网络存储中,却又无法满足现在大型医院医学影像数据激增的现状,医院影像数据需长期保存且不可以随意删除以供临床医生随时调用查阅。这便对医院信息技术提出较高的要求,在医院中需要借助相应的应用系统来对医学影像数据进行分级存储。将业务科室需要经常查阅的热数据存储在性能较高的磁盘阵列中,将业务科室不经常使用的年限时间较长的冷数据存储在性能一般的磁带库中,这便是所谓的数据归档。


2.2 影像文件归档的存储架构 目前,没有任何一种存储介质能同时满足医学影像数据的大容量存储以及高效率的随机读取这两点要求,这便需要借助于存储架构的设计。医学影像文件从存储架构类型上分为在线存储、近线存储、离线存储三种。这三种不同的存储方式根据医院自身的需求,最终实现数据的长期保存以及回调等具体功能(见表1)。


在线存储是指存储设备和所存储的数据时刻保持“在线”状态。存储介质以磁盘阵列为代表,具有读取速度快,吞吐量大等特点,可以集中存储全院在线影像数据,供各个科室医生快读的从系统中调阅、查询等。但在线存储所能提供的空间有限,且价格最高。


近线存储主要是指将医技科室并不经常使用到的影像数据存放在性能较低的存储设备上。存储介质以磁带库为代表,它们的特点是:当需要的数据在离线的存储介质中,通过机器本身的算法并控制机械手将其夹在到驱动器中进行读取。近线存储设备理论存储空间没有限制,存储价格较低,可集中存储全院几年内的在线影像数据,供各科室医生从网络中调阅、查询。但对数据定位及读取时间较长,存取速度慢,自动化程度不高,需人工进行干预操作。


离线存储的数据不常被调用,一般也远离应用系统。离线存储介质为离开磁带库和光盘塔的磁带和光盘,其存储方式为人工将磁带按序存储在影像数据柜中,实现影像数据的永久性海量存储。


表1 三级存储性能对比

三级存储性能对比.png

3    江苏省人民医院影像文件归档的实践


3.1 医技科室调阅医学影像文件的需求分析 影像文件存储设备与存储容量的选择配置是影像中心系统最为关键的因素之一,大容量的存储是获得影像文件长期保存的基础。磁盘阵列、磁带库、光盘库都能提供几十甚至几百TB的存储空间。


主要考虑因素包括:医院影像数据月增长量、年增长量。我院目前影像中心系统存放着PACS、B超、心超、核医学等多个系统的影像数据。其年增长量达到了约70TB,且随着业务的发展,数据增量处于持续增长的过程;从对多种存储介质的比较中,可以看到任何一种单一的存储技术都有着不同程度的缺点。为此,对临床的需求进行分析,结论是:临床对影像的调阅按照访问量大致可以分为三类:第一是短期经常调阅的影像,无论影像医技科室还是临床科室,都比较关心病人近期的影像数据,短期数据的标记为5年内的数据,这些数据的调阅占总访问量的约90%;第二是对病人较长一段时间以前的影像数据进行回调查阅,针对这部分病人临床医生需要调阅其较早的影像数据进行对比,这类数据的调阅占总访问量的约9%;第三是个别的影像查询,这类数据的调阅占总访问量不到1%。所以只要解决好第一与第二种情况的影像数据的调阅,就基本满足了临床医技科室对于调阅医学影像数据的要求。


3.2 该归档项目方案设计 数据长期归档系统将建立一个归档和长期保存平台,提供影像数据的迁移、归档、长期保存和利用检索。


3.2.1 该归档项目硬件配置 该项目采用一台NAS存储设备作为医学影像数据在线存储与归档系统之间的数据交换区;采用两个数据迁移节点、一个主管理节点和一个数据库节点实现医疗信息小文件归档迁移、回迁以及长期保存过程中介质、设备和数据的生命周期管理。


详细配置如下:调度服务器:数据长期归档系统采用三台服务器作为各设备协调调度、数据迁移、数据生命周期管理系统,是该系统的调度中心。性能配置由一颗E5系列CPU、16GB内存、2TB硬盘空间组成;数据库服务器:由于我院影像中心系统中所存储的影像数据小文件数量太多,故采用单独的服务器运行oracle数据库对文件位置等信息进行存储。性能配置由两颗E5系列CPU、32GB内存、2TB硬盘空间组成;NAS存储:采用一台NAS存储设备作为数据交换区。容量约为8TB,采用双控制器组成冗余架构,单个控制器可达到160MB/S的速度;磁带库存储。数据长期归档系统使用磁带库(LTO6)存储保持近线数据,作为数据归档存储区。容量为500TB,4个磁带驱动器。


为解决数据传输速度慢,确保磁带库良好运行,该项目架构中的千兆交换机以及NAS存储利用网络聚合,提高单链路数据传输速度,从而提高数据归档的速度。网络架构如图1所示。

该项目硬件架构.jpg

图1 该项目硬件架构


3.2.2 文件集中存储与多级存储结构 依据医学影像存储原则和医院实际影像数据产生量,在医院影像集中存储和管理的总体架构下,该项目采用多级存储结构,即系统分为影像文件在线存储管理以及影像文件近线存储两级结构。


在线存储:使用现有的磁盘阵列在线保存数据,容量约120TB,集中存储全院近五年内的所有病人影像数据供全院各科室迅速地从网络中查询、调阅;近线存储:使用磁带库(LTO6)存储近线数据,容量为500TB,集中归档存储全院五年前所有病人的影像数据供全院各科室能够有效调阅(见图2)。


该项目多级存储结构.jpg

图2 该项目多级存储结构


3.3 影像数据归档实施效果 该项目建立影像数据归档和长期保存平台,根据医学影像数据细碎文件多的特点,利用小文件打包封装技术,提高影像数据归档与回迁的速度;根据影像中心业务系统利用数据的频率与颗粒度,制定了适合业务系统需求的数据归档策略;根据存储介质性质不同,采用介质生命周期管理、数据生命周期管理的技术,实现了影像中心数据的长期保存。


该项目解决了影像数据在线存储容量告急的问题,更重要的是满足医疗数据长期保存的法规要求,为医院业务系统持续服务以及高效访问提供了可靠保障。


4    讨论


4.1 医院大数据时代的到来 医院随着近几年信息化的快速发展产生了巨大的数据量,影像系统便是其中一个。大型医院医学影像文件增长速度快,而且在影像数据生成后便不允许对其进行改动。急剧增加的影像文件给大型医院造成了越来越大的困扰,该将这些海量的影像文件存储在什么地方,如何存储这些海量影像文件才是最适合当前各医院的现状,采用什么技术才能达到最佳的性价比,这些问题都是当下大型医院需要思考及解决的问题。


4.2 影像归档较传统影像存储的优势 医院传统的医学影像存储方式大多由高性能磁盘组成的磁盘阵列以提供医院海量影像文件的存储,使用该存储方式能够快速响应临床医生调阅图像的需求,但磁盘阵列的成本却较为昂贵。此外,由于医疗行业对影像要求的特殊性,随着时间的推移磁盘阵列中较多的影像文件被临床医生调阅的频率将会逐渐降低,使用磁盘阵列来存储医学影像文件对医院来讲并不具备较好的性价比。


影像文件归档技术是实现计算机系统大容量存储数据的方法之一。在影像文件归档的基础上,采用分级存储管理,即根据不同的图像存储目的采用不同类型的存储介质的方法。采用该种方式不仅能够较好满足医院影像文件存储的需求,也可大幅降低医院的硬件支出成本。


4.3 医院需因地制宜地制定存储归档方案 大型医院要根据自身的实际情况及市场行情,合理预估在线、近线等存储容量,以达到最佳的性价比。影像中心系统中存储的数据,可以根据临床医生调阅时间频率的长度分为短期、中期和长期三种类型,而且这三种类型的数据量会不断进行调整;此外,从另一个角度来看,存储介质的成本会一直呈现下降趋势,因此不必在构建影像系统初期,就配备性能较高且容量很大的存储。用户应在建立系统初期,通过统计每月产生图像资料的数量,再决定购买哪一种存储介质以及系统初建时需要的存档容量。另外,对于近线存储设备,磁带库是一个很好的选择,大容量磁带库价格较磁盘阵列低廉,容量较大,而且调阅速度较快,适合作为长期影像文件保存存储介质。


5    展望


随着各大医院医学影像文件容量的增加以及医疗行业信息化发展,未来将会有越来越多的医院采用影像文件归档系统。由于医院影像文件的特殊性以及重要性,医学影像文件的存储在其中的作用举足轻重。医院在选择存储设备以及存储架构时,要综合考虑各种因素,以发挥最大的作用。


(来源:《中国数字医学》2017年第1期,作者:蔡雨蒙  冷锴  单红伟  朱一新  王文明  刘云  单位:南京医科大学医学信息学与管理研究所,南京医科大学第一附属医院)



点击这里给我发消息
点击这里给我发消息