打破数据共享障碍,基因组学从前沿走向临床

2017-11-08 09:33:37 爱德腕带 阅读

“千癌一治”,是目前肿瘤治疗的困境。有数据显示,2015年,中国约有280万人死于癌症,治疗无效率高达75%,在癌症的致死原因中,治疗不当占到了近三分之一。


  1. 最新的基因组学技术,特别是下一代基因组测序和全基因组测序技术,因其具备足以对抗传染性疾病的成本效率和时间效率,成为人类对抗超级细菌的强大助手。

  2. 精准医疗需要的并不仅仅是基因组数据的简单堆积,而是让这些数据发挥作用。

  3. 解决数据共享问题,需要多方努力。

  4. 目前肿瘤医生尚未普遍将基因研究新成果应用于日常诊疗,其中一个重要原因是他们缺少迅速洞察数据、确定最佳疗法的可视化工具和分析软件。

  5. 我们可以将基因组的数据处理工作流程看作一场化学反应。


  “我们需要一种更具有针对性的疗法来控制导致癌细胞生成的特定基因突变。”英特尔健康与生命科学事业部全球营销总监BryceOlson指出,“现在,我们终于拥有了可以在分子水平追踪基因突变的方法。”


  Olson提及的新型疗法以基因组测序为基础。通过基因组测序,医生可以发现关键的基因突变,从而有针对性地实施靶向疗法和免疫疗法。Olson本人就是受益者,“像我这样已经发生骨转移且化疗后病情仍在发展的晚期前列腺癌患者,平均生命只剩下21个月。”而参加了一项采用基因测序来识别和阻断变异细胞信号传递路径的临床试验后,Olson已经延续了29个月的生命。


  除了在癌症治疗领域的突出表现,对传染性疾病的追踪能更好地体现全基因组测序的精准特征。当前全球有13%的死亡率由细菌感染所致,这是一个极其庞大的数字,尽管新抗菌药物研发的速度放缓,多种耐药菌在医疗环境中的发展依然呈爆炸趋势,如果不加以控制,超级细菌将成为21世纪公共健康的主要威胁之一。


医用腕带

以金黄色葡萄球菌为例。金黄色葡萄球菌能导致葡萄球菌感染及MRSA(耐甲氧西林金黄色葡萄球菌)耐药性菌株的出现,非常难以杀灭。如今,对其全部2600个基因的测序可以在数小时内完成,而测序技术出现前的一种常用方法只能分析其中的八个基因。


  最新的基因组学技术,特别是下一代基因组测序和全基因组测序技术,因其具备足以对抗传染性疾病的成本效率和时间效率,成为人类对抗超级细菌的强大助手。在分析传染性病原体时,通过对所有基因进行极为精准的分析,研究人员可以准确地发现基因突变点位、时间,以及哪些突变可能导致耐药性,这对下一代抗菌素的研发至关重要。


  同疫苗和抗生素的出现一样,下一代基因组测序技术(NGS)是人类医疗进程中的又一次重要突破,但这需要强大的数据分析和对患者癌症基因变异的临床解读作为支撑,并要确保数据能交到治疗一线的医生手中。


用平台推动数据共享

为基因组测序打基础


在基因组测序中,数据共享的重要性不言而喻。精准医疗需要的并不仅仅是基因组数据的简单堆积,而是让这些数据发挥作用。


医用腕带

资料卡


美国国立卫生研究院(NIH)院长Francis Collins及副院长Kathy Hudson在发表于2016年《新英格兰医学期刊》上的联合署名文章中写道:“快速的数据共享对人类基因组工程(Human Genome Project)的成功起到了至关重要的作用。”

 

  然而,由于多种因素限制,数据的获取和使用目前依然严重受阻。多数基因组数据仍然掌握在收集数据的各种机构手中。Olson指出:“并没有商业利益激励科研人员彼此共享数据。”个人隐私安全问题上的顾虑也在阻碍数据的共享。此外还有经费问题——即便大家都同意共享数据,医疗机构也不得不考虑庞大的专业人员及IT资源支出。


  解决数据共享问题,需要多方努力。我国已经在政策层面展开积极行动。



2015年3月11日


  中国科技部召开国家首次精准医学战略专家会议,宣布计划在2030年前为中国精准医疗投入600亿元,以此为契机,同年5月,在英特尔主办的题为“精准医疗时代的计算革新“技术论坛上,英特尔表示将以计算技术为起点,以海量大数据的计算分析和整合为基础,与合作伙伴一起在精准医疗行业的商业、体验和技术上共同创新,推动精准医疗事业在中国的发展。



2016年3月


  中国科技部在《精准医学研究重点专项2016年度申报指南》中对精准医疗数据规范化与分享性表示了明确支持,具体到“面向精准医学研究和应用的大数据搜索引擎和跨库检索分析技术系统”等多项内容,并要求其“符合伦理规范”。


  2011年之前,中国的基因测序技术还仅仅用于科研领域,但在2012-2017年间,基因测序产业的复合年均增长率预计将为20%-25%


  “随着对基因组测序需求的不断增加,需要处理、存储和管理的数据量也在增加。”英特尔健康和生命科学事业部全球总经理Jennifer Esposito说,一个人每次高质量全基因组测序将产生将近1TB的数据量。由此可以推算,中国计划建立的百万级基因样本数据库将是全球各行业中最大的数据库之一。如何读取和利用类似这样的“庞然大物”将成为巨大挑战——毕竟肿瘤患者无法等待数周或数月来获取分析结果和治疗方案。


医用腕带

如何推动数据的读取呢?大型数据库显然无法移动,“所以我们要建立联合式共享平台,这非常重要。”JenniferEsposito指出,“这样既可以共享数据,又不必将其移动到别处。”


  “与其他行业相比,医疗行业在数字化方面的变革有些落后。但令人欣喜的是我们终于找到了驱动数据创新的方法,下一步就是学会如何共享数据。”Jennifer提出。技术本身要简单易用、方便获取,“我们希望医生在为患者寻找适当疗法时,获取数据能像操作网上银行那样简单。”Olson说。


用技术打破数据壁垒

推动精准医疗步入快车道


目前肿瘤医生尚未普遍将基因研究新成果应用于日常诊疗,其中一个重要原因是他们缺少迅速洞察数据、确定最佳疗法的可视化工具和分析软件。


  目前对分子图谱的分析和临床解读最少也需要数周才能完成,而对临床医生来说,他们需要一个更综合的平台,将基因组信息与患者临床数据结合,从而找到最有效、精准的治疗方案。更为复杂的是,不同的医疗费用支付机构对临床应用的评判标准也不同,这导致针对基于NGS测试的保险支付费率参差不齐。这些问题的叠加,严重阻碍了基因组学的医疗应用,也阻碍了以此为基础的精准治疗的临床普及。


  英特尔致力于借助自己在计算领域的实力为解决这一难题提供可行性方案。在与全球领先生物企业凯杰(Qiagen)的合作中,英特尔的计算实力与凯杰在生物信息领域逾三十年的丰富经验联合,成功打造了“从样本到洞察”解决方案,覆盖了基因测序诊断全过程,包括样本准备、测序、分析、数据解读和报告,并能帮助测试实验室及医生制定临床方案。这一方案在丹麦一家医院的成功运用,帮助了陷入绝境的40%的晚期癌症患者发现了其特定的基因突变,让其中半数患者获得了副作用更小、也可能更有效的治疗。


  在中国,2016年4月,英特尔宣布与华大基因在阿里云计算平台合作部署的服务产品BGIOnline测试版本正式上线,可以更快捷、便利地推动基因组测序在行业中的普及,英特尔希望到2020年,在24小时内完成对一个人的全部基因组测序。


  英特尔健康与生命科学解决方案高级架构师Michael McManus博士是高分子化学家和合成有机化学家,他职业生涯的大部分时间都致力于为基因组学和生物信息学提供计算解决方案。他指出:“数据分析的速度越快,也就能越及时地帮助医生确定治疗方案。”英特尔提供的解决方案中,利用开源的商业基因组分析软件,借助硬件OEM合作伙伴的力量,帮助科研人员简化基因组测序的工作流程,并极大降低总拥有成本。


  在McManus博士帮助各大临床实验室进行的典型基因工作流程中,他们会将从患者血液或肿瘤样本中提取的DNA用基因组测序仪器进行处理,获取检测数据后,科研人员会使用高性能计算(HPC)集群迅速地进行基因分析,以获取生物信息,从中得到的结果可用于破译具有临床意义的基因突变,从而引导临床医生选择和定制治疗方案。


医用腕带

“我们可以将基因组的数据处理工作流程看作一场化学反应,我们的集群规模指南能告诉你最初需要什么,随着规模扩大还会需要什么。”

——McManus博士


  英特尔可扩展系统框架(SSF)可以作为基因组集群的参考架构基础,在处理更大量基因组数据的同时,通过更高效的硬件设备设计降低所需节点个数。在与凯杰的合作中,英特尔设计了专门的32节点集群搭配10台测序仪(Illumina HiSeqX Ten系统)进行基因组学数据分析。“我们帮助凯杰制定的解决方案能将每次全基因组分析的费用降低至22美元。”McManus博士表示。英特尔与凯杰在基因测序方面的技术,让中国的医院和检测机构终端亦能从中获益。


  速度提升后,科研机构和医院的下一个重大需求,便是如何准确地预测每个基因组集群的处理量。“这样才能按照预测的样本增加数量来衡量所需的额外计算和存储硬件,从而将投资效率最大化。”McManus博士指出。


  英特尔与美国博德研究所(Broad Institute)共同打造的开创性架构“博德-英特尔基因组学堆栈(BIGstack)已经成为构建低成本分析能力的全新模式,对BIGstack的初期分析显示,借助英特尔的CPU、基于Omni Path Architecture的高速互连技术、GenomicsDB、固态盘及其他特定的架构优化及改进型技术,博德研究所基因组分析处理量提升了五倍。

医用腕带

精准医疗的实现需要正确的“打开方式”,除了必要的投资与管理支持外,对医疗机构来说,易于操作的、能够让患者的综合信息与基因数据库实时交互的平台非常重要。“当更多的医疗机构拥有基因组测序和数据分析能力时,更多的患者将因此受益。”

——英特尔健康与生命科学事业部

全球总经理Jennifer Esposito


  目前BIGstack已向博德研究所旗下深受欢迎的基因组分析工具GATK的45000名注册用户开放,包括学术人员、非盈利组织雇员及商业用户。


点击这里给我发消息
点击这里给我发消息