首页
会员中心
到顶部
到尾部
科研资料

如何获取“高质量数据”——大数据于临床医学价值的全景剖析

分享到
时间:2018/3/22 15:22:39  作者:未知  来源:动脉网  查看:374  评论:0

 

对于临床医生在日常诊疗工作的同时,还承担众多医学科研任务这个话题,业内至今仍颇多争议。
 
现阶段,三级教学医院医生将大量的精力投入在病人诊治、自身学习以及医学教学工作中,能够开展科研项目的时间少之又少,而基层医院医生开展科研的能力、接触有价值病例的机会又相对不足,如此得到的科研成果也差强人意。
 
临床医生到底应该以诊疗工作为主,还是学术科研为主?两者在促进临床诊疗和科研水平的提高中,本应相辅相成,互相促进,但现实面临的问题,又困扰着医生群体、管理部门、乃至整个社会民众。
 
随着医疗大数据领域技术的进步和实际应用的快速发展,这一矛盾能否解决,并充分的互相反哺和促进?基于这样的问题,动脉网与医疗工作者和大数据领域专家进行了对话,希望能从他们那里,探索新形式下的思考和方向。
 
一、临床诊疗与科研脱节:数据处理是瓶颈
 
现阶段,国内医疗资源还是集中在大的三甲医院中,这导致医生在临床上的工作强度非常大。要在临床工作中穿插完成科研工作,时间和精力的分配面临着巨大压力。
 
哈尔滨医科大学胸外科马建群教授告诉记者:“我个人科研时间大概占30%左右,大部分时间还是投入到临床工作中。明年我们医院准备引进一位专门从事科研的人员,以提高我们科室的科研效率。
 
要让临床医生只用30%左右的时间产出高质量的科研成果,显然不太现实。过去我们写科研论文先要查阅文献、参加外部学术会议、了解国际学术动态、确定科研方向,然后要设计研究方案,收集临床病例数据,查阅病理切片和其他检查报告,或开展病例治疗和随访工作。
 
特殊病例报道由于数量少,分析一般很快,一两周就能完成;临床经验总结的回顾性论文普遍要慢一些,一般花费1到2个月左右时间;如果是科研课题,那么需要花费的时间就更长了,至少要半年时间收集、整理和分析数据、然后做统计学处理,整个研究基本以年度计算。但从科研价值上看,前瞻性、随机性的科研课题比起前两种会更具指导意义。”
 
哈尔滨医科大学放疗科刘晖教授则认为:“医生要做临床研究,随访是一个非常核心的部分。如总生存期 (OS,Overall Survival)、五年生存周期、不良反应等评判都需要长期的随访支撑,离开了随访的数据积累,临床研究价值根本无从谈起。
 
过去我们做科研主要和医院病案室进行衔接,我们提出申请及患者姓名,由病案室给我们随访。一个小型课题至少也得50份病历,大一些的课题可能就要数百份病历,就单单调取病案号都要很长时间。病历调出之后,才是病案室的随访环节。假如这数百个患者的随访得到的信息不完善,还得重新补充随访,这耗费的时间就更长了。”
 
首先,临床工作占据了医生大部分时间,使得医生在科研上投入的精力相对有限。
 
其次,病历数据的收集和查询大大延长了医生的科研周期。由于过去医生在使用电子病历时缺乏数据结构化录入,更多是用文字的形式记录下来,医院过往的电子病历中留存着大段的空白段落,这让医院在科研数据利用等方面存在困难。
 
所以,如何将这些存量数据进行高效、准确地结构化处理,在临床诊疗与医学科研之间建立一条“数据通路”,或许是解决问题的关键。
 
二、从高质量数据获取到提出临床科研解决方案
 
数据是医生科研的基础,这一点毫无疑问。但问题是医生究竟需要怎样的数据进行支撑?这一点,需要真正明确。
 
对此,杨海英表示:“目前国内对临床研究数据规范化、标准化处理的经验在不断地积累,并依据和参考一系列的国际化标准。但目前仍然存在着数据标准不一致、各医院或研究单位数据不能集成共享等问题。高质量、大数量、良好结构化的医疗数据,才会对科研效率的提升和科研成果的产出有重要价值。”
 
怎样帮助医生获得一份高质量的数据,在杨海英看来,这涉及三个方面:
 
第一,医院EMR(Electronic Medical Record,电子病历)的数据质量。“为什么一些杂志上的论文被下架,就是因为这些论文在数据处理过程中,存在弄虚作假的情况。这与医生书写EMR的规范性、自律性有关。”
 
因此医院在使用临床数据采集系统时,病历书写应尽可能完整和标准,以电子病历为平台,建立临床科研一体化病历书写与采集体系,在实现科研数据收集的同时,不增加日常工作量。
 
第二,医院EMR数据的处理环节,尤其是数据结构化的过程,这直接决定着科研数据的质量好坏。基于大数据和人工智能技术的后结构化数据处理,是解决这一问题的主要技术之一。
 
通过后结构化处理,在保证医生书写的原始病历数据可溯源的基础上,实现对既往病历的结构化处理,满足科研数据采集需求。
 
第三,数据质控/核查/数据分析环节。医疗大数据企业必须有专业的质控团队进行数据的核查,包括人工核查、逻辑核查和医学核查,并且每年都需要对相关人员进行一次资质考核。
 
此外,医生采用的统计方法是影响数据质量的重要因素。国外的杂志普遍对统计方法学十分看重,如该项研究所涉及的人群筛选、统计方法等,因此需要专业的统计团队针对数据进行统计分析。
 
杨海英表示:“从标准的数据采集、高效高质量的数据结构化,到数据平台中心提供的高效率的人工审核、逻辑核查,这一整套框架体系的搭建非常困难,而我们正是基于这样一整套智能化数据处理体系,来保证处理的海量数据的质量以及为医生所提供的临床科研解决方案的规范和严谨。”
 
三、大数据于临床医学价值的探索与呈现
 
在探讨完医生科研的问题和解决方案之后,我们不禁要问,高质量的科研级数据会对整个医疗行业产生何种价值?从医疗机构和企业的实践案例中,动脉网找到了以下4个方面的答案:
 
支撑从RCT到RWS的扩展
 
RWS(Real-World Study,真实世界研究)起源于实用性的临床试验,是基于临床真实的情况采取的一种非随机、开放性、不使用安慰剂的研究,其得出的结果具有很高的外部有效性。
 
真实世界研究的大数据来源非常广泛,可以是患者在门诊、住院、检查、手术、药房、可穿戴设备等多种渠道产生的海量数据,可纳入患有多种疾病、且病情较复杂的患者。
 
杨海英表示:“在临床诊疗实践中,每年都会有新的药物和诊疗手段出现。这些新技术要用于比临床研究中受试患者更广泛的人群,还面临着很多实际应用的问题。因为真实世界人群要远远大于药物、器械等研究环节的人群。因此如何放大到RWS(真实世界研究),还困难重重。”
 
如药物联合其他治疗手段的可行性、药物的治疗周期、符合中国人群的剂量等,这些都是临床医生每天面临的问题。这需要医生从实践中总结经验、数据和依据,得出不同患者的最合理的治疗方案。
 
真正要把临床数据用好,就必然要在数据产生和累积的过程中实现规范化。
 
吴阶平医学基金会肿瘤医学部副主任委员姚晨教授在对比RCT(Randomized Controlled Trial,随机对照研究)和RWR(同RWS)时提出,相对于RCT强调标准化治疗,而且一般都在临床试验机构实施,RWR更强调真实的治疗,且可以在所有医疗机构开展。
 
2016年底,美国国会通过《21世纪治愈法案》(21st Century Cures Act),以及对可以利用“真实世界证据”取代传统临床试验进行扩大适应症的批准,更是确定了基于大量病例积累数据的真实世界研究(RWS)的重要意义。
 
推动中国指南建设
 
所谓临床指南,是指通过研究生成的证据以及对各种备选干预方式的利弊评价之后提出的最优指导意见。国外的指南存在大量的临床依据,常常被中国应用和参考。
 
但由于人群差异性和基因特征,不同人种的治疗方案存在差异,因此中国必须有基于中国人群证据体系的指南。
 
在这一点上,数据的价值便凸显出来,医生将自己临床过程中的诊疗经验,通过数据进行专业、系统地分析处理,这样无论是临床对照研究结果,还是基于病例数据的真实世界研究结果,都构成了高等级的临床证据。
 
杨海英称:“目前基于中国人群的前瞻性临床研究证据积累不够,但是可以通过真实世界研究的结果在一定程度上进行弥补,我们希望这些证据可以协助中国的肿瘤专家完善中国的指南,进而指导医生的诊疗行为。”
 
“其实建立了高质量的医疗大数据库,借助目前的技术手段,医生诊疗和科研的矛盾会得到很有效地解决,”杨海英说。
 
2017年9月,由吴阶平医学基金会肿瘤医学部牵头主持,天津市胸科医院、四川华西医院、河南省肿瘤医院、中日友好医院等10家医院共同参与的“胸部肿瘤大数据临床科研协作”项目,经过对10家医院近4年的病历汇集,累积肺癌病历超过32000份,食管癌病历超过16000份,依托LinkDoc进行数据处理的真实世界数据库,凭借高价值、完整数据处理的科研解决方案,最终在4个半月里完成10个真实世界研究,并于2018年初向全球最大亦最具影响力的肿瘤组织ASCO(美国临床肿瘤学会)投稿10篇。
 
吴阶平医学基金会肿瘤医学部主委张逊教授指出,不同医院的数据汇聚到一起对科研效率和成果有显着提升。
 
基于真实世界数据的多中心临床科研协作研究,能快速提升中国胸外科临床医生的科研能力和临床水平,从而加强中国胸外科临床专家在国际舞台上的话语权。
 
支持AI辅助医生诊疗
 
作为国内知名三甲医院,哈尔滨医科大学胸外科在应用方面有着不少建树。据马建群教授介绍,他们科室采用大数据分析工具,帮助医生在做患者的精准肺段时,肺段切除与肺楔形切除相比,两者各自的优势在哪,可以根据工具提供的结构化数据库进行科研分析来得出答案。
 
“假设在一定年龄段之中,在一定的大小范围(如1cm)之内,患者做精准肺段切除和常规的肺楔形切除无差别,那可能以后我们就不会再对该类患者进行精准肺段切除了。因为肺楔形切除又简便、又省时、又省成本,对病人的伤害小。”
 
哈尔滨医科大学胸外科的应用告诉我们,高质量、多组学数据集的价值并不局限于科研。基于这些数据,可以通过深度学习形成人工智能辅助诊疗工具,从而帮助医生提高诊疗效率。
 
据杨海英介绍,目前辅助临床诊疗的人工智能产品,一类是基于知识库(临床指南、相关文献),只能做到按照临床指南,文献依据,给出某一类患者固定的诊疗建议,但由于不同患者的特征差异,存在一定的局限性。
 
另外一类是基于病历数据和算法模型的人工智能临床辅助产品,通过将患者真实的病历数据和算法模型,构建精准的诊疗模型并提供数据支持,从而可以指导典型病例、罕见病例的临床诊疗决策。而完全基于中国病例数据的底层数据和训练材料,将更利于实现在中国人群及临床个体病例的应用价值。
 
加速新药研发,扩大药物适应症
 
利用大数据挖掘和人工智能技术,从散布在世界各地的大量的专利、临床试验结果等海量信息中提取出能够推动药物研发的知识,提出新的可以被验证的假说,从而加速药物研发的过程。
 
此外,国家明文规定药物上市以后5年内,药企必须要提交药物安全性监测数据,否则药物面临退市的风险。而基于真实世界的大数据则是药企完成这类法规需求的好方法。
 
一位医药行业从业者告诉动脉网:“药企传统上只能通过昂贵的RCT临床试验,经历漫长的时间去发现新的适应症。并且,不仅注册标准的经费非常高,而且担的风险也较高。而RWS可以帮助药企和专家提前做分析,提前启动实验。”
 
另一方面,医生基于产品说明书来决定药物的使用范围。
 
事实上,很多医院都会出现超出药物产品说明书的使用情况,医生根据自己的经验判断去开具药方,这个情况在看整个药品行业中并不少见,如果能通过智能化数据处理平台,不仅可以很好的控制研究费用,且可以最大化的探索临床疗效和安全性,药企便能够以此为证据,决定是否需要扩大产品的适应症,从而为药物打开更旷阔的使用空间。
 
四、大数据赋能临床医学:技术能力是基础,专业医学能力是核心
 
综上可以看出,医疗大数据企业对于整个医疗行业的赋能关键在于两点:
 
一是技术能力,包括建立真实世界数据库、搭建大数据处理系统/平台,人工智能平台等。
 
二是医学能力,包括主导疾病数据库设计,进行标准、规范化数据处理和质量控制,以及真实世界科研设计,数据管理、标准严谨的数据统计分析等。
 
当前,随着如零氪科技、太美医疗等国内主要医疗大数据企业,相继获得了C轮融资,医疗大数据在悄然中,进入了下半场时间。在今年年初,罗氏宣布拟以19亿美元收购肿瘤大数据公司Flatiron Health之后,行业的变革讯号正变得越发强烈。
 
医疗大数据企业,能够辅助医生研发临床科研工作,提供有价值、真正帮助到医生,乃至患者的医学解决方案。
 
如果将这种服务看做是一种赋能,那么这种赋能是一种结合了技术和医学双重维度的价值体现,即以专业的技术和医学能力为基础,给予医疗服务方、医生、药企、保险机构等提供一整套医疗解决方案,最终帮助到患者的治疗,提升患者的就医体验,而要实现这个过程,技术能力是基础,专业医学能力则是核心。


中国全科医学杂志社 版权所有 2007 Chinese General Practitioner All Rights Reserved.京ICP备05034767号-1
Powered by OTCMS V2.2