【学术看点】魏丽惠教授:探讨大数据下的科研思路

作者:魏丽惠 单位:北京大学人民医院 来源: 编者:
2019-2-18 阅读


【专家简介】魏丽惠,女,教授、博士生导师,现任北京大学妇产科学系名誉主任、中国医师协会妇产科分会副会长、中国优生科学协会阴道镜及宫颈病理学分会主任委员;《中华妇产科杂志》副总编辑、《中国妇产科临床杂志》主编;原中华医学会妇产科学会副主任委员、中华医学会妇科肿瘤学分会副主任委员、中华医学会北京分会副会长及妇产科学分会主任委员。中国女医师协会副会长。第九、十、十一届全国人大代表。1997年享受国家特殊津贴。 多年来从事妇产科医疗、科研和教学工作,担任妇科主任多年。在妇科和妇科肿瘤诊治中有丰富的临床经验,处理了大量妇科疑难病症;承担院内外多量疑难病症的会诊。科研上在妇科恶性肿瘤方面开展了多项研究。先后进行了卵巢癌的临床治疗;子宫内膜癌发病机制与临床治疗等相关研究;开展了子宫颈癌及其癌前病变研究;推动开展了妇科盆底功能重建的临床和研究。先后承担多项国家、部委、北京市、北京大学等多项基金;发表论文四百余篇;主编、参编专业书籍10余部,培养博士研究生68名,先后获国家教育部、中华医学会、北京市等多项科研奖。


大数据带来的理念冲击相信大家都已经看到。在当前信息飞快发展的大数据时代,各种信息几乎以瞬时速度在全球传播。这是一个发展极其迅速,各种观念日新月异的时代,习总书记提出“在激烈的竞争中,唯创新者进,唯创新者强,唯创新者胜”。若想走在这个时代前列,要有创新的思维,要结合大数据,要充分理解网络时代带给我们的冲击。临床医生是以临床经验和循证医学为基础的职业,如何站在时代的潮流中去认识、去思考信息时代带来的对旧观念的冲击和理念的更新非常重要。


大数据时代已经来临,它将在众多领域掀起变革的巨浪。纵观20多年来,从信息时代(互联网)到大数据时代(互联网+)再到人工智能(BI到AI),大数据的发展日新月异,我们应该深入了解大数据的发展现状、发展趋势及其影响,树立以大数据为基础的科研思路。随着大数据在生命医学的应用逐步扩大,将涉及到精准医疗、医疗决策、投资决策、医学研究、健康管理、AI诊断等方面。在本文中,北京大学魏丽惠教授从大数据的概念、基因组学与大数据的关系、基因组学大数据在临床治疗中的研究现状与发展前景一一作了介绍。



一、大数据的概述


大数据(big data, mega data),或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产,是以多元形式,多来源搜集来的庞大数据组,往往具有实时性。


大数据具有5大特点(5V):大数据量(Volume)、高速(Velocity)、多样化(Variety)、价值(Value)、真实性(Veracity)。曾用1秒定律形容大数据的高速特点,而现在互联网的速度已不仅仅是秒速度,甚至是光速度。


大数据并不是用随机分析法(抽样调查)的传统捷径,而采用所有数据进行分析处理。由此引发相关的问题包括:对数据库高并发读写要求、对海量数据的高效率存储和访问需求、对数据库高可扩展性和高可用性的需求。


国际数据公司(IDC)预计,未来全球数据总量增长率将维持在50%左右,到2020年全球数据总量将达到40ZB,其中,中国将占全球的21%,达到8.6ZB。


二、从基因组学看大数据


基因组学是研究生物基因组和如何利用基因的一门学问,是研究生物基因组的组成、组内各基因的精确结构、相互关系及表达调控的科学。基因组学、转录组学、蛋白质组学与代谢组学等一同构成系统生物学的组学生物技术基础。

大数据-基因组学涉及基因作图、基因测序和整个基因组功能分析的遗传学分支,该学科提供基因组信息以及相关数据系统利用,试图解决生物、医学和工业领域的重大问题。


1、人类基因组计划



人类基因组计划是一项规模宏大的,跨国、跨学科的科学探索工程,位列三大科学计划(阿波罗登月计划、曼哈顿原子弹计划和人类基因组计划)之一,被誉为生命科学的“登月计划”。于1985年由美国科学家率先提出,1990年正式启动,美国、英国、法国、德国、日本和我国科学家共同参与了这项预算达30亿美元的人类基因组计划。


中国是世界上人口最多的国家,有56个民族和极为丰富的病种资源,由于长期的相对的社会封闭,在一些地区形成了极为难得的族群和遗传隔离群,一些多世代、多个体的大家系具有典型的遗传性状,这些都是克隆相关基因的宝贵材料。


人类基因组计划(human genome project,HGP)首先是进行基因组DNA测序,测定组成人类染色体(单倍体)的4万个基因30亿个碱基对组成的核苷酸序列,发现所有人类基因,找出它们在染色体上的位置。绘制人类基因组图谱,辨识其载有的基因及其序列。破译人类遗传信息。至2001年,人类基因组工作草图发表,2005年,人类基因组计划的测序工作已经完成,基本破译人类所有的遗传密码。


2.基因组学的研究现状


目前基因组学研究由基因组DNA测序逐渐过渡到功能基因组学和结构基因组学。


基因组DNA测序是人类对自身基因组认识的第一步,现在认为的非洲是整个人类的起源,也是通过基因组测序发现的。


随着测序的完成,功能基因组学研究成为研究的主流,从基因组信息与外界环境相互作用的高度,阐明基因组的功能,包括DNA序列变异性、基因组表达调控的研究、模式生物体的研究、生物信息学的研究等


而结构基因组学主要是在生物体的整体水平上(如全基因组、全细胞或完整的生物体)测定出全部蛋白质分子、蛋白质-蛋白质、蛋白质-核酸、蛋白质-多糖、蛋白质-蛋白质-核酸-多糖、蛋白质与其他生物分子复合体的精细三维结构。以期获得一幅完整的、能够在细胞中定位以及在各种生物学代谢途径、生理途径、信号传导途径中全部蛋白质在原子水平的三维结构全息图。从而使人们有可能在基因组学、蛋白质组学、分子细胞生物学以致生物体整体水平上理解生命的原理,对疾病机理的阐明和疾病的防治有重要应用意义。


3.基因研究对人类疾病的贡献


人类疾病相关的基因是人类基因组中结构和功能完整性至关重要的信息,如基因诊断、基因治疗、基于基因组信息的疾病预防、疾病易感基因的识别、风险人群生活方式、环境因子的干预。


对于单基因病,采用“定位克隆”和“定位候选克隆”的全新思路,导致了一些疾病,如遗传性结肠癌和乳腺癌等一大批单基因遗传病致病基因的发现,为这些疾病的基因诊断和基因治疗奠定了基础。


对于心血管疾病、肿瘤、糖尿病、神经精神类疾病(老年性痴呆、精神分裂症)、自身免疫性疾病等多基因疾病是目前疾病基因研究的重点。


最近轰动世界的免疫艾滋病的基因编辑婴儿,即基因编辑、造人等也是基因组学研究中的热点,但基因研究之后,如何保证社会安定和人类伦理是非常关键的问题。


大数据对癌症治疗产生了深远的影响。我们正处于一场技术革命之中,大数据为人类生物学和癌症提供了新的见解。大数据时代收集的大量信息,正在改变我们对带癌症治疗和预防的方式,有些癌症可以早期发现和预防,比如癌症的遗传学和表观遗传学、抗癌药物的开发等,都是现在正在探讨的问题。其中,最重要的是需要考虑人口科学、健康差异,包括癌症的差异,癌症患者的预后受种族、文化和社会经济的影响。实际上,在大数据中,癌症治疗已逐渐走向个体。数据共享和在科学中以病人为中心的优先权是同样重要的。


大数据-基因组学对癌症治疗也产生深远影响。通过现有的癌症治疗方法,约50%的患者可以治愈,另外的50%尽管最终死于癌症,但是改善治疗后,相当多的以往致命的癌症,像慢性病一样可以治疗,所以现在对待癌症应像对待慢性病一样。但是在这种情况下,患者会遭受类似慢性病的折磨而影响生活质量,因此,癌症的预防应放入优先级别,这也是2017年在Lancet上发表的美国科学家对待肿瘤的新观点。可以说,现在我们已经远远迈出癌症是“致死性疾病”的概念,在癌症的对待上,如何从基因方面找寻预防策略、如何在靶向治疗等各种治疗手段中合理选用、如何提高患者治疗过程中的生活质量等,走在了前沿。


事实上影响癌症发展的变化潜在干预手段主要集中在当前对基因了解和了解基因的差异。对各种基因的广泛研究,了解癌症的遗传形式,有助于对肿瘤精确地治疗。如对携带BRCA1/BRCA2突变导致肿瘤发生的患者,从多元的、基于精确的诊断的治疗方法,来选择应用ADP-ribose聚合酶抑制剂治疗,是较为成熟的乳腺癌或卵巢癌治疗模式,虽然在国内。目前从最早识别的基因变化及其相关的表达突变蛋白,是可以使基于精确的癌症预防成为可能的。所以大数据下的基因组学是在整体下的个体化,更精细的治疗。


另外,基因组学-大数据对临床治疗常规也产生影响,已成为制定妇科恶性肿瘤诊治规范的依据之一。早期的临床诊疗主要依据经验医学。后来循证医学产生,根据证据分级确定临床诊疗依据,至今为止,循证医学仍然是制定临床诊治常规最多采用和非常重要、非常关键的方法。转化医学是实验室研究与临床实践相互转化的双向循环式(B2B)方法,靶向治疗是其中的典型。现在的精准医学(个体化治疗),实际上就是将大数据和基因组学相融合,将个人基因、环境与生活差异均考虑在内的疾病防治的新模式。可见,目前我们正面临诊治规范制定依据多种方法并存的现状。


三、从大数据到真实世界研究


真实世界研究  根据大数据制定的临床诊疗方案返归到真实世界的利用价值是怎样的,也就是所谓的真实世界研究。利用真实世界研究的“真实世界证据”取代传统临床试验进行扩大适应症的批准,是目前应用的非常多一种方法。


真实世界研究是指研究数据来自真实的医疗环境,反映实际诊疗过程和真实条件下的患者健康状况的研究。真实世界研究的数据来源非常广泛,可以是患者在门疗、住院、检查、手术、药房、可穿戴设备、社交媒体等多种渠道产生的海量数据,且所有遗传密码的信息都是大数据。随着大数据在生命医学的应用逐步扩大,将涉及到精准医疗、医疗决策、投资决策、医学研究、健康管理、AI诊断等方面。


真实世界研究与临床随机对照(RCT)研究的区别  RCT作为最高等级的临床证据标准,需要严格控制试验条件,在可能有效的目标人群中进行标准化治疗,样本量小,随访时间短。而在真实世界研究中,可纳入复杂的、患有多种疾病的患者;可以非随机的方式分配治疗;可在治疗中根据患者的需求和临床医师治疗策略变化,同时用多种措施;允许临床医师根据病情和患者全身状况确定剂量,精确地满足患者需要;可以设定更长的研究期限以测量干预措施的远期效益和风险;可以包括更宽泛的指标,如功能指标、患者报告结局、成本效益指标等,使研究证据有更强的外推性,更具临床实用价值。


大数据在妇产科领域中的应用 以4价HPV疫苗的应用为例,4价HPV疫苗先通过小样本RCT证实其有效性,包括起效时间、降低宫颈高级别病变的有效率和降低HPV的感染率等,后应用于一定人群,包括欧洲、美国、加拿大、澳大利亚等,从中得到2006年-2013年的真实世界数据来证实4价HPV疫苗的有效率、药物效果维持时间等。在澳大利亚,19-22岁女性中完成疫苗接种的人群比未接种人群的CIN2/3+发病率下降53%,而在丹麦,1993-1994年出生的女性中,接受疫苗接种的人群比未接种人群的CIN2/3+发病率下降73%。所以,4价HPV疫苗是在经过临床随机对照研究证实其有效后,再通过真实世界数据进一步证实其对CIN2+的真实世界保护效果。现在认为的4价HPV疫苗保护时间可以维持10-12年,九价疫苗是7.6年,都是从真实世界数据中得来的结论。


四、基因组学在妇产科领域的应用


1.对子宫内膜浆液性癌的认识


子宫内膜癌分为I、II型,已被广泛接受,II型子宫内膜癌以子宫内膜浆液性癌(ESC)为代表,虽然ESC仅占子宫内膜癌的10%~15%,但是其恶性程度高,预后差。2014年孔北华团队做大量的研究认为,子宫内膜腺体异型增生(EmGD)可能是子宫内膜浆液性癌(ESC)的癌前病变,研究发现ESC起源于子宫内膜中形态正常而p53免疫反应阳性的子宫内膜细胞(p53印记),经EmGD阶段后发展为子宫内膜上皮内癌(EIC),最终发展至侵袭性ESC。从形态学上可以识别的癌前病变为ESC的早期诊断和降低死亡率提供依据。在WHO 2014年的肿瘤新分类中,将EIC列入子宫内膜浆液性癌中。EIC具有高度侵袭性,诊断时33%-45%有子宫外转移,故手术范围按照卵巢癌肿瘤细胞减灭术进行。以上其实是通过基因组学、大数据和真实世界研究得出的结论。


2.卵巢癌


BRCA基因与异常的相关性导致了新的卵巢癌预防性战略。BRCA是一种与卵巢癌相关的人体抑癌基因,一旦发生突变,机体就将丧失抑制肿瘤发生的功能,导致癌细胞大量繁殖。如果确定是携带BRCA1和BRCA2基因的遗传性卵巢癌家族,发生卵巢癌的风险增加至40%-50%。根据复旦大学附属肿瘤医院吴小华教授等的研究显示,中国卵巢癌患者BRCA突变率为28.45%,其中BRCA1突变率20.82%,BRCA2突变率为7.63%。在BRCA1或BRCA2中与突变有关的各种类型的癌症研究表明,乳腺癌的发生发展与BRCA1突变密切相关。


BRCA基因的发现不仅仅体现在肿瘤的诊断,在治疗方面也有重大突破。PARP抑制剂作为针对BRCA1和BRCA2基因突变的靶向治疗,是最引人注目的精确癌症治疗形式之一。PARP抑制剂被推荐用于所有对铂类治疗敏感的复发性卵巢癌患者的维持治疗(无论是否携带BRCA突变),以及携带BRCA突变卵巢癌患者的三线以后治疗。


五.大数据对医学发展的影响


1.未来医学模式的变化


当前医疗体系面对的是病人,医生主要对病人进行治疗。而未来随着精准医学的发展和组学大数据的介入,任何人在没有得病的时候,我们就能测得其组学数据进行分析,对其未来健康发展的危险因素作出评估,根据评估进行适当干预。从而将整个医疗健康体系的关口前移。


最近北京大学人民医院和全国多家医院合作,正在进行关于阴道镜图像的大数据研究,旨在分析病变并预测病变,已收集15000例资料,未来将进一步验证其效果,这对于基层医院提高阴道镜诊断水平有重要的意义。


2. 大数据下如何重塑医疗的未来


创新使用大数据为未来医疗带来巨大的想象空间,大数据浪潮下的精准医疗,通过预防减少患病,大数据、信息技术创新有望为医疗健康水平提升带来新的动力。大数据帮助我们完成从治疗到预防的跨越,大数据帮助我们带来医疗的创新,帮助人们更好的了解疾病,预防疾病,更健康的生活。如现在正在推广的患者HPV自取样检测联合手机软件能有效的提高筛查效率。我们希望通过大数据能够进一步推动医疗变化,但大数据时代的医疗模式发生的变化,临床医生能跟上吗?这是需要大家深入思考的问题。


综上所述,大数据的观念已运用到各行各业,在医学领域中应用带来了巨大的改变和发展。在大数据的时代,临床医生应具有创新思维,积极运用基因组学-大数据的手段,在预防疾病、诊治疾病、改善患者的预后与生存质量的道路上不断前行。


声明:本文为妇产科在线独家采编,经专家审阅后发布,如需转载,请注明出处!

分享:
免责声明:本网所发布的会议通知,如非特别注明,均来源于互联网,本网转载出于向广大妇产科医生及妇产科从业者传递更多信息、促进学术交流、学习之目的,并不意味着本网赞同其观点或证实其内容的真实性,请广大妇产科医生认真鉴别。如转载稿涉及版权等问题,请立即联系管理员,我们会予以更改或删除相关文章,保证您的权利。对使用本网站信息和服务所引起的后果,本网不负任何责任。

关于我们版权声明业务合作联系方式诚聘英才网站地图帮助中心

互联网药品信息服务资格证 (京)-经营性-2010-0046

妇产科在线 Copyright © 2010 www.cogonline.com. All Rights Reserved 京ICP备15060573号-15 京公网安备110102002631号

妇产科在线所刊载之内容仅用于学术交流目的。您从妇产科在线上获取的信息不得直接用于诊断、治疗疾病及您的健康问题。

本站所有文章版权归原作者所有,转载仅为传播信息促进医学事业发展,如果我们的行为侵犯了您的权益,请及时与我们联系,我们将妥善处理该部分内容。