【正襟危坐摆事实:再现研究】


卵巢癌有效的治疗是实施最大限度的肿瘤细胞减灭术(CRS),联合TC方案化疗;或新辅助化疗 3周期,继以中间性肿瘤细胞减灭术。腹腔化疗可增加化疗药物局部吸收,更有效地消除腹膜微小残留病灶,改善预后,但导管相关问题、胃肠和肾脏的不良反应阻碍了该方法的推广应用。在中间性肿瘤细胞减灭术中实施腹腔热灌注化疗(HIPEC),可保持腹腔化疗的优势,克服不足之处。近期N Engl J Med.【2018,18;378(3):230-240】报道了一项多中心、随机对照临床试验,首次探讨III期卵巢癌/输卵管/腹膜癌患者在中间性肿瘤细胞减灭术中实施HIPEC的意义。

 

·HIPEC在卵巢癌应用的依据


HIPEC在结肠癌中应用普遍,新近van Driel WJ和Cowan RA单中心及回顾性队列研究论证了原发性卵巢癌患者接受HIPEC有显著生存获益;Spiliotis J 于2006-2013年间将120例IIIc/IV复发性卵巢癌患者随机分为两组:A组 60例CRS+HIPEC+化疗,B组 60例单纯CRS+化疗。A组中位总生存期(OS)为26.7个月,B组为13.4个月(p<0.006);3年生存率:A组为75%,B组为18%(p<0.01);对于HIPEC,亚组分析显示无论铂类耐药或铂类敏感的复发患者中位OS没有差异(26.6 vs. 26.8个月),而非HIPEC组,中位OS亚组间差异显著(15.2vs 10.2个月,P<0.002)

 

·研究设计


本研究系2007年4月至2016年4月荷兰和比利时8个医疗中心开展的随机对照3期临床试验,研究对象为新确诊的245名Ⅲ期上皮性卵巢/输卵管/腹膜癌患者,因肿瘤广泛播散不能实施肿瘤细胞减灭术或初次为非满意的减灭术,WHO体能状态评分为0-2分,血常规及肾功能均正常;患者术前接受3程NACT,方案为TC,即卡铂(AUC5-6AUC)联合紫杉醇(175mg/m2),继以中间性肿瘤细胞减灭术,术后完成3程TC方案化疗。完全性肿瘤细胞减灭术定义为无肉眼残存病灶(R-1);满意的肿瘤细胞减灭术是指存在一个或多个残留病灶,测量直径小于2.5mm(R-2a)或直径2.5〜10mm(R-2b);不满意肿瘤细胞减灭术是指存在一个或多个直径超过10mm的残留灶。术中按1:1比例随机分配患者入组:单纯手术组和手术联合HIPEC。随访:最初两年随访每3个月1次,其后每6月1次,至化疗结束后5年,随访内容包括:体格检查、CA125、术后1, 6, 12和24个月全腹CT扫描。健康相关的生活质量问卷参考EORTC标准,采集时间为随机分组前2周、第4程化疗前、完成化疗后1周、随访期3, 6, 9,12, 15, 18, 21, 24月。

      

·观察终点


主要终点是无复发生存期(RFS),其定义为从随机分组到疾病复发、进展或死亡的时间;疾病进展采用实体瘤疗效评价标准(RECIST)1.1版本,或CA-125水平升高,首先满足这两个标准中的任何一个(GCIG推荐标准,本研究参考的标准为GCIG推荐标准为组B标准。)。


次要终点:OS、不良反应和健康相关的生活质量。


卵巢癌一线治疗后GCIG推荐的进展定义

* 重复CA 125检测,间隔时间至少超过1周

 

·术中腹腔热灌注化疗(HIPEC)


HIPEC于肿瘤细胞减灭术结束后开放进行。具体步骤:腹部充满生理盐水,通过滚动泵进行连续循环热交换,腹腔内温度保持40°C(104°F),顺铂(100mg/m2)以1L/min流速腹腔灌注(初始灌注50%,其后30 min灌注25%,60 min灌注25%);HIPEC总过程为120min,灌注期为90min,灌注结束后排净灌注液。为防止肾毒性,于灌注开始给予硫代硫酸钠9g/m2  200ml静滴,其后12g/m2  1000ml连续输注不少于6h,在温热灌注期尿量保持1ml/kg/h,至术后3h。

 

·研究结果


中位随访4.7年,单纯手术组110/123例患者(89%)、手术联合HIPEC组99/122例(81%)患者复发或死亡(HR=0.66;95%CI 0.50-0.87;P = 0.003);单纯手术组中位RFS为10.7个月,手术联合HIPEC组为14.2个月;3年无复发生存率:单纯手术组为8%(95%CI 4-16),手术联合HIPEC组为17%(95% CI 11-26)。单纯手术组76例(62%)患者、手术联合HIPEC组61例(50%)患者死亡(HR=0.67;95%CI 0.48-0.94;P = 0.02);单纯手术组中位OS为33.9个月,手术联合HIPEC组为45.7个月;3年总生存率:单纯手术组为48 %(95 % CI 39- 58),手术联合HIPEC组为62 %(95 % CI54-72)。不良事件最常见表现为腹痛、感染和肠梗阻,发生率组间无显著差异,最常见表现为腹痛、感染和肠梗阻3或4级不良事件单纯手术组报告30例(25%),手术联合HIPEC组32例(27%)(P = 0.76)。59例患者(单纯手术组30例,手术联合HIPEC组29例)行肠切除术,其中结肠造口术或回肠造口术在手术联合HIPEC组(21/29例 72%)较单纯手术组(13/30例 43%)更为常见(P = 0.04);手术结束至重启化疗的时间两组相似(单纯手术组30d vs 手术联合HIPEC组33d);术后3周期化疗完成率两组类似(单纯手术组90% vs手术联合HIPEC组94%);中位住院时间单纯手术组为8d,手术联合HIPEC组为10d;单纯手术组11例、手术联合HIPEC组9例患者复发后没有再进行治疗,健康相关生活质量评分组间没有显著差异。


·HIPEC的安全性


本研究证实HIPEC有效且安全,术后并发症发生率、3或4级不良事件、健康相关生活质量组间没有显著差异,术后重启静脉化疗两组都没有延迟,HIPEC对化疗周期数也没有影响。


·有趣的现象


HIPEC对RFS和OS的影响是相似的,HR分别为0.66和0.67,而差异在于OS较RFS绝对获益,尽管复发后不再治疗的患者数量在单纯手术组和手术联合HIPEC组相似,但手术联合HIPEC组复发率高,而死亡率低。GOG-172也发现这一现象,腹腔化疗组RFS和OS分别为5.5个月和15.9个月,其原因尚不清楚。

 

·本研究的借鉴意义——亮点与启发


接受NACT的III期上皮性卵巢癌患者,肿瘤细胞减灭术中联合HIPEC,可延长无复发生存期和总生存期,并不增加不良反应发生率。这一重要发现将为卵巢癌指南修订提供重要参考,并为我们带来启发:HIPEC是否可用于AEOC初始肿瘤细胞减灭术?HIPEC是否可担当新辅助化疗的角色?HIPEC是否可作为铂类耐药患者的二线或三线治疗方案的选择?要解答上述问题,或许只有期待相关的III期临床试验包括NCT03180177、NCT03373058和NCT03371693结果。




【再回首:其实是个科学兼哲学问题】


【对象】III期上皮性卵巢癌,两组均先完成3疗程新辅助化疗(泰素175mg/m2,卡铂AUC=5~6)。然后两组均行满意的卵巢癌减灭术。非热疗组(123人),热疗组(122人),热疗方法为术后当日留管热疗。热疗术中顺铂用量100mg/m2。然后2组均再次采用泰素+卡铂静脉化疗3次。


【结果】无瘤生存时间(PFS)非热疗组为10.7月,热疗组14.2月。随访4.7年,非热疗组62%死于肿瘤,热疗组50%死于肿瘤(P=0.02)。总生存时间(OS)非热疗组33.9月,热疗组45.9月。


【缺点思考】(一)热疗组与对照组相比,多了一次顺铂暴露(热灌注)。这无疑是一个非常致命的混杂因素,更严谨的说是分组的不匹配。如若达到匹配或者去除混杂,可以设定对照组用一次顺铂腹腔化疗或者灌注留置2小时后排出,因此该RCT的证据级别打了折扣!(二)本研究跨度9年,来自于8个医学中心,结肠造口术或回肠造口术在手术联合HIPEC组(21/29例 72%)较单纯手术组(13/30例 43%)更为常见(P = 0.04),这不能排除人为主观因素对于拟行HIPEC患者给予更激进、更努力的手术以达到“optimal”。




【不甘吃瓜讲道理:证据级别与循证】


循证医学(EBM)在我们为谋生而碌碌奔波的人眼里,大体就是翻箱倒柜地找文献、刮数据,再绞尽脑汁做统计,整一篇Meta分析,争取发上3分。可是我们为什么要这么做呢?为什么有的Meta评价和引用都很高,有的只好沦落为灌水文?也许我们应该从海量文献和数据中抬起头来,从稍高一些的视角中看一下循证医学的面貌,它到底是什么,需要什么,我们要怎么做才能实现它的价值。

 

循证医学的三大原则:第一是认识到并非所有证据都生而平等,所以我们才要找更充分的证据来支持我们的决策。第二要追求真理,就应该总览所有证据,而不是因某种目的筛选过的证据。第三则提醒医生们注意,证据只是必要条件而非充分条件,对个体案例,要放到具体情况中考虑,比如患者的价值观和个人喜好。



·怎样的证据才是好证据?


上图证据等级的金字塔我们再熟悉不过了,它是循证医学早年广为采用的证据分级(1991 - 2004)。可以看到RCT是无可匹敌的最高级证据,因为理论上它可以尽量控制混杂因素的干扰,观察到某个变量的“最纯萃”的效应。但人们最终还是认识到了它的bug。就如同我们上面分析的N Engl J Med.2018,18;378(3):230-240这一项多中心、随机对照临床试验。


首先,RCT跟RCT也不一样。到底能不能控制混杂因素,还看研究者怎么操作;其次,样本量不一样,它所代表的群体和统计功效也不一样。退一步讲,就算研究者能控制的部分已经控制得很完美,但还有些问题是由于伦理等原因不能用RCT来研究。于是新的证据评级方案应运而生(下图)。



2004年发表在BMJ上的GRADE就是更为成熟的分级系统,它周全地考虑到了构成证据可信度的多个方面,包括设计类型,偏倚风险,精确度,一致性,适应性,效应量,剂量梯度等等。虽然观察性研究在设计上的“先天条件”使其证据等级低于随机试验,但做好了加分项,仍可上升1~2级,反之亦然。


此外,影响证据等级的除了研究操作过程,还有书写、汇报的质量也需要关注。过去25年中发展出了各种研究类型的规范化流程,比如RCT中的CONSORT声明是我们最熟悉不过的。



·搜刮证据,系统综述的崛起


认识到并非所有证据都生而平等之后,就要搜罗所有能找到的证据,进行总体及逐一评价,根据研究的具体问题进行纳入排除,选择优质证据,综观它们所指向的结论,这就是系统综述。若最终纳入的研究数据可以融合,则进行Meta分析,这就是定量系统综述。


评价一篇系统综述是干货还是灌水文,其中一个很重要的指标就是看它是否进行了广泛的文献检索,除了在各大文献数据库中检索正式发表的文献,还有各种灰色文献,如会议报告、学位论文等等。


系统综述也曾经乱入那个金字塔证据分级模型中,成为比RCT更高级的证据。但这却是混肴概念,RCT是一种研究设计类型,而系统综述是收集并综合评价证据的方法,两者不在一个层面,系统综述也可以用来评价队列研究、病例对照研究,甚至病例报告等。


当人们理清了系统综述的作用,也就能更充分地利用它。既然它是针对某一问题的当前所有证据的汇总,那么一个直接的作用就是避免重复研究,浪费资源。有些期刊,比如Lancet,要求发表一个原始研究时,一定要阐述该问题范围内,已有哪些研究、哪些成果,你的研究在此基础上有什么推进,要直接引用一个系统综述来佐证。


另一个作用就是指导临床指南的制定,这对医生的临床决策有很大的影响,也是科研成果向临床转化的桥梁。


基于及时的系统综述来制定的临床指南,为医疗活动带来了很大的变革,包括建立标准化的疗法规范等等。但由于近年来个体化医疗越来越被重视,标准化的指南就面临着质疑。这一套标准方案是否适用于每个患者?是否应该被机械的执行?这就有了第三个原则。

 

·证据只是决策的必要条件


循证医学之所以诞生的理念,就是为临床医生提供更好的决策方案。所以脱离决策而细究证据,就有点本末倒置。大家都知道,临床环境是复杂的,在有了医学证据的前提下,还要考虑许多因素。


GRADE系统除了讨论证据等级外,还有它对决策的影响。其实它的名字就透露了这点——GRADE代表:Grades of Recommendation Assessment, Development, and Evaluation。相比传统的证据分级,它最明显的进步就是考虑到从证据评价到决策和推荐(即临床转化)的过程,更看重实践价值。



除了证据质量的必要条件外,还有由该决策所获的益处或负担、损害的程度(即决策的效率),患者个人的价值取向和喜好,这些都是做决策的核心参数;其他参数则有资源(成本)、可行性、可接受性、公平性等。


西方国家似乎更强调患者的自主权,让患者参与到决策中来。当前我国也有一点倾向。实际上,在世界上任何一个医疗体系中都要慬慎,对于那些恨不得立马撕毁所有指南的言论都无法苟同。在决策过程中,医学证据和个人价值取向的比重如何分配权衡?法律上怎样处理?这些问题极其需要严谨讨论与。


上述讨论终究使我们醒悟:证据本身并不能决定一个临床决策,只有把证据放在具体的案例环境中才有意义。也许将来的循证医学会开拓这片疆土。