【2018年5月8日是第六个世界卵巢癌日(world ovarian cancer day;WOCD)。相关数据显示,全球每年有超过22万卵巢癌新发病例,死亡人数达14万。卵巢癌,是我国妇科恶性肿瘤的首位死亡原因。过去10年间,我国卵巢癌发病率增长了30%,死亡率增加了18%,其中城市女性发病率高于农村女性。


女性一生中患卵巢癌的概率是1/70。一般来说,55岁左右的女性群体是卵巢癌发病集中人群,75岁则是卵巢癌患者死亡的高峰阶段。


2018年2月13日,JAMA在线发布了美国疾病预防工作组(US Preventive Services Task Force,USPSTF)针对卵巢癌筛查的最新推荐。USPSTF大约每五年更新一次推荐和指南,本次更新结果基本与2012年版一致。现将原文翻译,以供大家理解,错误之处在所难免,恳请批评指正——张师前】


目的

系统地综述在平均风险妇女中卵巢癌筛查的益处和危害的证据。


数据来源

MEDLINE,PubMed,Cochrane对照试验合作登记处; 从2003年1月1日至2017年1月31日以英文出版的研究报告;2017年11月22日前在目标出版物中持续进行监控。


研究选择

对平均风险妇女进行卵巢癌筛查并报告了死亡率或生活质量结果的随机临床试验。干预措施包括经阴道超声、癌抗原125(CA-125)检测或其组合。比较组是常规护理或不进行筛查。


数据提取和综合

2位评审员进行独立评估和数据抽取。 由于研究数量少和干预措施的异质性,未对结果进行元分析汇集。


主要成果和措施

卵巢癌死亡率,假阳性筛查结果和手术,手术并发症和筛查的心理影响。


结果

纳入四项试验(N = 293 587); 其中3项(n = 293 038)评估卵巢癌死亡率,1项(n = 549)仅报告心理结果。评估的筛查干预措施包括单独经阴道超声,经阴道超声加CA-125检测和单独CA-125检测。CA-125的测试阳性由固定血清水平切割点或基于CA-125水平、CA-125水平随时间的变化和年龄(卵巢癌算法[ROCA]的风险)的专有风险算法定义。没有试验发现卵巢癌死亡率与筛查有显着差异。在2项大型筛查试验中(PLCO和UKCTOCS,n =271103),与筛查相关的卵巢癌,输卵管癌和腹膜癌病例的完全意向筛选分析的结果没有统计学显着差异(PLCO:比率, 1.18 [95%CI,0.82-1.71];UKCTOCS:危险比[HR],经阴道超声和HR的0.91 [95%CI,0.76-1.09],CA-125 ROCA的0.89 [95%CI,0.74-1.08])。在这2项试验中,筛查导致1%的无癌CA-125 ROCA妇女因怀疑卵巢癌而手术,3%有或无CA-125筛查者进行经阴道超声检查,主要手术并发症发生率为3%至15% 。心理危害证据有限但无显着意义,但重复随访扫描和测试的情况下,根据一般健康问卷12(得分4),UKCTOCS参与者的子样本心理发病风险增加(优势比1.28 [95%CI,1.18-1.39])。


结论和相关性

在平均风险的无症状妇女中进行的随机试验中,筛查妇女和没有筛查或常规护理的妇女的卵巢癌死亡率没有显着差异。筛查危害包括手术(主要手术并发症)发现没有癌症的妇女。需要进一步的研究来确定降低卵巢癌发病率和死亡率的有效方法。

————————————

尽管卵巢癌并不常见,但它是美国女性患癌症死亡率的第五大原因。 根据2010年至2014年的数据,估计的年发病率为11.4 / 10万,死亡率为每10万7.4人,预计2017年将有14 080人死于卵巢癌。超过60%的病例在癌症转移后被诊断出来。筛查试验显示对死亡率没有影响,并且有证据表明存在危害;筛查无症状妇女的阳性检查结果通常在手术调查中显示良性盆腔状况或正常卵巢,而癌症病例常常在筛查时遗漏。2012年,美国预防服务工作组(USPSTF)得出结论认为,卵巢癌筛查的危害至少有一定的确定性,并且它发布了针对无症状女性筛查的D级建议。 目前的审查是为了更新有关这一主题的更新建议,更新有关卵巢癌筛查人群的证据。

————————————

方法

审查范围

该证据回顾了两个与无症状妇女卵巢癌筛查的益处和危害有关的关键问题(KQ)(图1)。关于检索策略,详细研究纳入标准,质量评估,排除研究和数据分析的描述以及详细结果的方法学细节可在的完整证据报告中公布https://www.uspreventiveservicestaskforce.org/Page/Document/UpdateSummaryFinal/ovarian-cancer-screening1。



数据源和检索

搜索MEDLINE,PubMed出版商提供的记录以及2003年1月至2017年1月期间对照试验的Cochrane合作登记处发表的研究,这些研究是基于以前代表USPSTF进行的搜索(补充中的eMethods)。也从以前的评论,荟萃分析和参考列表中选取了研究。在ClinicalTrials.gov和世界卫生组织国际临床试验注册平台检索了正在进行的试验。自2017年1月以来,正在进行的监测,以确定可能影响审查结论或证据解释的新研究,并使用文章警戒和有针对性的高影响因子期刊搜索。最后一次监测于2017年11月22日进行,确定了另外一份报告,报告了其中一项纳入试验的二次分析。


研究选择

两位评价员独立审查了标题、摘要和全文文本, 以确定研究会议预定的审查包含和排除标准 (eTable 1 补充)。分歧通过讨论得到解决。筛选的随机临床试验相比, 没有筛查或通常的护理比较, 登记无症状, 平均风险妇女45岁以上。试验重点是在高危人群中明确筛查 (例如, BRCA突变携带者, 具有卵巢癌一级亲属的个人), 那些仅针对筛查或癌症检测率的准确性而未报告发病率、死亡率或生命质量的数据未纳入。


数据抽取与质量评估

两位评价员独立评估所有合格研究的方法学质量, 使用 USPSTF 概述的标准 (eTable 2 补充),并且通过讨论解决不一致问题。高质量的随机临床试验有充分的随机程序和分配隐蔽, 盲法的结局评估, 可靠的结果措施, 组之间相似的基线特征和低损耗。良好的质量试验还使用意向-屏幕分析和报告的诊断标准的结果确定。Fairquality 的研究被评估为不符合所有的质量标准, 但没有严重的限制, 可能会使研究结果无效。如果损耗大于40% 或组间差异20% 或有其他研究设计或实施缺陷会严重损害内部有效性, 则试验的质量较差。


数据综合与分析

一位审阅者将数据抽象为标准证据表, 第二位审阅人检查它们是否准确。进行了描述性合成, 并通过筛选策略对结果进行了报道和讨论。由于干预的研究和非均质性较少, 因此没有进行 Meta 分析汇集结果。有些结果是从研究出版物中报告的原始数据中计算出来的, 以遵守工作队的优先事项, 或促进各试验之间的可比性, 因此可能与原始出版物主要成果中强调的调查结果不同。根据2014世界卫生组织和联合会 Gynécologie Obstétrique 核准的定义, 卵巢癌包括卵巢、输卵管和腹膜癌。这一定义确认腹膜癌的临床表现和治疗不容易与晚期卵巢或输卵管癌区分开来;病理差异也具有挑战性。癌症病例的提取或计算时尽可能使用这个定义, 即使它不是主要的试验结果报告。筛查假阳性率的计算结果为未确诊为卵巢癌的妇女的百分比, 这些人经历了阳性筛查, 导致随访测试。假阳性的手术率被计算为没有卵巢癌诊断的妇女的百分比, 即被称为根据阳性筛查和随访测试结果的可疑卵巢癌的手术。由于每个定义都提供了不同的洞察力, 因此, 为所有报告相关数据的研究计算了基于这两个定义的假阳性率。

当在出版物中提出多项统计测试时, 从试验协议中预设的统计分析是优先考虑的, 如完整的意向筛查分析和临床意义上的卵巢癌死亡率结果以上定义。根据已建立的方法, 将每个关键问题的总体证据的强度分级为高、中、低或不足, 并处理与每个结果。有关审阅方法的详细信息, 请参阅完整报告。

————————————

结果

共收录1381篇文章和摘要及74篇文章。全文回顾和批判性评价后,纳入17篇文献中的4篇(N = 293 587)(图2)。三项试验报告了健康结果 (KQ1), 所有4项试验报告了筛查的潜在危害 (KQ2) (表 1)。其中两项试验是在美国进行,两项研究在英国进行。英国试点和英国卵巢癌筛查协作试验 (UKCTOCS) 仅限于45岁以上50岁至74岁之间的绝经后妇女;前列腺、肺、大肠和卵巢 (PLCO) 癌筛查试验包括55岁至74岁的妇女;生活质量、教育程度、筛查试验(QUEST) 包括30岁以上的妇女。从3项高质量的试验和公平质量的QUEST试验 (n = 549) 中获得了有关假阳性率、手术伤害和筛查的心理危害的数据。

最大的 (n = 202 546), 最近的试验是 UKCTOCS, 包括在英国、威尔士和北爱尔兰的13个全国医疗服务中心登记参加者。由同一研究小组为 UKCTOCS 准备的的英国试点试验,招募了参加先前卵巢癌筛查研究的妇女。PLCO 试验 (n = 68 557) 是在美国10个临床筛查中心进行的。


PLCO和UKCTOCS试验报告了卵巢、输卵管和原发性腹膜癌的病例。英国早期试验试验的数据没有报告腹膜癌的病例;因此, 这些结果仅限于卵巢和输卵管的原发性癌症。


筛查获益

关键问题1

使用单一测试或联合方案(例如但不限于癌抗原125[CA-125]和超声)对无症状女性进行卵巢癌筛查是否可减少全因或特定疾病的发病率和死亡率?

三项质量良好的试验(n = 293 038)符合KQ1的纳入标准(表1)。

在UKCTOCS和UK Pilot试验中,研究人群的种族或民族组成超过95%为白色人种,在PLCO试验中,88%的女性是白人和非西班牙裔。在UKCTOCS试验中,明确排除被认为具有“高风险”家族性卵巢癌的女性,但1.6%的女性报告了母亲卵巢癌史和6.4%报告了乳腺癌史。在PLCO试验中,17%的女性报告有乳腺癌或卵巢癌家族史。

所有3项试验均以 CA-125 检测、经阴道超声检查或两者联合 (表 2) 评价卵巢癌的年度筛查。UKCTOCS 试验有干预组和无筛查对照组 (随机 1:1: 2)。妇女最初被随机接受6年的年度筛查, 但对该议定书进行了修改,以扩大筛查。随机分入干预组的妇女每年进行7到11轮筛查,使用CA-125血清检测(分类和随访由卵巢癌风险算法[ROCA]确定)或年度经阴道超声检查,中位数为11.1 年的随访。CA-125 ROCA筛查组在UKCTOCS试验出版物中被描述为多模式筛查,并包括用于所有后续检测的标准方案.ROCA比单一切割点CA-125检测更复杂,因为它包含个体CA-125水平的变化随着时间的推移。

英国试点试验比较了固定切点(30U / mL)的3轮年度CA125筛查试验和8年随访期间的无筛查。PLCO试验筛查干预组中的女性接受了有固定切割点(≥35U / mL)的CA-125测试和超声检查。在研究的前四年中,卵巢的双手触诊也包括在筛查干预中,但因为没有癌症仅在此检查的基础上被确定,因此已经中止。协议修改还将筛选扩展到最多6轮筛选(4个CA-125和经阴道超声,2个单独CA-125),中位随访时间为12.4年。

总的来说,筛查依从性较高,随访可变但均衡,各组之间的影响极小。 在PLCO试验中,0.6%的女性(388例)诊断为卵巢癌,UKCTOCS试验中为0.7%的女性(1323例),英国试验试验中为0.2%的女性(36例)。 在所有试验中,研究组的发病率没有差异。


CA125 筛查

在UKCTOCS试验中,CA-125 ROCA筛查方案干预组和对照组的卵巢癌死亡率相似(包括输卵管和腹膜癌)(干预组为0.32%,对照组为0.35%),生存分析中干预组有 2.9每10万人年的卵巢癌死亡率和对照组3.3人每10 000人年的卵巢癌死亡率。 这种差异无统计学意义(危险比0.89 [95%CI,0.74-1.08])31(表3)。 在英国较小的Pilot试验(n = 21 935)中,干预组有9例卵巢癌(腹膜癌未报告)死亡(0.08%),无筛查对照组有18例(0.16%); 差异无统计学意义(相对危险度,0.50 [95%CI,0.221.11])。从随机分组的日期计算得出干预组和对照组妇女的生存率差异有统计学意义(中位数为72.9个月,对照组为41.8个月; P= 0.01)。这一发现基于少量事件,研究作者指出对照组的生存率“出乎意料地差”,20例中只有2例发生了目标癌症存活。


经阴道超声筛查

在UKCTOCS试验中,经阴道超声筛查并未降低卵巢癌死亡率(干预组为0.32%,对照组为0.35%)(表3)。在生存分析中,干预组的卵巢癌死亡率为3.0 / 10万人年,对照组为3.3/ 10 000人年(危险比为0.91 [95%CI,0.76-1.09])。


CA-125联合经阴道超声筛查

在PLCO试验中,卵巢癌死亡率在干预组为3.1 / 10 000人年,在常规护理对照组中为2.6 / 10 000人年(表3)。 干预组死亡118人(0.34%),对照组死亡100人(0.29%),无显着性差异(比值比1.18 [95%CI,0.82-1.71]),在研究组之间卵巢癌生存率无显着差异。



筛查弊端

关键问题2

筛查卵巢癌有什么危害,包括筛查试验和诊断评估的危害?

KQ1的3项试验纳入了假阳性率和筛查手术危害的证据(表4)。


CA125筛查

在UKCTOCS试验的所有发病轮次(范围从2到11)中,CA-125 ROCA组筛查出的44.2%(20 340/46 067)未经癌症筛查的女性至少有1例假阳性检测结果,这意味着在 至少有1项CA-125年度筛查测量结果产生ROCA升高风险结果,需要进一步的方案定义随访。本方案定义的随访包括6个月内复查CA-125,根据ROCA风险进行临床检查或两者兼有。大约有1%的女性(n = 488)采用CA-125 ROCA策略进行手术,未发现癌症。 3.1%的手术(15/488)发生严重并发症,包括感染,中空内脏损伤,麻醉并发症,心血管和肺部事件。

在3轮英国试点试验中,有4.2%(462/10 942)未筛查CA-125的妇女接受假阳性检测结果,0.2%最终接受了手术。 英国试点试验没有报道手术并发症。CA-125筛查试验导致轻微并发症(如抽血导致晕厥或瘀伤),从UKCTOCS试验中的0.86到PLCO试验中58.3每10 000名妇女不等。

经阴道超声筛查

没有报告在UKCTOCS试验的所有筛查过程中经阴道超声检查后获得假阳性检测结果的女性人数; 然而,最初的一轮筛查中报告了11.9%的假阳性率。在整个试验中,3.2%(1634/50 299)的女性被分配到UKCTOCS阴道超声筛查干预手术并没有发现癌症。 3.5%的手术报告了主要并发症,包括感染,伤口破裂,麻醉并发症或心肌梗塞,深静脉血栓形成或肺栓塞,以及中空内脏损伤。筛查试验导致轻微并发症(如疼痛,不适,感染,青紫),从UKCTOCS试验的1.86名每10 000名妇女到在PLCO试验中3.3名每10 000名妇女。

CA-125联合经阴道超声筛查

在PLCO试验中进行的所有筛查(范围从1到6)中,9.6%(3285/34 041)没有发现癌症的女性接受CA-125或经阴道超声检查至少1次阳性筛查结果。 在他们的常规护理设置中进行额外的随访后,3.2%(1080/34 041)的女性在没有癌症的情况下接受了诊断性手术。 这些手术中有15.1%发生了严重并发症,包括感染,直接手术损伤,心血管或肺部事件以及其他未明示的不良事件。

心理学结果

在UKCTOCS试验中进行了一项关于卵巢癌筛查相关心理疾病发病率的研究,该研究使用每个试验组(n = 1339)的基线妇女随机抽样调查以及筛查组中所有女性的调查 (补充中的eTable3)。在随机样本中,对照组和干预组之间在焦虑或心理疾病发病风险方面没有统计学显着差异。在对具有回想筛查事件的妇女的分析中, 在重新筛查焦虑(P <.01)和高级筛查中回忆的女性中心理疾病发病风险增加之间存在统计学显着性差异(12项一般健康问卷评分为4分,调整优势比为1.28 [ 95%可信区间为1.18-1.39]),QUEST小样本试验(n = 549)同样发现在经历任何异常测试结果的妇女中患癌症的程度更高。

————————————

讨论

表5报告了本研究的证据摘要。自上次对USPSTF这一主题的回顾以来,迄今为止最大的一项试验UKCTOCS试验发表了卵巢癌死亡率结果。来自美国和英国的2项大型临床试验证实无症状的平均风险女性并不表明筛查可降低卵巢癌死亡率。较小的英国试点试验旨在评估筛查的可行性和表现,并没有考虑死亡率差异。UKCTOCS试验评估了一项专有的筛查和随访干预措施,导致与PLCO试验相比,未接受手术并发生并发症的妇女人数减少。尽管如此,在这两项试验中,手术和并发症都是在筛查人群没有死亡率益处的情况下发生的。

根据临床相关国际标准定义的卵巢癌死亡率完整意向性治疗分析的试验结果适用于实施筛查计划及其累积效应。这两项大型试验还提供了额外的分析以探索影响并产生假设。其他已发表的UKCTOCS数据分析显示,当腹膜癌病例被排除时,CA-125 ROCA筛查的死亡率有所获益,并且使用了一项统计学检验,该项统计检验对于晚期的试验分配的权重更大。在UKCTOCS试验中,CA-125 ROCA组腹膜癌的比例高于无筛查组(5%比2%)。排除死亡率高的病例可能会增加CA-125 ROCA和对照组之间的差异。排除腹膜癌并依靠协议规定的统计检验,卵巢癌死亡率没有统计学差异。对UKCTOCS的另一项有计划的分析旨在选择某些卵巢癌病例根据存储的CA-125测试结果进行数据估算和统计建模。结果表明,该分析可能是假设的产生,但比试验的完整意向治疗分析更易产生偏倚。

PLCO试验数据的其他分析包括最近发表的分析,将PLCO试验的试验后6年死亡率数据相加(平均值,2。3年),并没有发现长期筛查益处的证据。

所有被诊断患有卵巢癌的女性中,高死亡率和低5年生存率可能归因于在早期检测到疾病的持续挑战。在PLCO中,干预组与常规护理组局部分期发现的病例比例差异无统计学意义(分别为15%和10%; P = 0.08)。将局部和区域癌症病例与晚期癌症比较时,分期和组别比较也没有统计学差异。在UKCTOCS试验中,与对照组(23%)相比,CA-125 ROCA筛查(36%)和阴道超声筛查(31%)可发现更大比例的局部分期(I期)病例(P <0.005)。将局部和区域性癌症(I期和II期)与更晚期癌症(III期和IV期)比较时,各组和分期的总体差异也具有统计学显着性。尽管没有总体死亡率益处与这些观察到的分期转变相关,但这些比较是相关的,因为I期和高分期卵巢癌之间的治疗策略存在临床差异(即需要辅助放疗); UKCTOCS试验的治疗结果尚未公布。

癌症类型也很重要, 因为它定义了2大类上皮性卵巢癌, 具有共同的临床和组织学特征, 代表了明显的上皮性卵巢癌变模型。I 型肿瘤包括低级别、一般为惰性的肿瘤, 通常与许多基因 (如KRAS、 BRAF、 ERBB2) 中的体细胞突变有关, 并从卵巢中植入的良性卵巢外病变中发展而来。II型肿瘤更可能来自输卵管或卵巢表面上皮。这些癌症通常是高级别的,并且在遗传上不稳定,包括TP53和BRCA突变的高发生率。UKCTOCS试验报告了由研究组诊断的癌症类型,在对照条件中鉴定为II型的病例的百分比较高,并且在筛选组中观察到更多的交界性和非上皮类型。来自PLCO试验的数据分析发现,II型肿瘤不太可能从筛查中被诊断出并且多在晚期被诊断。作者认为,过度诊断更多惰性的癌症类型,部分原因可能是由于试验中卵巢癌筛查缺乏死亡率益处。近期改善卵巢癌分子,病理和临床特征差异的工作突出表明,越来越多的理解认为,由于微转移,生存差异更可能归因于癌症类型,而不是诊断时的分期,最常见的II型癌症无论何种阶段都特别致命。即使是一些II型高级别上皮癌的I期癌症也可能具有微观转移,因为癌细胞可能存在于腹水中(阶段Ic)。

尽管在最近的UKCTOCS试验中发现死亡率没有显着差异,但与先前的试验相比,在减少未接受诊断手术的癌症的女性人数方面取得了进展。UKCTOCS试验采用了一种更加细致和系统化的方法来进行CA-125测试和分类,使用一种包含CA-125级别轨迹的算法来分配3级风险,并采用协议驱动的监督和分类测试进行随访。因此,与PLCO试验筛查相比,CA-125 ROCA组的手术率低于经阴道超声组(1%vs 3%)。

另外,UKCTOCS试验的手术并发症发生率低于PLCO试验。 在PLCO试验中,有15%的非癌症妇女接受手术治疗,而UKCTOCS试验中仅有3%以上出现并发症。 研究设置的差异可以部分解释这一点,因为PLCO试验中的诊断测试是通过转诊给妇女的常规护理来进行的,而不一定是专门的三级护理机构。 相比之下,在英国,参与诊断测试的所有女性都在国家卫生服务三级医疗外科中心看到。然而,无论并发症发生率如何,在两项试验中未发生疾病时手术率及单侧卵巢或双侧卵巢切除率均高。

来自最近一篇系统评价的证据报道了良性子宫切除术时与双侧输卵管 - 卵巢切除术相关的健康影响。 在没有医学指征的情况下,切除卵巢可能会影响心血管健康,全因死亡率,心理健康和性功能。对于假阳性筛查试验行手术,除了可能伴随的手术并发症,可能伴随着妇女卵巢,输卵管或两者的切除,无法排除无病卵巢切除的危害。同时,有证据表明采用卵巢切除术,输卵管切除术或输卵管结扎术可以降低卵巢癌的风险。 需要进一步的研究来评估在筛查试验和其他医疗程序的情况下对卵巢和输卵管切除妇女未来健康的净影响。

没有正在进行的使用新的筛选工具进行卵巢癌筛查的随机试验。 尽管开发中的某些工具可能对未来有意义(如microRNA),但目前还没有新的筛选工具(即生物标记,仪器)展现的测试性能水平超出了在试验中评估的筛查工具所观察到的水平。使用UKCTOCS试验的数据,正在努力通过添加更多的蛋白质标记物和CA-125一起来改进ROCA算法。 鉴于缺乏对卵巢癌有效的单一标记或筛查设备,研究可能越来越多地致力于鉴定用于预测模型的新标志物和标志物组合。




————————————

局限性

该评价与所考虑的证据类型有关。 观察性证据不包括在内,因为有充足的动力试验可以评估相对于筛选组筛查的死亡率降低。这些试验比较总结了筛查,检测并被USPSTF认为是筛查建议的最高证据水平。鉴于卵巢癌发病率低,需要进行非常大的试验以确定筛查方案的益处是否超过危害,这对于卵巢癌包括手术和卵巢切除。

与研究设计和结果报告相关的严格纳入和排除标准排除了2项大型研究的证据:静冈队列研究卵巢癌筛查(SCSOCS)试验和肯塔基大学卵巢癌筛查试验。这些研究的纳入不会改变审查结论。

随机试验证据在普通护理的普遍性和适用性方面可能存在限制。 UKCTOCS试验中几乎所有的试验参与者都是白人女性,只有12%的参加PLCO试验的女性被确定为少数民族或种族。 PLCO试验可能比UKCTOCS试验更适用于美国环境,因为在PLCO试验中鉴于医疗保健系统的差异以及转诊到常规治疗护理。例如,UKCTOCS试验中手术的低外科手术并发症发生率可能是由于三级护理中心接受护理。也有可能通过试验提供的筛查试验可能比常规护理中的筛查更准确,或者在没有试验方案的情况下手术检查可能更常见。此外,鉴于卵巢癌筛查不具有死亡率益处,假阳性手术的定义可能会低估手术危害。在筛查的基础上进行手术,即使诊断为癌症,也不会导致卵巢癌死亡率显着降低。


————————————

结论

在平均风险的无症状妇女中进行的随机试验中,筛查妇女和没有筛查或常规护理的妇女的卵巢癌死亡率没有差异。筛查危害包括手术(主要手术并发症)发现没有癌症。需进一步研究,以确定有效的方法,以减少卵巢癌的发病率和死亡率。