新型抗肿瘤药物的批准上市或新的治疗方案在临床上广泛应用之前,必须经过设计合理的临床试验检验其是否能够带来临床获益,包括期的延长和/或生活质量的提高。目前总时间被广泛接受作为评价治疗效应的金标准。然而,总时间常常受到后续治疗等混杂因素的影响,因此无进展和客观缓解率等替代终点在某些特定的条件下作为临床试验的主要研究终点。本文针对总时间的替代终点研究开展综述。其中无进展作为替代终点研究最为常见,但仅在某些特定的肿瘤和治疗模式下显示出可靠的替代价值,例如多个研究结果均支持无进展在转移性结直肠癌一线化疗的临床研究中可替代总。因此,总的替代终点研究仍存在争议,而随着现代肿瘤临床试验中交叉现象越来越常见,以及靶向治疗和免疫治疗等新型治疗模式和机制的出现,总的替代终点研究将会面临更多的挑战。 恶性肿瘤治疗的关键在于尽可能地使患者临床获益,主要表现为延长时间或改善生活质量,而最理想的状态是二者兼得,因此肿瘤临床试验的终点应该是能使患者获得时间和/或生活质量的改善。一种新型抗肿瘤药物的批准上市或新的治疗方案在临床上的广泛应用之前必须经过设计合理、统计缜密、执行规范的临床试验检验,要求其能达到以上终点。相对于生活质量的改善,目前总时间(Overall Survival,OS)已被更广泛地接受作为考量新型药物或治疗方案能否达到临床获益的金标准,其一般定义为从随机化开始至患者因任何原因死亡之间的时间。作为金标准,OS具有客观、精确、易检测、方便解读等优点。然而,临床试验选择OS作为主要研究终点往往需要大样本量和长期随访,因而会增加临床试验的成本,并可能延迟真正有效的治疗在临床上的应用。此外,OS容易受到后续治疗的影响,因此可能在一定程度上了初始治疗的真正效应。由于以上因素的存在,近年来涌现了大量OS替代终点(surrogate endpoint)的相关研究。何谓替代终点?美国国立卫生院(National Institute of Health)将其定义为一种生物标志物用于替代临床终点。美国食品药品管理局(U.S. Food and Drug Administration,FDA)认为替代终点需要能可靠地预测临床获益,或与临床获益明显相关。数据显示,2010~2012年获FDA批准的新药中,45%的研究结果是基于替代终点。在肿瘤临床试验中,目前OS的替代终点主要是基于肿瘤评价的终点,研究较多的包括: 1) 无进展时间(progression-free survival,PFS),定义为从随机化开始至患者肿瘤进展或因任何原因死亡之间的时间; 2) 无病时间(disease-free survival,DFS)或无事件时间(event-free survival,EFS),定义为从随机化开始至患者肿瘤复发或因任何原因死亡之间 的时间,DFS或EFS主要应用于患者接受根治性治疗之后的辅助治疗临床试验; 3) 肿瘤进展时间(time to progression,TTP),定义为从随机化开始至患者肿瘤进展的时间,TTP并不包含任何原因导致的患者死亡; 4) 客观反应率(objective respond rate,ORR),定义为肿瘤缩小达到一定量并且维持一定时间的患者比例,包括完全缓解和部分缓解的病例。 与OS相比,替代终点的优势在于不受后续治疗的影响,研究终点往往更容易达到,仅需要较小的样本量及较短的随访时间。替代终点在代替OS成为主要研究终点之前,必须经过III期临床试验的验证,其中治疗效应对替代终点的影响需要可靠地预测治疗效应对真实终点,即OS的影响。目前检验替代终点的统计学方法主要有以下两种。Prentice教授第一个正式提出相应的统计学方法来检验临床试验的替代终点,他认为替代终点须达到的标准是,如果不同治疗组之间在替代终点上无关联的零假设成立,那么其应当在真实研究终点上也相应成立。因此替代终点就必须同时满足两个条件: 然而替代终点要同时符合以上两个条件十分困难,因而Prentice教授的方法过于保守。随后,Buyse教授等提出了另外一种相对更为实际的替代终点的统计学验证方法,他们认为替代终点须从个体水平(individual level)和临床试验水平(trial level)在III期临床试验中获得验证。其中个体水平是指替代终点必须在至少一项临床试验的每例患者个体资料(individual patient data,IPD)中显示与真实终点具有明确的关联,一般采用单个临床试验的数据或者基于IPD的多个临床试验的荟萃分析。临床试验水平是指以上关联须在多个临床试验数据中获得验证,一般采用多个临床试验的荟萃分析。以PFS为例,如需验证PFS能否替代OS,应同时满足两个条件: 第一,PFS和OS的相关系数(ρ)接近1(反映PFS和OS在个体水平具有强关联性),ρ的计算常采用简单的Spears相关方法; 第二,治疗效应对PFS的影响和OS的影响之间的ρ接近1(反映治疗分别对PFS的影响和 OS 的影响之间在临床试验水平具有强关联性),决定系数(R2)的计算常采用线性回归模型,治疗的影响通常采用风险比(Hazard ratio,HR)。 目前,Buyse教授等提出的方法已经获得广泛的认可和应用。近年来,替代终点在恶性肿瘤研究中备受关注,本文将针对不同的替代终点阐述其相应研究及进展。 大量研究发现PFS在转移性结直肠癌中可作为OS的可靠替代终点。Tang等纳入39项转移性结直肠癌一线化疗随机对照临床试验进行荟萃分析,发现PFS与OS呈强相关性(ρ=0.79,95%CI:0.65~0.87),通过对治疗组与对照组之间PFS和 OS的差值进行回归分析后得出结论,若患者疾病进展风险下降10%,将带来5.4%左右的获益。随着抗EGFR(cetuximab & panitumumab)及抗VEGF(bevacizumab)等单克隆抗体靶向治疗在结直肠癌中的广泛应用,PFS在靶向治疗时代能否替代OS仍然值得进一步探讨。Giessen等荟萃分析了2000~2012年间50项转移结直肠癌一线治疗随机对照临床试验,其中19项临床试验包含靶向治疗,研究发现PFS与OS仍然存在一定的相关性(ρ=0.52,治疗效应对两者影响(LogORs)的决定系数R2=0.47)。由于研究纳入的靶向治疗样本量较小,且靶向治疗与传统化疗的作用机制不同,因此PFS替代OS在接受靶向治疗的转移性结直肠癌中的应用价值仍需要大样本量临床研究数据验证。 PFS作为OS的替代终点研究在不同病理类型的肺癌中结果并不一致。Blumenthal等通过对 2003年以来提交至FDA的14项随机对照临床试验,共12567例转移性非小细胞肺癌(non-small cell lung cancer,NSCLC)患者进行荟萃分析,从个体水平和临床试验水平分析PFS和OS之间的关联,研究表明在临床试验水平并未发现PFS与OS存在相关性(R2=0.08,95%CI:0~0.31)。作者认为对照组患者进展后部分交叉到治疗组,且一线治疗后患者期仍较长,从而导致了以上阴性结果。而Foster等纳入9项广泛期小细胞肺癌(small cell lung cancer,SCLC)的临床试验,共收集870例IPD,个体水平分析发现6个月PFS能显著预测患者OS(一致性指数=0.66,P0.01),临床试验水平发现PFS是OS的良好替代终点,其中OS的变异79%来源于PFS(R2=0.79)。由于研究纳入的样本量较少,其研究结果还需要大样本的III期临床试验验证。笔者认为PFS在NSCLC及SCLC中替代终点的价值存在差异的原因在于,SCLC生物学行为恶性更程度更高,因此,出现疾病进展后,患者会在更短的时间内死亡。在靶向治疗时代,OS的替代终点研究将面临更多挑战,其中包括肺癌的异质性、耐药以及临床试验中更为普遍的交叉现象。乳腺癌中OS的替代终点的研究结果并不理想。Burzykowski等收集了11项对比含蒽环类与含紫杉醇类化疗方案治疗转移性乳腺癌的临床试验,通过对3953例患者的IPD分析显示,研究终点PFS与OS呈中等相关性(ρ=0.688),而 PFS的风险比与OS的风险比并无明显的相关性(ρ=0.48,95%CI:-0.34~1.30)。考虑到乳腺癌本身异质性明显,Michiels等仅仅分析了PFS在HER-2 阳性的转移性乳腺癌中作为替代终点的价值。研究发现,无论在个体水平(ρ=0.67,95%CI:0.66~0.67)还是临床试验水平(R2=0.51,95%CI:0.22~0.81),PFS均仅与OS存在中等相关性。 因此,目前的研究结果并未在乳腺癌中发现可靠的OS替代终点,尽管FDA已经采用PFS的结果批准新药上市,但是PFS在乳腺癌中作为替代终点仍存在较大争议,笔者认为,在有令人信服的发表之前,OS仍然应作为乳腺癌研究终点的金标准。 Mauguen等发现,在基于可手术治疗的局部晚期NSCLC临床试验IPD的荟萃分析中,无论是在辅助化疗抑或放化疗的临床试验中,DFS均在个体水平和临床试验水平显示出与OS明显相关。其中,以放化疗临床试验为例,DFS在个体水平与OS的相关系数ρ=0.77~0.85,临床试验水平决定系数R2=0.89~0.97。2009年,Michiels等通过基于局部晚期头颈癌IPD的荟萃分析发现,EFS无论在个体水平(ρ=0.82~0.90)还是在临床试验水平(R2=0.98)均与OS具有强关联性,因此认为在局部晚期头颈癌放化疗综合治疗的临床试验中,EFS可作为OS的可靠替代终点。 在胃癌的辅助治疗临床试验中,Oba等纳入14项胃癌术后是否接受辅助化疗的随机对照临床试验,发现DFS无论在个体水平(ρ=0.974,95%CI:0.971~0.976)还是临床试验水平(R2=0.964,95%CI:0.926~1.000)均与OS呈强相关性。此外,他们发现未来如果开展类似的临床试验,若DFS风险比小于0.92,则有95%的可能性检测到OS的显著差异。因此,作者认为DFS在胃癌术后辅助化疗的临床试验中可作为OS的可靠替代终点。然而,近期发表的一项基于接受新辅助化疗的胃癌和食管癌临床试验荟萃分析中,共纳入22项随机对照临床试验,发现新辅助化疗对DFS的影响与OS并不相关(R2=0.27),因此不推荐DFS作为胃癌和食管癌新辅助化疗临床试验的替代终点。 而在乳腺癌的相关研究中,Ng等在乳腺癌辅助化疗及内分泌治疗的临床试验荟萃分析中发现,可通过2年DFS来预测患者5年OS的变异的比例不到50%,因此DFS并不能作为乳腺癌辅助治疗临床试验的可靠替代终点。Cortazar等发现在乳腺癌的新辅助化疗临床试验中获得病理完全缓解的患者EFS和OS都获得明显改善,然而进一步从临床试验水平分析,病理完全缓解率的提高并未能显示出与患者OS呈现明显相关性(R2=0.24,95%CI:0.00~0.70)。 Lee等对晚期肝细胞癌接受靶向治疗的9项随机对照临床试验进行荟萃分析,发现TTP与OS的风险比之间存在一定的相关性(ρ=0.73,95%CI:0.12~0.94,P=0.024;R2=0.57,95%CI:0.02~0.77,P=0.018),而TTP的风险比至少需要低于0.63才能预测OS的显著获益。Lencioni等利用一项brivanib治疗晚期肝细胞癌的随机对照临床试验数据,探索ORR作为OS替代终点的可行性。研究中ORR的评价首次采用mRECIST标准,结果显示ORR与OS呈现明显相关性(R=-0.92,95% C I:-1~-0.73,P0.001),此外ORR能更早地显示出治疗效应,因此作者认为ORR(mRECIST)可作为晚期肝细胞癌OS的候选替代终点。然而在肺癌、软组织肉瘤、乳腺癌等研究中,ORR与TTP并未显示出良好的替代终点价值。Johnson等荟萃分析纳入191项转移性NSCLC临床试验(包含化疗与靶向治疗),线性回归分析结果显示ORR和TTP均与OS呈现明显相关,但相关性较低(ORR与OS的决定系数R2=0.16,P0.01;PFS与OS的决定系数R2=0.19,P0.01);此外还发现在样本量为500例的临床试验中,如果TTP改善2.5个月,将带来约1.9个月的OS获益。近期发表的一项研究结果显示,在转移性软组织肉瘤中,ORR与OS呈现一定的相关性(R2=0.51),然而随着时间的推进,越来越少的研究采用ORR作为主要研究终点[28]。Tang 等在转移性结直肠癌中并未发现TTP和ORR与OS具有明显的相关性。而在转移性乳腺癌中,Burzykowski等发现,TTP(ρ=0.49,95%CI:-0.32~1.30)的风险比与OS的风险比并无明显的相关性。 OS是临床试验检验新药或治疗方案能否带来临床获益的金标准。但达到OS的获益常常需要大样本量和长期随访,因此加大了临床试验的经济和时间成本,更重要的是患者在肿瘤进展后接受有效的后续治疗可能在一定程度上了治疗的真正作用。在此背景之下,替代终点研究应运而生。一个可靠的替代终点必须经过严格的统计学方法和大样本的数据来验证;此外,目前所发表的针对某一类肿瘤甚至某个分型以及特定治疗模式的研究结果并不适合外推于其它肿瘤、分型及治疗模式。 基于肿瘤评价的终点在OS的替代终点研究中最为广泛,其中又以PFS研究最多见。PFS的观察事件包括肿瘤进展和死亡,与OS具有一定程度的重叠,在替代终点研究中具有相对优势。目前,在转移性结直肠癌一线化疗的临床试验中,PFS的替代终点价值最为明确,研究结果较为一致,而在其它肿瘤如转移性乳腺癌的多项研究中并未显示出同样的价值。这种差异的存在可能归结于以下几个原因。 首先,PFS相对于OS的缺点在于比较主观,观察频率和检测手段等常常对PFS具有重大影响。例如,一项临床试验要求患者治疗结束后每6个月随访一次,则患者发生进展最早的时间为6个月,若有患者在治疗后3个月即发生疾病进展,则其真正的进展时间将不会被临床试验所记录。因此,如果临床试验采用不同的随访计划,其治疗效应对PFS和OS的影响可能明显不同。 其次,患者疾病进展后接受不同的后续治疗也是导致研究结果产生差异的重要原因。如果患者接受有效的治疗,以及基于伦理学考虑,因某种新药能获得明显的临床获益而允许对照组患者发生疾病进展后交叉到治疗组,可能明显延长患者期,势必对PFS与OS的相关性造成影响。研究显示,即使是最佳支持治疗也可能延长NSCLC患者的期。而患者进展后接受有效的后续治疗,其期仍足够长的话,非肿瘤相关死亡等混杂因素也会在一定程度上影响研究结果。因此,PFS的获益可能并不能转换为OS的获益。 肿瘤生物学行为及对治疗的反应可能是造成替代终点研究结果差异的重要原因。例如,不同于转移性结直肠癌,前列腺癌和乳腺癌患者即使发生疾病进展,仍有可能获得较长的时间,因而弱化了PFS和OS的关联。另外,许多细胞毒性药物具有促进肿瘤细胞突变和克隆进化的作用,因此从理论上来说,延长时间更有可能导致肿瘤进化,这种现象的发生可能会抵消PFS延长所带来的最初获益。再者,随着肿瘤发生、发展机制研究的不断进展,越来越多的新型靶向药物和免疫治疗药物应用于临床。然而新药的出现带来了新的问题,例如免疫治疗药物可能存在假性进展现象,给替代终点研究带来新的挑战。理论上,若能找到靶向治疗和免疫治疗作用最显著的群体,替代终点研究的价值将获得最显著的体现,但目前临床上大部分靶向治疗和免疫治疗并未找到可靠的预测靶点,制约了替代终点的研究进展。 综上所述,尽管目前FDA已经根据替代终点的获益批准了相当一部分新药的上市,但是在现阶段,尤其是靶向治疗和免疫治疗时代,替代终点将面临更多挑战,其价值仍存在争议,需要进一步的研究。 推荐:
|