四个案例了解FDA审评焦点 | FDA华人系列之陈刚

“科学一直进步,指南就要一直更新,但我认为监管对设计前瞻、严谨,结果可靠、稳健这两方面的要求不会改变。”陈刚博士说。

1996~2003年在FDA肿瘤药物审评中心工作的陈刚,曾任FDA肿瘤药物审评中心生物统计审评部门负责人。彼时新药研发在靶向治疗、精准治疗等方向取得关键突破,新药研发与监管理念迎来时代变革。FDA充分发挥科学监管与创新精神,当时对外发布了许多具有重要历史意义且影响深远的政策,包括附条件批准(accelerate approval)、临床试验统计指导原则,适应性设计、非劣效性设计、富集研究设计指南等。

离开FDA之后,陈刚进入强生等公司担任生物统计管理层角色。他对科学进步与监管创新关系的理解,随着其在学术界、药政监管部门和工业界积累多年的经历和总结而逐渐加深。如今,新药研发又迈入新飞跃时期,CGT产品大量涌现,AI技术深度参与新药研发。监管部门为应对新形势,亦不断调整法规。陈刚的经验,或能帮助行业思考FDA如何应对创新的“变”与“不变”。

四个案例了解FDA审评焦点 | FDA华人系列之陈刚

陈刚

诺思格医药首席科学官、高级副总裁

8字理念

研发客:FDA新药审评的关注重点,如果您用一句话概括是什么?

陈刚:前瞻、严谨、可靠、稳健。

对于一个注册临床试验,设计的前瞻、严谨,结果的可靠、稳健,是FDA在新药审评过程中最主要的考虑。设计的前瞻性是保证临床试验一类错误控制最关键的部分,FDA创新性设计指南都着重强调这一点。严谨性在这里是从两个方面考虑,第一方面是设计的方法符合科学要求,第二方面是设计流程符合标准。一个前瞻、严谨的设计不仅仅会影响试验的结果,同时也影响试验的质量。对于一个阳性试验结果,FDA重点会评估结果是否充分可靠,结果的可靠及稳健性是从临床意义及统计学意义两个角度去解读。

研发客:为什么FDA在新药审评中特别关注这8个字?

陈刚:这8个字直接关系到临床试验疗效结果证据的质和量。

作为监管部门,首要任务是保证新药安全有效,所以在安全性可以接受的前提下新药有效性证据是否充分是FDA特别关注的方面。FDA在2019 发布“ Demonstrating Substantial Evidence of Effectiveness for Human Drug and Biological Products”, 这个指南的指导思想就是从注册临床试验的“质”及“量”的角度来评估疗效证据是否充分。“质”这里强调的是试验设计前瞻、严谨及合理性。“量”这里强调的是结果可靠不应该是偶尔发现并且结果稳定,不确定性很小。

研发客:在您审评过的案例中,如何体现FDA将这一理念贯穿其中?

陈刚:这里我可以举一个上世纪90 年代末NDA申请失败的案例。这个例子发生在1998年,它是一个前列腺癌治疗药物。根据肿瘤药临床研究的惯例,该产品在取得1项3期临床研究结果后,向FDA递交产品上市申请。

虽然这项研究疗效终点最终结果从统计角度看符合p<0.05,但因为临床主要疗效终点不是OS,并且p值恰好在0.05附近以及产品的治疗机制不够清晰,FDA审评对此试验疗效结果是否足以支持产品上市申请提出质疑。FDA统计审评小组利用不同统计方法,模拟不同情况下的研究结果显示结果可能发生的一类错误概率可能超出5%。

当时我作为FDA的统计审评在肿瘤药物咨询委员会(ODAC)会议上代表FDA审评团队给了20分钟的发言,从不同的角度阐明结果的不稳健性,最终经过ODAC充分的讨论,一致认为试验结果不够可靠稳健,没有通过该产品上市要求。

这个案例说明,即使试验结果表面上看已经达到统计显著性,监管部门还会认真考量证据的可靠性和稳健性。根据FDA疗效充分性指南,如果仅仅依据一个临床试验结果申请新药上市,监管会要求疗效结果满足一定的条件,比如单个研究有效性结果具有很强的临床意义及统计显著性例如p<0.001,或者是药物的作用机理非常清晰及同靶点药物已有大量研究证据支持该产品的有效性。上述案例产品因为不满足以上证据充分性要求,因此FDA拒绝了上市申请。我在FDA审评中遇到其他类似情况的产品,通常也会被FDA拒绝。

避免发生第三类错误

研发客:监管对临床试验设计每年都有相关指南对外发布,您提到这些指南的核心思想不变,那变化主要在哪些方面?

陈刚:在考虑一般临床试验设计及执行过程中可能出现的问题的同时,监管指南强调设计的“精准”即避免在新药研发中发生第三类错误。

对于一个 first in class新药,第三类错误是指此产品可能有效但用错了人群或适应症。精准医学、转化医学的发展,让新药研发首先要关注第三类错误的控制:很多药物可能只对某个适应症或一部分病人而非全部病人有效,但我们误以为其对全部病人都有效或都无效,要想避免这类情况,就要研究设计中使用精准思路,如富集设计思路。

例如,肺癌EGFR靶向药吉非替尼,该产品在2000年初 FDA新药审评阶段也被认为有效性证据不充分,最终进入ODAC会议讨论,给予附条件批准。从当下的角度看,这个产品的机理和有效性都已被充分证明在EGFR阳性的病人群中有效,而不是对全人群都有效。

随着新药研发和科学进步,监管指南也会与时俱进。FDA在90年代末及2000年初发布富集设计、适应性设计等多个配套指南,其目的是提高新药研发的“精准”及效率。

研发客:根据新修订的有效性相关指南,是否认为FDA有更大可能性接受研究结果仅在部分人群有效的产品?

陈刚:这要重新回到之前提到的临床研究设计的前瞻、严谨性问题上。

我在FDA的时候遇到过一个令人遗憾的肿瘤药研发案例。临床数据显示该治疗在全人群中未显示阳性结果,但似乎从肝转移病人中看到了不错的治疗获益,但此临床研究设计没有前瞻地定义此亚组人群,导致临床试验结果没法解释,产品最终没有获得上市批准。我想,如果采用富集设计,这个产品或许也能上市成功,可惜当时还没有富集研究的概念,试验设计也因此没有前瞻性定义此亚组人群。

一个新药是对全人群有效还是仅仅适合一个富集人群需要有“精准”的科学依据,要有充分理由证明为何产品可能对某一特定人群更加有效,并且有一个前瞻、严谨的科学设计并且和监管有充分的沟通。这样的试验设计导致的阳性结果才可能被监管接受。而不是在试验中随机选择几个亚组人群,等着“撞大运”。

研发客:在采用新研究设计的临床研究中,有没有让您觉得比较成功的案例,可以与读者分享?

陈刚:令我印象深刻的案例是淫羊藿素的临床研究设计及上市申请。淫羊藿素治疗肝癌的一项3期研究。刚开始研究是针对全人群设计的,主要疗效临床终点是OS。但试验进行一段时间后,我们依据盲态数据推测,当时的统计假设很可能是不对的,这个产品可能在肝癌全人群中难以展现预期治疗效果。此时我们并未揭盲进行中期分析,而是就试验方案设计的修改与监管部门进行了充分的沟通,最终决定试验在考虑全人群的同时增加以特定生物标记物富集的病人。最终临床试验疗效结果显示,这项研究虽然全人群没有生存获益,但富集人群获得了OS阳性结果,淫羊藿素组和对照组相比能显著降低死亡风险,因此产品对此富集人群获得附条件上市批准。

这项研究我们通过及时调整方案避免了3类错误发生,同时临床试验从设计到结果也没有破坏8个字的原则。研究在尚未揭盲时和监管充分沟通就进行方案调整,符合设计前瞻,严谨性要求,申办方也承诺在产品上市后继续开展一项验证性3期临床研究。

监管与科学、产业携手向前

陈刚提到,富集设计、适应性设计、队列拓展研究,篮式和伞式设计等创新指南陆续出台,FDA目的都是希望紧跟制药技术和科学发展,提高新药研发成功概率,并控制临床试验风险。在新药研发飞速发展时期,FDA勇于监管创新敢于承担风险,业界与监管形成良性互动,科学进步推动监管与时俱进,监管创新又进一步推动新药研发快速发展。

研发客:您认为目前哪些技术发展还会对药品监管产生重要影响?

陈刚:我认为宏观层面和微观层面的技术进步都会对新药研发产生影响,目前人工智能大数据发展大力向前推进,新药研发涌现出ADC、CGT等大量新类型药品,它们都可能促使监管进一步创新。就临床设计方法而言,今后会出现哪些新设计方法、思路,哪些方法能帮助大数据挖掘获得可靠稳健结果,人工智能将如何参与临床研究和数据统计,这些都还有待探索。

如果重新回到90年代末,当时我们也不能预测业界会有哪些新研究设计出现,监管又会据此发布哪些新指南。但可以确定监管在与产业互动过程中,一定会持续跟进。科学一直进步,指南就要一直更新,但我认为监管对设计前瞻、严谨,结果可靠、稳健这两方面的要求不会改变

本文出处:https://jk.yebaike.cn/view/73030.html

关注微信