開篇宣告:1:以下內容轉自以下內容轉自微信公眾號臨研解析《FDA會批依沃西單抗(AK112)否?- HARMONi研究臨床資料深度解析》,如有侵權,可聯絡刪除
2. 以下觀點,僅代表作者個人觀點,請帶著質疑的態度去閱讀。如有問題,歡迎評論區留言或直接聯絡作者
一、寫在前面的話
今年我多次收到邀請,希望解讀2025年世界肺癌大會(WCLC)上公佈的依沃西單抗(AK112)HARMONi研究最新資料——特別是更新後的北美和歐洲人群長期隨訪結果。近期,我也注意到來自臨床科研人員、醫生、投資人及媒體人士的多角度評論,其中不少觀點不夠嚴謹,甚至存在明顯偏誤。為此,我決定從統計學視角出發,對該研究進行一次全面而深入的剖析,以澄清誤解、迴應關切。大家最關心的問題主要集中在以下三點:
Summit公司在2025年WCLC上公佈的HARMONi最新結果中,總生存期(OS)是否具備統計學意義?
FDA於今年8月19日釋出的《Approaches to Assessment of Overall Survival in Oncology Clinical Trials Guidance for Industry》指南,是否會影響AK112的審評與獲批?
基於HARMONi研究目前公佈的OS更新資料,AK112還有被FDA批准地可能麼?
二、正文
要回答上述問題,我們首先需要深入解讀2025年WCLC大會上釋出的HARMONi研究資料。
—— 2.1 HARMONi研究的設計 ——
HARMONi研究的設計如圖1所示。該研究共納入438例既往接受過三代TKI治療的患者,按1:1隨機分配至試驗組(AK112 + 化療)與對照組(安慰劑 + 化療),採用PFS與OS雙主要終點。研究計劃在積累約231例PFS事件時進行PFS主要分析,同時開展OS期中分析;待OS事件數累積至約261例時,再進行OS最終分析。
乍看之下,HARMONi的研究設計似乎並無特別。但進一步分析可以發現,其策略實際上相當複雜且罕見。例如,圖1顯示首例患者於2022年1月入組,亞洲末例患者入組時間為2022年11月,前後僅10個月;而西方人群(北美與歐洲)的首例入組時間為2023年5月(圖2),末例入組為2024年10月,較亞洲人群整整晚了兩年。此外,圖1左下角的註釋說明,基於亞洲人群的HARMONi-A研究主要終點為PFS,且AK112已憑藉PFS陽性結果在中國獲批上市。由此可見,HARMONi實際上是在HARMONi-A(注:該研究人群與HARMONi並不完全一致,但約87%符合HARMONi入排標準)完成入組後,策略性地將一個區域型研究擴充套件為全球多中心試驗。這一轉變源於2022年12月Summit Therapeutics與康方生物達成的一項總額高達50億美元的授權協議,使Summit獲得了AK112在北美、歐洲等地區的開發與商業化權益。該交易於2023年初完成,從而推動了上述研發策略的調整。
這一策略調整看似巧妙:不僅節約了樣本量,更可望加速該產品在歐美地區的上市程序。然而,在巧妙的表象之下,卻為後續的統計分析埋下了重大隱患。
圖1. 研究設計
—— 2.2 分析時間截點 ——
除了研究設計,本研究的統計分析時間節點(圖2,該資訊未在2025 WCLC中公佈)同樣關鍵,對理解OS結果至關重要。圖2顯示,PFS主要分析於2024年7月進行,而該時點也同步開展了OS期中分析(如前述研究設計中提及)。隨後,在2025年4月進行了OS最終分析與PFS總體分析;2025年9月則進一步釋出了西方人群長期隨訪的OS結果。註釋部分亦說明,西方人群延長隨訪的目的在於增加該人群的隨訪時長,且在進行OS主要分析時,亞洲人群資料已鎖定。明確這一背景有助於後續理解各項OS分析,避免混淆,可惜該資訊未在WCLC中明確說明。接下來的資料分析部分則相當精彩。
圖2. 入組時間和分析時間截點
—— 2.3 人口學與基線特徵 ——
人口學與基線特徵結果如圖3所示。總體上,兩組間資料分佈均衡,為統計分析結果提供了基礎。但存在一個小問題:安慰劑組中有1例患者未接受三代TKI治療。根據統計分析原則,仍將按意向治療(ITT)集進行分析,但後續需進行敏感性分析,以評估該例缺失對結果的影響。
圖3. 人口學和基線特徵
—— 2.4 主要終點PFS主要分析和最終分析 ——
第一個主要終點PFS的主要分析結果(於2024年7月進行,同時包括OS期中分析)如圖4所示。PFS達到統計學意義並不意外,因為HARMONi-A的主要終點即為PFS,且基於該結果AK112已獲NMPA批准。但有兩點值得注意:首先,PFS分析基於345例患者,而非全部438例。這是因為PFS主要分析需在累積約231例PFS事件時進行(參見前文研究設計解讀),而分析時事件數已達275例,此時總入組為345例,因此無需等待後續西方人群入組完成。其次,儘管PFS的風險比(HR)為0.52,且P<0.0001,但中位PFS僅延長2.4個月。
圖4. 主要終點PFS結果
接下來是PFS的亞組分析(圖5)。總體而言,各亞組趨勢與總人群一致。但需重點關注亞洲人群與西方人群的結果:初步來看,西方人群的獲益似乎優於亞洲人群(HR分別為0.30與0.56),且均具統計學意義。
圖5. PFS亞組分析結果
Summit還對腦轉移患者進行了更細緻的亞組分析(圖6)。總體來看,無論患者是否伴有腦轉移,均顯示PFS獲益,且差異具有統計學意義。通常,伴腦轉移的腫瘤患者療效較差,但AK112在該亞組中顯示出更優的獲益(HR=0.34),優於無腦轉移患者(HR=0.59)。
圖6. PFS亞組分析結果 – 腦轉移人群
此外,2025年4月還進行了PFS的最終分析,該分析基於全部438例患者(圖7)。結果顯示,PFS的HR由主要分析時的0.52變為0.57。亞組分析中,西方人群的HR為0.67,較圖5中的0.30有所升高,且統計學意義已接近臨界值。此外,針對PD-L1表達水平的亞組分析顯示,兩組的HR分別為0.55與0.62,差異不大。儘管PFS進行了多次分析,需注意是關鍵註冊臨床試驗的結論應基於首次達到事先定義且滿足I類錯誤控制的分析,本研究中是主要分析結果。因此,本次PFS總體分析結果僅供參考,不影響圖4的既定結論。
圖7. PFS主要分析 vs 長期隨訪分析
—— 2.4 主要終點OS主要分析和西方人群長期分析 ——
接下來是另一個主要終點OS的主要分析結果(2025年4月),如圖8所示。Summit將其解讀為“顯示良好的獲益趨勢”,並指出西方人群資料尚不成熟。從結果來看,OS主要分析確實未達到統計學意義(HR=0.79,P=0.057)。Summit並未迴避該結果,其在今年5月30日釋出的公告中表述為:“依沃西單抗聯合化療在OS主要分析中呈現積極趨勢,但未達到統計學意義的獲益,HR=0.79(95%CI:0.62-1.01;p=0.057)”。至此,兩個主要終點(PFS與OS)的主要分析結果均已明確:PFS具統計學意義(P<0.0001),而OS未達統計學意義(P=0.057)。
那麼,這是否意味著HARMONi研究失敗?答案不能一概而論,需視方案中對PFS與OS雙主要終點的具體設定而定。一般而言,若PFS與OS為共同主要終點(Co-Primary),則要求兩者均達統計學意義方為成功;若僅為雙主要終點而非共同主要終點,則只需其一具統計學意義即可。HARMONi研究中PFS與OS是否屬於共同主要終點,需查閱方案具體規定,但Summit迄今未在公開場合明確說明。然而,在其5月30日釋出的同一公告中,提及FDA的反饋如下:“Based on discussions with the United States Food & Drug Administration (FDA), under our determination and subject to our review, Summit will consider the timing of the filing of this BLA. The FDA noted that a statistically significant overall survival benefit is necessary to support marketing authorization, which will weigh into Summit’s considerations regarding the timing of a potential BLA filing. 主要意思是:基於與FDA的討論,Summit將綜合考慮BLA提交時機。FDA指出,具有統計學顯著性的OS獲益是支援上市批准的必要條件,這將影響Summit對潛在BLA提交時間的考量。”顯然,FDA希望看到具統計學意義的OS結果以支援批准。因此,可認為本研究中PFS與OS為共同主要終點。
此外,拋開統計學意義,從圖8的KM曲線可見,兩組在前10個月內幾乎無差異,10個月後AK112的療效纔開始顯現,且HR僅約0.8;兩組中位OS相差2.8個月。
最後,圖8亦指出,總人群的中位隨訪時間為29.7個月,而西方人群僅9.2個月(西方人群入組較亞洲人群晚1年4個月,圖2)。因此Summit認為,西方人群隨訪時長不足可能導致OS差異未顯現——因為從現有KM曲線看,前10個月內組間差異難以區分。基於此,Summit決定繼續對西方人群進行隨訪,以期延長隨訪後的資料能顯示統計學差異,從而有了2025 WCLC上公佈的西方人群長期隨訪OS資料。具體結果如何?讓我們繼續往下看。
圖8. 主要終點OS主要分析
眾人期待已久的西方人群長期隨訪OS結果終於在本次WCLC中揭曉(圖9)。額外約5個月的隨訪(注:亞洲人群未繼續隨訪,資料已鎖定,見圖2)增加了29例OS事件,結果顯示組間OS差異具統計學意義(HR=0.78,P=0.0332)。該結果看似理想,似乎滿足了FDA所要求的具統計學顯著性的OS結果。
但請注意,前文已說明,本研究的統計學結論應基於事先規定且有I類錯誤控制的分析,本研究即OS期中分析和主要分析結果。顯然,OS其中分析和主要分析已判定未達統計學意義,勝負已定。此處的P=0.0332僅相當於“正式比賽後的兩人私下比拼的結果”,該結果顯然不具備法定效力。因此,Summit在幻燈中將該P值稱為“名義(nominal)結果,即僅針對當前資料的檢驗結果。然而,在整體臨床試驗中,需嚴格控制假陽性(I類錯誤)率不超過0.05,不能僅憑單次P值是否小於0.05判定統計學意義。實際上,本研究的最後一次統計意義判定在最終分析時已完成!關於I類錯誤控制的具體細節,此處不展開討論。
圖9. 主要終點OS - 西方人群長期隨訪分析
Summit亦基於西方人群長期隨訪資料進行了亞組分析(儘管意義有限)。重點對比西方人群與亞洲人群的HR(0.84 vs. 0.76),可見西方人群的OS獲益略遜於亞洲人群。可能原因如前所述:組間差異需在10個月後方可區分,亞洲人群隨訪時間充足,而西方人群隨訪較短,該差異或源於隨訪時長不均。
然而,此處存在一個極為隱蔽的問題:西方人群總體HR為0.84,其中北美人群HR為0.7。那麼,歐洲人群的HR是多少?儘管Summit未公佈該資料,但顯然歐洲人群的OS HR遠高於0.84。鑑於歐洲人群事件數佔西方人群近半,可推測其HR約0.96,接近1.0,表明AK112對歐洲患者幾乎無效。因此,西方人群內部的OS結果存在顯著異質性!!
圖10. 主要終點OS -長期隨訪亞組分析
—— 2.5 ORR和DoR分析 ——
隨後是客觀緩解率(ORR)與緩解持續時間(DoR)的結果(圖11)。對於III期研究,ORR與DoR僅為次要終點。總體而言,AK112資料優於安慰劑組,但未超出預期。
圖11. ORR和DOR結果
—— 2.6 安全性分析 ——
療效資料之後是兩組的安全性概況(圖12)。總體來看,AK112的治療相關不良事件(TRAE)發生率略高於安慰劑組,但組間TRAE分佈差異不大,符合預期。常見TRAE譜亦無顯著差異,表明AK112總體安全性可接受。
圖12. 治療相關AE結果
隨後是免疫相關與VEGF相關不良事件(圖13)。毫無疑問,作為一款PD-1/VEGF雙抗,AK112的相關AE發生率必然高於安慰劑組,結果符合預期。3級及以上TRAE發生率不高,仍屬可接受範圍。
圖13. 免疫相關和VEGF相關的AE
—— 2.7 總結 ——
最後為總結部分(圖13)。PFS無需多言;OS方面,Summit的總結亦很專業,儘管長期隨訪OS的P值為0.0332,但並未聲稱其具統計學意義,僅客觀描述結果。
圖14. 總結
三、問題解答
最後,回到開篇提出的三個問題。透過前文的詳細解讀,相信各位心中已有答案,但實際情況可能比想象中更為複雜。
問題一:今年WCLC公佈的HARMONi最新資料中,OS是否具有統計學意義?
根據Summit幻燈描述,HARMONi對OS共進行了三次分析:2024年7月的期中分析、2025年4月的OS最終分析,以及2025年9月的OS長期隨訪分析。前兩次為計劃內分析,均設有統計成功的判定標準,且研究總體I類錯誤α=0.05已分配於這兩次分析。然而,前兩次分析OS均未達統計學意義。最後一次分析屬於事後(Post-Hoc)分析,僅能作為探索性結果,其是否具統計學意義已無關緊要。
問題二:FDA於8月19日釋出的OS評估指南是否影響AK112獲批?
許多公眾號文章將該指南的釋出視為對AK112審評的負面訊號。然而,該指南的釋出僅是FDA的常規動作,對AK112的審評幾無影響。
首先,根據我多年與監管機構在腫瘤臨床試驗領域的交流經驗,FDA早已推崇OS作為腫瘤臨床試驗的金標準,只是此前未正式釋出指南。在常規溝通中,針對III期試驗,FDA一貫高度重視OS。例如,HARMONi研究中FDA要求將OS作為共同主要終點,且需具統計學意義方可支援批准;而HARMONi-A的主要終點為PFS,OS僅為次要終點,NMPA亦批准上市。
其次,本次釋出的指南為徵求意見稿,待徵集意見後方釋出生效版本,即該指南尚非正式版本。最後,HARMONi西方人群於2023年5月開始入組,表明在此之前Summit已與FDA就方案設計與細節達成一致,後續試驗執行將依此進行,通常不受後續法規影響,除非出現重大考量或實際情況變化。
問題三:基於最新OS資料,AK112獲FDA批准的可能性有多大?
這是一個複雜的問題。我並非FDA決策人員,無法妄下定論。俗話說“欲加之罪,何患無辭”,若FDA欲批准某藥,可羅列諸多理由;反之亦然。儘管如此,我們仍可從以下幾方面推測AK112獲批的可能性:
1. 主要終點的統計學與臨床意義
a) PFS:達統計學意義,中位PFS延長2.4個月。
b) OS:未達統計學意義,中位OS延長2.8個月。
若方案定義為共同主要終點,則本研究從統計學角度視為失敗。
2. 地區人群比例及療效/安全性貢獻
作為全球多中心研究,若要在FDA獲批,西方人群比例通常不應過低(一般需>1/3)。HARMONi中西方人群佔38%(N=165)。然而,受研發策略影響,存在兩個重大隱蔽問題:
a) 西方人群療效貢獻不足:儘管佔比38%,但決定PFS與OS療效的是事件數而非患者數。西方人群在PFS與OS主要分析時的事件數佔比分別為6.4%(18例PFS事件)與17.9%(47例OS事件),因此PFS與OS的療效仍主要由亞洲人群貢獻。
b) 西方人群內部資料異質性:前文OS分析已揭示歐洲與北美人群的巨大差異,該結果難以令人信服其在西方人群中的一致性,勢必使FDA審評陷入兩難。
3. 安全性資料
基於前文分析,AK112的安全性總體良好。同時,AK112尚有其他多項III期研究,大人群資料足以支撐其安全性。然而,HARMONi研究存在一個不可忽視的問題:西方人群安全性貢獻不足。儘管西方患者佔比38%,但安全性評估除人數外,更關鍵的是藥物暴露時長(即安全性隨訪時間)。西方人群與亞洲人群的中位隨訪時間分別為13.7個月與32.7個月。因此,總人群的安全性資料仍主要由亞洲人群貢獻。
4.適應症與藥物迫切性
監管機構批准藥物時,適應症對有效藥物的迫切需求亦是關鍵考量。可從兩方面評估該適應症的未滿足需求:
a) Summit多次在公告中強調該領域的困境:“在這一臨床背景下,美國及其他西方地區仍存在高度未滿足需求,獲批選擇有限,且既往PD-1單抗在III期全球臨床試驗中均未顯示PFS或OS獲益(本研究的兩大主要終點)。” 即截至目前,在EGFR突變、經三代TKI治療的NSCLC患者中,尚無PD-1抑制劑在III期研究中取得成功(無論PFS或OS)。
b) 基於PFS主要分析資料,安慰劑組中位PFS為4.4月。換言之,若患者接受常規化療,半數將在約4個月內疾病進展或死亡。這意味著,此50%的患者他們需要一種有效的治療手段,這是他們迫切的需求。
5.既往與FDA的溝通基礎
Summit在啟動HARMONi研究前,必然已與FDA就研究設計及上市路徑等關鍵問題達成共識。具體細節決定了AK112的註冊路徑,但我們無從得知。然而,前文OS主要分析部分已知FDA對OS的態度:需具統計學顯著性。
6.AK112是否仍有獲批可能?
基於以上五點,AK112獲批的希望似乎渺茫。然而,是否全無機會?我的答案是:仍有希望。HARMONi研究的關鍵問題在於OS主要分析未達統計學意義,而其根源在於西方人群隨訪時長不足,導致療效未能充分顯現;此外,西方人群內部的OS異質性可能源於樣本量不足所致的隨機變異。綜合考慮AK112的PFS獲益與安全性無重大隱患,以及適應症對藥物的迫切需求,AK112仍存在獲批機會。
最可能的批准方式是:基於HARMONi結果附條件批准,同時要求開展一項獨立的西方人群III期試驗,以驗證OS的顯著性、西方人群內部一致性及長期安全性。
四、寫在後麵的話
透過前文分析不難發現,令Summit與康方生物困擾的HARMONi結果,根源在於其大膽的研究設計與激進的研發策略。然而,我仍欽佩Summit敢於創新的思路,以及其說服FDA同意在區域性研究臨近結束時將其擴充套件為全球多中心試驗的能力。若該研究成功,必將成為前無古人、後無來者借鑑的研發策略典範。實際上,HARMONi研究本有極大成功機會,但Summit未能把握。從事後視角出發,若能重來,我們可透過以下最佳化扭轉結局:
1.樣本量計算不合理
導致OS未達統計學意義的最關鍵因素,應該是樣本量估計存在重大失誤。研究設計部分指出,PFS與OS主要分析所需事件數分別為231與261,兩者相差無幾,且OS還需進行一次期中分析。由此可推測,Summit在計算樣本量時假設OS的HR約0.67(而2023年12月HARMONi-A研究的OS HR為0.80),嚴重高估了AK112的OS療效,導致OS事件數不足,最終無法呈現統計學差異。這是一次嚴重的誤判!
2.未利用期中分析進行樣本量調整
若Summit在初始樣本量計算時因缺乏OS精確估值而激進估算尚可理解,那麼在OS期中分析(2024年7月)已獲初步療效資料後,他們本有機會重新估算樣本量,卻錯過了這一關鍵視窗。
最後,HARMONi研究還有一個隱蔽的統計學問題由於篇幅問題無法進一步在本文中闡述。那就是根據Summit公佈的研究設計,HARMONi對OS進行了兩次關鍵分析(2024年7月期中分析與2025年4月最終分析)。而在此前HARMONi-A的NDA過程中,按NMPA要求(2024年ASCO資料)亦進行了兩次OS分析(2023年6月與2023年12月)。因此,從HARMONi研究整體視角,其I類錯誤控制可能存在不科學之處。
據此,我計劃在近期對2024年ASCO公佈的HARMONi-A資料作一次單獨深入解析,敬請期待!
完結








0則評論