IDEAL 框架與推薦提供了外科干預和類似復雜干預的綜合評估路徑,并重點指出在設計隨機對照試驗前,應優先開展適當設計的初步研究。為推動研究設計的正確性和報告的完整性,IDEAL 框架依據不同技術發展階段對研究方法、報告規范等進行推薦。本文從實際案例切入,介紹 IDEAL 框架與推薦中開發階段(2a 期-開發)和探索階段(2b 期-探索)的設計重點,幫助讀者理解如何在臨床實踐中實施 IDEAL 框架與推薦。
引用本文: 薛心雨, 喻佳潔, PeterMcCulloch, AllisonHirst, 李幼平, 陜飛, 胡建昆, 孫鑫. 外科創新技術/器械臨床研究方法學—IDEAL 框架與推薦系列文章之三:IDEAL 案例解讀. 中國胸心血管外科臨床雜志, 2022, 29(7): 834-839. doi: 10.7507/1007-4848.202107067 復制
1996 年,The Lancet 雜志發表名為“外科研究或喜劇表演”的評論,尖銳地指出外科臨床研究中的問題。外科醫生對此反映強烈,認為外科實踐受環境條件、手術過程、手術結果和患者康復等多環節影響,無法實施隨機對照試驗[1]。為解決爭議,外科醫生開始與方法學家合作,探索如何建立一套既符合臨床流行病學和循證醫學實踐原則,又適用于外科特殊情況的方法學框架[2]。2009 年,IDEAL(Idea,Development,Exploration,Assessment and Long-term follow-up,IDEAL)協作網成立[3],并推出 IDEAL 框架與推薦,提供外科干預和類似復雜干預的綜合評估路徑[4-6]。
IDEAL 框架與推薦將外科干預從創新、發展到成熟分為 5 個階段,分別為臨床前評估(Pre-IDEAL)/設計階段(1 期-設想)、開發階段(2a 期-開發)、探索階段(2b 期-探索)、評價階段(3 期-評價)和長期隨訪階段(4 期-長期隨訪),并重點指出在設計隨機對照試驗前,應優先開展適當設計的初步研究(如 2a 期和 2b 期推薦),如隊列研究(cohort study)、可行性(feasibility)或先行性(pilot)研究,以確定開展隨機對照試驗的可行性[7]。
本系列已介紹 IDEAL 框架與推薦的基本概念、主要內容和報告規范[8-9]。本文將重點從 2a 和 2b 階段的兩個實際案例切入,幫助讀者理解如何在臨床實踐中實施 IDEAL 框架與推薦。
1 開發階段(2a 期-開發)
開發階段指外科創新不斷進行技術迭代改良的研究階段,主要目的是獲得外科創新穩定成熟的技術方案及確定適合的干預對象,故該階段的研究重點為:(1)確定每位研究對象的納入排除情況,若排除需說明理由;(2)干預技術演進的全過程,包括技術調整的具體時間和原因;(3)所有符合條件對象的研究結果[10]。該階段研究最終需確定創新方案是否已足夠成熟穩定,可否進入下一階段(即 2b 階段,在此階段干預技術仍然可能需要進行有限的非計劃性調整)。本文以選擇性斷流術治療大肝細胞癌為例解讀該階段設計重點[11]。
1.1 研究背景與目的
肝細胞癌的生長速度和侵襲性很大程度上取決于其血管密度和生成能力[12]。肝動脈結扎術可根據需要選擇性地結扎肝動脈主干或分支,達到阻斷供血、控制腫瘤繼續生長的目的,但該治療方式長期效果不佳[13]。針對該問題,來自蘇丹的研究團隊提出肝動脈結扎和肝外側枝分離(HALED)的技術,通過結扎肝動脈和分離腫瘤表面或病變肝葉的肝外側枝血管,切斷腫瘤的主要供血。該研究的主要目的是評估HALED技術的可行性、安全性和短期效果。
1.2 研究對象的納入排除具體情況
本研究采用前瞻性病例系列的研究設計,納入所有大肝細胞癌伴代償肝功能,適合全身麻醉并接受干預的患者,排除伴有血小板減少癥、不可逆肝代謝失調、大量腹水、晚期腦病或遠處轉移患者。初步納入符合研究條件的患者 63 例,其中 43 例患者因不同原因被排除,最終完成研究的患者數為 20 例,作者在文章中明確說明排除的原因;見表 1。

1.3 逐一呈現技術演進的全過程
在完成隨訪的 20 例患者中,有 7 例患者術前(指征)、術中(技術)和術后過程中出現問題,作者逐一對這些問題進行說明并以圖表的形式注明出現技術調整的患者;見表 2。

1.4 干預結果和技術穩定性
作者在文中以圖表的形式詳細報告了與手術過程相關的指標(如手術時間、術中出血量、術中輸血量)、腫瘤治療反應及術中/術后主要不良事件。技術穩定性方面,作者指出隨著時間推移和經驗增加,患者手術時間、術中失血量和住院時間有明顯縮短或減少。作者的最終結論為:肝動脈結扎合并肝外支脈分離作為一種新的替代治療方案是安全可行的,同時需要一個類似的長期隨訪研究評估該創新的長期穩定性。
2 探索階段(2b 期-探索)
指對外科創新達成技術共識并探索開展下一階段研究可行性的研究階段,主要目的是在干預措施操作細節、相關指征和結局指標上達成一致,故該階段的研究重點為:(1)患者和操作者對干預的態度及偏好;(2)確定成熟穩定的技術方案,如除非核心操作外的差異,確定可接受的技術差異范圍;(3)干預技術的質量評價標準(包括學習曲線的評估);(4)提供確證性研究的樣本量計算基礎[10]。本文以傳統開腹和微創手術治療食管癌為例解讀該階段設計重點[14]。
2.1 研究背景與目的
部分食管癌患者可通過食管癌切除術改善生存,但傳統的外科手術需要在腹部、胸部,有時甚至需要在頸部做大切口,且恢復時間較長;微創手術同樣能改善患者生存,且康復時間短,但需要高質量的隨機對照試驗明確不同干預措施的有效性和安全性[15-16]。英國的研究團隊擬通過開展多中心隨機對照試驗評價兩者的療效和安全性,但在開展高質量確證性隨機對照試驗前尚需面臨以下挑戰:(1)外科醫生對不同術式的強烈偏好;(2)患者不接受隨機化;(3)前兩個問題都可能導致不能在規定時間內招募到足夠樣本的患者;(4)尚缺乏達成廣泛共識的技術方案和質量控制標準;(5)缺乏廣泛接受的結局指標集。
基于上述考慮,研究團隊決定先開展一個納入 2 個中心的可行性(feasibility)隨機對照研究:(1)探索可能影響招募和隨機化的因素及潛在障礙;(2)探索合格候選者的入組情況,確定主試驗(main trial)可實現的樣本量及所需中心數;(3)形成開放/微創食管切除術的詳細技術方案;(4)探索微創食管切除術的學習曲線及可用于主試驗的質量控制標準,并開發能力評估工具,用于術者資質審查;(5)制定病例標本處理方案,優化淋巴結計數和陽性切緣評估質量(這兩者可能是主試驗重要短期結局指標);(6)開發和評估有效可行的設盲方法,使術后第1周能對患者治療保持盲態;(7)確定主試驗的核心結局指標集[17]。
2.2 確定隨機化和盲法的可行性
該研究的重點之一是評估患者和臨床醫生對試驗的可接受性,研究招募困難的潛在原因以確保高水平的招募和知情同意。研究團隊通過對患者和研究參與人員開展深度訪談,將訪談數據按主題分類[18],以便了解不同人群間的共同點和差異,并在后期招募時根據定性研究的調查結果適當調整招募方案(如對手術過程的解釋、聘請專業患者招募人員),并通過反復調整確定主試驗招募策略。
研究團隊認為如果可行性試驗中符合條件患者的隨機化率能達到 50%,即每個試點中心每月至少能入組 2.5 例符合條件的患者,則可滿足主試驗的樣本量。可行性試驗結果顯示:在 21 個月的招募中,263 例患者被評估為合格,其中 135 例(51%)符合納入條件,104 例(77%)被隨機分配到兩個中心,超過預期,如在主試驗中使用現有招募策略可滿足樣本量要求。此外,研究者發現術后第1周通過使用大繃帶覆蓋潛在手術部位可對患者保持盲態。
2.3 制定技術操作方案和質量控制標準
研究團隊對來自英國、美國和日本的 36 名臨床專家開展半結構訪談,并記錄其日常臨床操作。根據已發表文獻和在線數字媒體材料,結合半結構化訪談和結構化觀察主題分析結果,經專家共識后制定:(1)食管切除術的分層任務分析(hierarchical task analysis,腹部、胸部和頸部)[19];(2)食管切除術操作手冊和手術記錄,說明操作中的必要步驟和可選步驟;(3)視頻和照片評估工具。
通過分析手術時間與手術技能和結局的關系確定學習曲線并據此提出在主試驗時對操作者的要求:入選外科醫生至少參與過 30 例患者的手術,且所有的操作者均需按照操作手冊執行,并根據操作者提供的視頻或照片確保其對技術方案的依從性和操作質量。
2.4 開發核心結局指標集(Core Outcome Set,COS)
核心結局指標集指某特定疾病相關的所有臨床研究都應測量和報告的最少但最重要的指標集合,核心結局指標集的確定能幫助研究者比較、分析同類臨床研究結果,優化結局指標選擇,并降低選擇性偏倚的發生風險[20]。
研究團隊首先通過文獻復習確定文獻中提及的目前與食管癌手術相關的所有臨床結局;在通過對臨床護士、醫生、營養師、患者和初級衛生服務代表的定性訪談確定文獻檢索中未識別的其它潛在重要結局;在匯總上述所有相關結局指標后,通過 Delphi 咨詢法遴選出最重要且最小的結局指標列表;最后通過共識會議確定最終適用于食管癌手術的 10 個核心結局指標:總生存率;住院期間病死率;不適宜手術率;再手術率;胸部感染或呼吸系統并發癥;導管壞死或需食管造口術;與營養相關問題(如通過靜脈點滴或胃管進食);總體生存質量;吞咽能力;消化不良或胃灼熱。
2.5 下一階段研究的共識
可行性研究結果表明,研究者對不同食管切除術在技術本身和可行性上達成共識,下一步可通過開展多中心確證性隨機對照試驗比較不同干預措施。但需注意,作者原計劃比較傳統開腹、腹腔鏡和微創手術三種術式,但在可行性試驗中發現微創手術的術式還有待進一步完善,故在確證性試驗中僅比較開腹和腹腔鏡兩種術式。
3 小結
IDEAL 框架與推薦根據外科技術發展的特點強調不同階段的最佳設計類型和研究重點,并指導研究者制定下一步研究計劃。此外,建議研究者在提交稿件時也可使用 IDEAL 報告規范來確認研究設計是否正確及報告的完整性,以確保在技術發展的每個階段都能最大限度地利用證據。
利益沖突:無。
作者貢獻:喻佳潔提出設想;薛心雨撰寫論文;Peter McCulloch、Allison Hirst 推薦案例并修改論文;李幼平、陜飛、胡建昆、孫鑫修改論文。
1996 年,The Lancet 雜志發表名為“外科研究或喜劇表演”的評論,尖銳地指出外科臨床研究中的問題。外科醫生對此反映強烈,認為外科實踐受環境條件、手術過程、手術結果和患者康復等多環節影響,無法實施隨機對照試驗[1]。為解決爭議,外科醫生開始與方法學家合作,探索如何建立一套既符合臨床流行病學和循證醫學實踐原則,又適用于外科特殊情況的方法學框架[2]。2009 年,IDEAL(Idea,Development,Exploration,Assessment and Long-term follow-up,IDEAL)協作網成立[3],并推出 IDEAL 框架與推薦,提供外科干預和類似復雜干預的綜合評估路徑[4-6]。
IDEAL 框架與推薦將外科干預從創新、發展到成熟分為 5 個階段,分別為臨床前評估(Pre-IDEAL)/設計階段(1 期-設想)、開發階段(2a 期-開發)、探索階段(2b 期-探索)、評價階段(3 期-評價)和長期隨訪階段(4 期-長期隨訪),并重點指出在設計隨機對照試驗前,應優先開展適當設計的初步研究(如 2a 期和 2b 期推薦),如隊列研究(cohort study)、可行性(feasibility)或先行性(pilot)研究,以確定開展隨機對照試驗的可行性[7]。
本系列已介紹 IDEAL 框架與推薦的基本概念、主要內容和報告規范[8-9]。本文將重點從 2a 和 2b 階段的兩個實際案例切入,幫助讀者理解如何在臨床實踐中實施 IDEAL 框架與推薦。
1 開發階段(2a 期-開發)
開發階段指外科創新不斷進行技術迭代改良的研究階段,主要目的是獲得外科創新穩定成熟的技術方案及確定適合的干預對象,故該階段的研究重點為:(1)確定每位研究對象的納入排除情況,若排除需說明理由;(2)干預技術演進的全過程,包括技術調整的具體時間和原因;(3)所有符合條件對象的研究結果[10]。該階段研究最終需確定創新方案是否已足夠成熟穩定,可否進入下一階段(即 2b 階段,在此階段干預技術仍然可能需要進行有限的非計劃性調整)。本文以選擇性斷流術治療大肝細胞癌為例解讀該階段設計重點[11]。
1.1 研究背景與目的
肝細胞癌的生長速度和侵襲性很大程度上取決于其血管密度和生成能力[12]。肝動脈結扎術可根據需要選擇性地結扎肝動脈主干或分支,達到阻斷供血、控制腫瘤繼續生長的目的,但該治療方式長期效果不佳[13]。針對該問題,來自蘇丹的研究團隊提出肝動脈結扎和肝外側枝分離(HALED)的技術,通過結扎肝動脈和分離腫瘤表面或病變肝葉的肝外側枝血管,切斷腫瘤的主要供血。該研究的主要目的是評估HALED技術的可行性、安全性和短期效果。
1.2 研究對象的納入排除具體情況
本研究采用前瞻性病例系列的研究設計,納入所有大肝細胞癌伴代償肝功能,適合全身麻醉并接受干預的患者,排除伴有血小板減少癥、不可逆肝代謝失調、大量腹水、晚期腦病或遠處轉移患者。初步納入符合研究條件的患者 63 例,其中 43 例患者因不同原因被排除,最終完成研究的患者數為 20 例,作者在文章中明確說明排除的原因;見表 1。

1.3 逐一呈現技術演進的全過程
在完成隨訪的 20 例患者中,有 7 例患者術前(指征)、術中(技術)和術后過程中出現問題,作者逐一對這些問題進行說明并以圖表的形式注明出現技術調整的患者;見表 2。

1.4 干預結果和技術穩定性
作者在文中以圖表的形式詳細報告了與手術過程相關的指標(如手術時間、術中出血量、術中輸血量)、腫瘤治療反應及術中/術后主要不良事件。技術穩定性方面,作者指出隨著時間推移和經驗增加,患者手術時間、術中失血量和住院時間有明顯縮短或減少。作者的最終結論為:肝動脈結扎合并肝外支脈分離作為一種新的替代治療方案是安全可行的,同時需要一個類似的長期隨訪研究評估該創新的長期穩定性。
2 探索階段(2b 期-探索)
指對外科創新達成技術共識并探索開展下一階段研究可行性的研究階段,主要目的是在干預措施操作細節、相關指征和結局指標上達成一致,故該階段的研究重點為:(1)患者和操作者對干預的態度及偏好;(2)確定成熟穩定的技術方案,如除非核心操作外的差異,確定可接受的技術差異范圍;(3)干預技術的質量評價標準(包括學習曲線的評估);(4)提供確證性研究的樣本量計算基礎[10]。本文以傳統開腹和微創手術治療食管癌為例解讀該階段設計重點[14]。
2.1 研究背景與目的
部分食管癌患者可通過食管癌切除術改善生存,但傳統的外科手術需要在腹部、胸部,有時甚至需要在頸部做大切口,且恢復時間較長;微創手術同樣能改善患者生存,且康復時間短,但需要高質量的隨機對照試驗明確不同干預措施的有效性和安全性[15-16]。英國的研究團隊擬通過開展多中心隨機對照試驗評價兩者的療效和安全性,但在開展高質量確證性隨機對照試驗前尚需面臨以下挑戰:(1)外科醫生對不同術式的強烈偏好;(2)患者不接受隨機化;(3)前兩個問題都可能導致不能在規定時間內招募到足夠樣本的患者;(4)尚缺乏達成廣泛共識的技術方案和質量控制標準;(5)缺乏廣泛接受的結局指標集。
基于上述考慮,研究團隊決定先開展一個納入 2 個中心的可行性(feasibility)隨機對照研究:(1)探索可能影響招募和隨機化的因素及潛在障礙;(2)探索合格候選者的入組情況,確定主試驗(main trial)可實現的樣本量及所需中心數;(3)形成開放/微創食管切除術的詳細技術方案;(4)探索微創食管切除術的學習曲線及可用于主試驗的質量控制標準,并開發能力評估工具,用于術者資質審查;(5)制定病例標本處理方案,優化淋巴結計數和陽性切緣評估質量(這兩者可能是主試驗重要短期結局指標);(6)開發和評估有效可行的設盲方法,使術后第1周能對患者治療保持盲態;(7)確定主試驗的核心結局指標集[17]。
2.2 確定隨機化和盲法的可行性
該研究的重點之一是評估患者和臨床醫生對試驗的可接受性,研究招募困難的潛在原因以確保高水平的招募和知情同意。研究團隊通過對患者和研究參與人員開展深度訪談,將訪談數據按主題分類[18],以便了解不同人群間的共同點和差異,并在后期招募時根據定性研究的調查結果適當調整招募方案(如對手術過程的解釋、聘請專業患者招募人員),并通過反復調整確定主試驗招募策略。
研究團隊認為如果可行性試驗中符合條件患者的隨機化率能達到 50%,即每個試點中心每月至少能入組 2.5 例符合條件的患者,則可滿足主試驗的樣本量。可行性試驗結果顯示:在 21 個月的招募中,263 例患者被評估為合格,其中 135 例(51%)符合納入條件,104 例(77%)被隨機分配到兩個中心,超過預期,如在主試驗中使用現有招募策略可滿足樣本量要求。此外,研究者發現術后第1周通過使用大繃帶覆蓋潛在手術部位可對患者保持盲態。
2.3 制定技術操作方案和質量控制標準
研究團隊對來自英國、美國和日本的 36 名臨床專家開展半結構訪談,并記錄其日常臨床操作。根據已發表文獻和在線數字媒體材料,結合半結構化訪談和結構化觀察主題分析結果,經專家共識后制定:(1)食管切除術的分層任務分析(hierarchical task analysis,腹部、胸部和頸部)[19];(2)食管切除術操作手冊和手術記錄,說明操作中的必要步驟和可選步驟;(3)視頻和照片評估工具。
通過分析手術時間與手術技能和結局的關系確定學習曲線并據此提出在主試驗時對操作者的要求:入選外科醫生至少參與過 30 例患者的手術,且所有的操作者均需按照操作手冊執行,并根據操作者提供的視頻或照片確保其對技術方案的依從性和操作質量。
2.4 開發核心結局指標集(Core Outcome Set,COS)
核心結局指標集指某特定疾病相關的所有臨床研究都應測量和報告的最少但最重要的指標集合,核心結局指標集的確定能幫助研究者比較、分析同類臨床研究結果,優化結局指標選擇,并降低選擇性偏倚的發生風險[20]。
研究團隊首先通過文獻復習確定文獻中提及的目前與食管癌手術相關的所有臨床結局;在通過對臨床護士、醫生、營養師、患者和初級衛生服務代表的定性訪談確定文獻檢索中未識別的其它潛在重要結局;在匯總上述所有相關結局指標后,通過 Delphi 咨詢法遴選出最重要且最小的結局指標列表;最后通過共識會議確定最終適用于食管癌手術的 10 個核心結局指標:總生存率;住院期間病死率;不適宜手術率;再手術率;胸部感染或呼吸系統并發癥;導管壞死或需食管造口術;與營養相關問題(如通過靜脈點滴或胃管進食);總體生存質量;吞咽能力;消化不良或胃灼熱。
2.5 下一階段研究的共識
可行性研究結果表明,研究者對不同食管切除術在技術本身和可行性上達成共識,下一步可通過開展多中心確證性隨機對照試驗比較不同干預措施。但需注意,作者原計劃比較傳統開腹、腹腔鏡和微創手術三種術式,但在可行性試驗中發現微創手術的術式還有待進一步完善,故在確證性試驗中僅比較開腹和腹腔鏡兩種術式。
3 小結
IDEAL 框架與推薦根據外科技術發展的特點強調不同階段的最佳設計類型和研究重點,并指導研究者制定下一步研究計劃。此外,建議研究者在提交稿件時也可使用 IDEAL 報告規范來確認研究設計是否正確及報告的完整性,以確保在技術發展的每個階段都能最大限度地利用證據。
利益沖突:無。
作者貢獻:喻佳潔提出設想;薛心雨撰寫論文;Peter McCulloch、Allison Hirst 推薦案例并修改論文;李幼平、陜飛、胡建昆、孫鑫修改論文。