引用本文: 于明坤, 明揚, 夏如玉, 王迪, 胡瑞學, 李迅, 柴倩云, 張穎, 姜眾會, 于河, 劉建平, 費宇彤. 國際目標值法臨床研究的文獻和方法學特征分析. 中國循證醫學雜志, 2019, 19(11): 1308-1316. doi: 10.7507/1672-2531.201905115 復制
隨機對照試驗(randomized controlled trial,RCT)是干預措施療效評價的“金標準”[1]。由于多種條件的限制,并非所有臨床療效評價研究均適合開展 RCT。2013 年,美國食品藥品監督管理局(food and drug administration,FDA)提出將目標值(objective performance criteria,OPC)法作為 RCT 較為有效的補充替代設計方法之一[2]。他們認為在無法開展盲法、分配患者進入對照組將帶來倫理問題等情況下,OPC 法將是一種較為有效的替代措施[2]。
OPC 是指查閱大量歷史數據或其他資料以獲得該研究結局指標的臨床性能標準,將臨床試驗獲取的終點結局與 OPC 進行比較分析,從而評價干預措施有效性或安全性的方法[3]。2014 年,我國 FDA(現國家藥品監督管理局)開始將 OPC 法納入到部分器械研究的指導原則中[4-6]。OPC 法的開展為切實解決臨床研究中嚴格方法學設計要求與真實世界中諸多實際困難之間的矛盾提供了新思路,并能拓寬廣大臨床研究者視角,合理節約研究投入,減少倫理問題等,具有較高價值。
因此,本文系統檢索國內外利用 OPC 法開展的臨床研究,梳理總結其方法學現狀,總結規律,以期為國內臨床研究者在遇到類似的臨床研究設計瓶頸時提供參考,以推動國內臨床研究發展,切實解決真實世界中的臨床研究所存在的困難。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
運用 OPC 法的臨床研究,文種限英文。
1.1.2 干預措施
不限。
1.1.3 結局指標
使用假設檢驗或可信區間法與 OPC 進行比較的一種或多種結局指標。
1.1.4 排除標準
① 僅為摘要或研究方案;② 重復發表的文獻。
1.2 文獻檢索策略
計算機檢索 PubMed、The Cochrane Library 和 EMbase 數據庫,搜集建庫至 2019 年 2 月 20 日發表的所有運用 OPC 法進行研究的英文文獻。檢索采用主題詞與自由詞相結合的方式進行,并根據不同數據庫的特點進行調整。英文檢索詞包括:performance goal、single arm NEAR/3 clinical trial、single arm objective performance criteria、objective performance criteria 等。以 The Cochrane Library 為例,其具體檢索策略見框 1。

1.3 文獻篩選與資料提取
由 2 名研究者獨立篩選文獻、提取資料;如遇分歧,討論解決,或與第三人商議決策。資料提取內容包括:文獻基本特征(題名、第一作者、發表期刊、發表年份)、期刊影響因子、研究設計類型、選擇 OPC 法研究的原因、干預措施、疾病領域、研究目的、研究持續時間、OPC 來源、與 OPC 方法進行比較的結局指標、結局指標所屬性質及結局指標與 OPC 比較方法、比較的結論。
1.4 統計分析
對提取資料進行歸納、總結后,采用 Excel 軟件進行定性分析,并采用百分比的形式描述文獻的構成。結局指標包括:① 低優指標:數值越低越好的指標;② 高優指標:數值越高越好的指標;③ OPC 法中的國家標準:所在國家 FDA 根據不同產品形成其臨床研究的技術指導原則,若該類產品可使用 OPC 法進行研究,定義指南中對有效性/安全性等結局指標所給出的 OPC 為國家標準。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得文獻 4 368 篇,經逐層篩選,最終納入 51 篇英文文獻[7-57],共涉及 28 694 例受試者。其中單臂臨床試驗 40 篇[7-46]、RCT 2 篇[47-48]、診斷性試驗 2 篇[49, 50]、病例-對照研究 2 篇[56, 57]、病例系列研究 5 篇[51-55]。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入研究的基本特征
2.2.1 發表年份
明確將 OPC 法用于臨床研究的文獻最早發表于 2001 年[31]。2002~2009 年未發表相關文獻。2010 年開始大約每年發表相關文獻 4 篇。在 2017 和 2018 年文章發表量迅速增加(27/51,52.9%)(圖 2)。

2.2.2 發表國家
共有 7 個國家發表了相關研究,美國發表 37 篇[7, 9-23, 25, 26, 28-34, 36-41, 43-45, 47-49, 52, 57],占 72.5%;其次為日本 5 篇[27, 42, 54, 55, 57],德國[35, 41, 50]和中國[51, 53, 56]各 3 篇,法國[8]、加拿大[8]和匈牙利[46]各 1 篇。
2.2.3 影響因子
納入研究的累計影響因子(2017)為 411 分。其中,9 分以上 13 篇[8, 10, 11, 16, 25, 29, 32, 37, 47, 48, 50, 52, 56],發表于 N Engl J Med 的文獻 2 篇[8, 47]。
2.2.4 研究病種
涉及到的病種主要有心血管系統疾病、外周血管疾病、內分泌系統疾病、腫瘤、婦科病和腦病 6 類(圖 3)。

2.3 OPC法研究的方法學特征
2.3.1 使用 OPC 法的原因
提到為何選用 OPC 法的文獻有 11 篇[11, 21, 23, 25, 29, 33, 37, 41, 44, 49, 56]。其中 8 篇[11, 21, 23, 25, 29, 33, 37, 41]闡明采用 OPC 是因隨機化和對照組設置上的困難。其余 3 篇文獻[44, 49, 56]中,1 篇[44]因為難以使用盲法及隨訪期間較高的脫落率;1 篇[56]用 OPC 法彌補 RCT 亞組人群樣本量不足的缺陷;1 篇診斷試驗[49]希望以此提高診斷試驗結果準確性。
2.3.2 OPC 選擇
在納入的文獻中,有 29 篇文獻[8, 9, 11, 13, 15-17, 20, 22, 24-30, 33-39, 42, 44, 46, 47, 50, 55]的 OPC 來自其他臨床試驗數據,10 篇[7, 12, 18, 21, 40, 43, 48, 51-53]來自各國 FDA 所提供的國家標準,5 篇[10, 14, 23, 32, 49]來自多個臨床研究的 Meta 分析,4 篇[31, 41, 45, 56]來自專科學會標準,3 篇[19, 54, 57]未報告來源。39 篇文獻[8-10, 12-18, 20-32, 35-37, 39, 40, 42, 43, 45, 46, 48-54]提及其選擇的主要、次要結局指標與 OPC 來源試驗的結局指標具有可比性。使用 2 個結局指標分別與不同 OPC 進行比較的文獻有 10 篇[7, 8, 11, 16, 19, 20, 28, 44, 46, 52, 57]。經過專家共識的 OPC 文獻有 28 篇[9-12, 16, 17, 22-26, 28-30, 33-39, 42, 48-50, 52, 53, 56],最終確定 OPC 受到 FDA 認證的有 3 篇[12, 38, 52],而 50 篇文獻[7, 9-57]均未提及 OPC 來源的樣本量。明確提及 OPC 法研究樣本量計算方法的文獻有 33 篇[7, 9, 10-12, 14, 16-19, 21, 22, 24, 25, 27, 28, 30, 32-35, 37, 38, 42, 44, 46, 47, 49-53, 56]。
2.3.3 統計分析
50 篇文獻[7-56]使用主要結局指標與 OPC 進行比較,另 1 篇文獻[52]將次要結局指標與 OPC 進行了比較。所有文獻中,使用單個結局指標同 OPC 進行比較的有 41 篇[9, 10, 12-15, 17, 18, 21-27, 29-43, 45, 47-51, 53-57],其中低優指標 26 篇[10, 12-15, 18, 22, 24-27, 29-40, 43, 47, 49, 51, 53, 56],高優指標 13 篇[9, 17, 21, 23, 24, 41-43, 45, 54, 55, 57]和診斷試驗 2 篇[49, 50]。最終研究結果同 OPC 進行比較的方法中采用假設檢驗,使用樣本率同總體率進行比較的文獻有 27 篇[13, 15, 17, 20, 21, 23, 25, 29, 31, 33, 36-43, 45, 47, 49-51, 55-57],使用可信區間法進行比較的文獻有 24 篇[7, 9-12, 14, 16, 18, 19, 22, 23, 25, 26, 28, 30, 32, 34, 35, 44, 46, 48, 51-54]。納入研究的文獻特征和方法學特征匯總見表 1。

3 討論
OPC 法主要用于干預措施的安全性和有效性評價。特別是心血管研究領域近年發展迅速,方法學信息報告相對完善。使用 OPC 法的主要原因大多是因存在隨機化和對照選擇上的困難。在使用時應考慮 OPC 的選擇來源、樣本量和比較方法等因素。OPC 法的應用可解決臨床科研具體實施的困難。研究者應考慮如下設計和實施步驟:首先選擇合適的研究類型、病種、結局指標和 OPC,然后根據 OPC 進行樣本量計算,最終選擇合適的同 OPC 的比較方法以獲得結論。
OPC 法在某種特殊意義上屬于歷史對照的一種形式[58]。不同的是,OPC 數據多要求來自于國家、業內公認標準治療同一疾病其他手段(相對公認)的大量臨床試驗數據或 Meta 分析結果,甚至需要論證,其確定過程相對嚴謹,以 OPC 進行比較后的療效評價結果論證強度更高。使用 OPC 法進行的研究中,大部分干預措施以器械為主,而疾病則多為心腦血管和外周血管疾病。這可能是由于心腦血管和外周血管疾病大多以器械或手術作為主要治療手段,難以設置對照組的原因。當療效驗證遇到隨機化、設置對照和盲法設計上的困難時,研究者可考慮應用 OPC 法。但在可使用 RCT 的情況下,RCT 仍然是干預性治療研究設計的首選。
OPC 法的使用范圍較廣,納入的文獻包括了單臂臨床試驗、RCT、病例-對照研究、病例系列和診斷試驗等研究類型。在 RCT 中,OPC 法可用于對兩組的安全性結局指標進行比較[37]。長久以來,由于樣本量、療程和隨訪時長的限制,RCT 對于干預措施安全性的評價把握度相對不足。而在 RCT 中對安全性結局指標采用 OPC 作為參照,可在一定程度上增強該干預措施安全性的說服力。
美國 FDA 對 OPC 來源的說明中建議選擇的 OPC 需要來自至少 1 萬名以上受試者的臨床試驗數據,且該試驗的患者特征要與當前研究近似,同時所應用的干預必須是公認的最佳或標準治療[59]。OPC 的確定也可通過專家評議會討論產生,以保證最終確定的 OPC 能被業內承認[60]。然而在納入的文獻中,只有 3 篇文獻明確提及其確定的 OPC 受到 FDA 認可。28 篇文獻提到其 OPC 是基于原始試驗數據通過論證產生,50 篇文獻未提及 OPC 來源樣本量,僅 1 篇文獻提到其來源樣本量為 2 667 人,但仍未達到 FDA 建議人數[59]。在選取 OPC 來源臨床試驗的結局指標與研究結局指標的可比性上也提醒研究者們,如果要通過治療同一疾病其他手段(相對公認)的數據選擇合適的 OPC,需要考慮其受試者、研究病種、納入與排除標準、結局指標、評價方法、隨訪時間及觀察時點等多個方面,使研究結果與其 OPC 具有可比性[61]。
國內諸多 OPC 法方法學文獻[1, 3, 62, 63]對研究最終結果與 OPC 比較方法的介紹存在一定的差異,但本文在系統梳理外文文獻時發現,結局指標的比較方法主要可分為兩種:可信區間法和假設檢驗法[61, 64]。在使用可信區間法進行比較時,其主要與 OPC 比較的結局指標性質有密切關系。當結局指標為高優指標時,結局指標 95%CI 的下限大于 OPC,結局指標為低優指標時,95%CI 的上限小于 OPC,則可認為獲得的結果符合研究目的[61]。假設檢驗法則是通過單樣本率同已知總體率進行比較[64, 65],根據結局指標性質不同,判斷其樣本率結果大于或小于 OPC。
雖然運用 OPC 法的臨床研究前期準備工作,尤其是在 OPC 的確定上較為困難,但不能消除某些干擾因素對研究的影響[63]。但正如納入的 1 篇發表于影響因子為 3 分的 SCI 雜志的研究[21]所說,通過與已納入美國 FDA 其他治療方式的大量歷史數據進行比較,可減少設置對照組和樣本量的需求。OPC 法在中醫臨床研究中也存在很大的發展空間。特別是在隨機分組存在障礙、中藥安慰劑制作較為困難、針灸推拿等手法難以施盲時,也可用于驗證干預措施的有效性和安全性等結局。
在開展隨機分組或設立對照組存在障礙的情況下,如何尋找一種可補充替代的療效和安全性評價設計方法,仍是研究者亟待考慮的問題。美國 FDA 將 OPC 法作為醫療器械研究無法使用 RCT 或非隨機的同期對照設計時的替代方法之一[2]。但他們也認為由于文獻發表的異質性和疾病研究的快速進展,選擇一個合適的 OPC 相對較為困難。
本文采用全面的英文檢索策略和嚴格的流程來篩選文獻和提取數據,系統歸納總結了外文研究中運用的 OPC 法的研究方法學特征,分析了外文文獻中 OPC 法的使用規律。通過對外文文獻具體臨床試驗 OPC 法的細節應用進行梳理,可為臨床研究者應用 OPC 法提供更容易理解參考。但本文僅對英文發表的實施 OPC 法具體臨床研究進行特征分析,并非形成一個更加權威的 OPC 使用標準。當試驗設計無法做到隨機時,對照組的價值與 OPC 相比,究竟誰優誰劣仍有待后續考慮。此外,本文在樣本量計算方面仍有欠缺,為確保提供的樣本量計算方法的準確性和嚴謹性,尚需進行更深入更細致統計方法學的探討論證,我們也希望可以在后續的研究中對樣本量計算方法進行單獨研究。
隨機對照試驗(randomized controlled trial,RCT)是干預措施療效評價的“金標準”[1]。由于多種條件的限制,并非所有臨床療效評價研究均適合開展 RCT。2013 年,美國食品藥品監督管理局(food and drug administration,FDA)提出將目標值(objective performance criteria,OPC)法作為 RCT 較為有效的補充替代設計方法之一[2]。他們認為在無法開展盲法、分配患者進入對照組將帶來倫理問題等情況下,OPC 法將是一種較為有效的替代措施[2]。
OPC 是指查閱大量歷史數據或其他資料以獲得該研究結局指標的臨床性能標準,將臨床試驗獲取的終點結局與 OPC 進行比較分析,從而評價干預措施有效性或安全性的方法[3]。2014 年,我國 FDA(現國家藥品監督管理局)開始將 OPC 法納入到部分器械研究的指導原則中[4-6]。OPC 法的開展為切實解決臨床研究中嚴格方法學設計要求與真實世界中諸多實際困難之間的矛盾提供了新思路,并能拓寬廣大臨床研究者視角,合理節約研究投入,減少倫理問題等,具有較高價值。
因此,本文系統檢索國內外利用 OPC 法開展的臨床研究,梳理總結其方法學現狀,總結規律,以期為國內臨床研究者在遇到類似的臨床研究設計瓶頸時提供參考,以推動國內臨床研究發展,切實解決真實世界中的臨床研究所存在的困難。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
運用 OPC 法的臨床研究,文種限英文。
1.1.2 干預措施
不限。
1.1.3 結局指標
使用假設檢驗或可信區間法與 OPC 進行比較的一種或多種結局指標。
1.1.4 排除標準
① 僅為摘要或研究方案;② 重復發表的文獻。
1.2 文獻檢索策略
計算機檢索 PubMed、The Cochrane Library 和 EMbase 數據庫,搜集建庫至 2019 年 2 月 20 日發表的所有運用 OPC 法進行研究的英文文獻。檢索采用主題詞與自由詞相結合的方式進行,并根據不同數據庫的特點進行調整。英文檢索詞包括:performance goal、single arm NEAR/3 clinical trial、single arm objective performance criteria、objective performance criteria 等。以 The Cochrane Library 為例,其具體檢索策略見框 1。

1.3 文獻篩選與資料提取
由 2 名研究者獨立篩選文獻、提取資料;如遇分歧,討論解決,或與第三人商議決策。資料提取內容包括:文獻基本特征(題名、第一作者、發表期刊、發表年份)、期刊影響因子、研究設計類型、選擇 OPC 法研究的原因、干預措施、疾病領域、研究目的、研究持續時間、OPC 來源、與 OPC 方法進行比較的結局指標、結局指標所屬性質及結局指標與 OPC 比較方法、比較的結論。
1.4 統計分析
對提取資料進行歸納、總結后,采用 Excel 軟件進行定性分析,并采用百分比的形式描述文獻的構成。結局指標包括:① 低優指標:數值越低越好的指標;② 高優指標:數值越高越好的指標;③ OPC 法中的國家標準:所在國家 FDA 根據不同產品形成其臨床研究的技術指導原則,若該類產品可使用 OPC 法進行研究,定義指南中對有效性/安全性等結局指標所給出的 OPC 為國家標準。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得文獻 4 368 篇,經逐層篩選,最終納入 51 篇英文文獻[7-57],共涉及 28 694 例受試者。其中單臂臨床試驗 40 篇[7-46]、RCT 2 篇[47-48]、診斷性試驗 2 篇[49, 50]、病例-對照研究 2 篇[56, 57]、病例系列研究 5 篇[51-55]。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入研究的基本特征
2.2.1 發表年份
明確將 OPC 法用于臨床研究的文獻最早發表于 2001 年[31]。2002~2009 年未發表相關文獻。2010 年開始大約每年發表相關文獻 4 篇。在 2017 和 2018 年文章發表量迅速增加(27/51,52.9%)(圖 2)。

2.2.2 發表國家
共有 7 個國家發表了相關研究,美國發表 37 篇[7, 9-23, 25, 26, 28-34, 36-41, 43-45, 47-49, 52, 57],占 72.5%;其次為日本 5 篇[27, 42, 54, 55, 57],德國[35, 41, 50]和中國[51, 53, 56]各 3 篇,法國[8]、加拿大[8]和匈牙利[46]各 1 篇。
2.2.3 影響因子
納入研究的累計影響因子(2017)為 411 分。其中,9 分以上 13 篇[8, 10, 11, 16, 25, 29, 32, 37, 47, 48, 50, 52, 56],發表于 N Engl J Med 的文獻 2 篇[8, 47]。
2.2.4 研究病種
涉及到的病種主要有心血管系統疾病、外周血管疾病、內分泌系統疾病、腫瘤、婦科病和腦病 6 類(圖 3)。

2.3 OPC法研究的方法學特征
2.3.1 使用 OPC 法的原因
提到為何選用 OPC 法的文獻有 11 篇[11, 21, 23, 25, 29, 33, 37, 41, 44, 49, 56]。其中 8 篇[11, 21, 23, 25, 29, 33, 37, 41]闡明采用 OPC 是因隨機化和對照組設置上的困難。其余 3 篇文獻[44, 49, 56]中,1 篇[44]因為難以使用盲法及隨訪期間較高的脫落率;1 篇[56]用 OPC 法彌補 RCT 亞組人群樣本量不足的缺陷;1 篇診斷試驗[49]希望以此提高診斷試驗結果準確性。
2.3.2 OPC 選擇
在納入的文獻中,有 29 篇文獻[8, 9, 11, 13, 15-17, 20, 22, 24-30, 33-39, 42, 44, 46, 47, 50, 55]的 OPC 來自其他臨床試驗數據,10 篇[7, 12, 18, 21, 40, 43, 48, 51-53]來自各國 FDA 所提供的國家標準,5 篇[10, 14, 23, 32, 49]來自多個臨床研究的 Meta 分析,4 篇[31, 41, 45, 56]來自專科學會標準,3 篇[19, 54, 57]未報告來源。39 篇文獻[8-10, 12-18, 20-32, 35-37, 39, 40, 42, 43, 45, 46, 48-54]提及其選擇的主要、次要結局指標與 OPC 來源試驗的結局指標具有可比性。使用 2 個結局指標分別與不同 OPC 進行比較的文獻有 10 篇[7, 8, 11, 16, 19, 20, 28, 44, 46, 52, 57]。經過專家共識的 OPC 文獻有 28 篇[9-12, 16, 17, 22-26, 28-30, 33-39, 42, 48-50, 52, 53, 56],最終確定 OPC 受到 FDA 認證的有 3 篇[12, 38, 52],而 50 篇文獻[7, 9-57]均未提及 OPC 來源的樣本量。明確提及 OPC 法研究樣本量計算方法的文獻有 33 篇[7, 9, 10-12, 14, 16-19, 21, 22, 24, 25, 27, 28, 30, 32-35, 37, 38, 42, 44, 46, 47, 49-53, 56]。
2.3.3 統計分析
50 篇文獻[7-56]使用主要結局指標與 OPC 進行比較,另 1 篇文獻[52]將次要結局指標與 OPC 進行了比較。所有文獻中,使用單個結局指標同 OPC 進行比較的有 41 篇[9, 10, 12-15, 17, 18, 21-27, 29-43, 45, 47-51, 53-57],其中低優指標 26 篇[10, 12-15, 18, 22, 24-27, 29-40, 43, 47, 49, 51, 53, 56],高優指標 13 篇[9, 17, 21, 23, 24, 41-43, 45, 54, 55, 57]和診斷試驗 2 篇[49, 50]。最終研究結果同 OPC 進行比較的方法中采用假設檢驗,使用樣本率同總體率進行比較的文獻有 27 篇[13, 15, 17, 20, 21, 23, 25, 29, 31, 33, 36-43, 45, 47, 49-51, 55-57],使用可信區間法進行比較的文獻有 24 篇[7, 9-12, 14, 16, 18, 19, 22, 23, 25, 26, 28, 30, 32, 34, 35, 44, 46, 48, 51-54]。納入研究的文獻特征和方法學特征匯總見表 1。

3 討論
OPC 法主要用于干預措施的安全性和有效性評價。特別是心血管研究領域近年發展迅速,方法學信息報告相對完善。使用 OPC 法的主要原因大多是因存在隨機化和對照選擇上的困難。在使用時應考慮 OPC 的選擇來源、樣本量和比較方法等因素。OPC 法的應用可解決臨床科研具體實施的困難。研究者應考慮如下設計和實施步驟:首先選擇合適的研究類型、病種、結局指標和 OPC,然后根據 OPC 進行樣本量計算,最終選擇合適的同 OPC 的比較方法以獲得結論。
OPC 法在某種特殊意義上屬于歷史對照的一種形式[58]。不同的是,OPC 數據多要求來自于國家、業內公認標準治療同一疾病其他手段(相對公認)的大量臨床試驗數據或 Meta 分析結果,甚至需要論證,其確定過程相對嚴謹,以 OPC 進行比較后的療效評價結果論證強度更高。使用 OPC 法進行的研究中,大部分干預措施以器械為主,而疾病則多為心腦血管和外周血管疾病。這可能是由于心腦血管和外周血管疾病大多以器械或手術作為主要治療手段,難以設置對照組的原因。當療效驗證遇到隨機化、設置對照和盲法設計上的困難時,研究者可考慮應用 OPC 法。但在可使用 RCT 的情況下,RCT 仍然是干預性治療研究設計的首選。
OPC 法的使用范圍較廣,納入的文獻包括了單臂臨床試驗、RCT、病例-對照研究、病例系列和診斷試驗等研究類型。在 RCT 中,OPC 法可用于對兩組的安全性結局指標進行比較[37]。長久以來,由于樣本量、療程和隨訪時長的限制,RCT 對于干預措施安全性的評價把握度相對不足。而在 RCT 中對安全性結局指標采用 OPC 作為參照,可在一定程度上增強該干預措施安全性的說服力。
美國 FDA 對 OPC 來源的說明中建議選擇的 OPC 需要來自至少 1 萬名以上受試者的臨床試驗數據,且該試驗的患者特征要與當前研究近似,同時所應用的干預必須是公認的最佳或標準治療[59]。OPC 的確定也可通過專家評議會討論產生,以保證最終確定的 OPC 能被業內承認[60]。然而在納入的文獻中,只有 3 篇文獻明確提及其確定的 OPC 受到 FDA 認可。28 篇文獻提到其 OPC 是基于原始試驗數據通過論證產生,50 篇文獻未提及 OPC 來源樣本量,僅 1 篇文獻提到其來源樣本量為 2 667 人,但仍未達到 FDA 建議人數[59]。在選取 OPC 來源臨床試驗的結局指標與研究結局指標的可比性上也提醒研究者們,如果要通過治療同一疾病其他手段(相對公認)的數據選擇合適的 OPC,需要考慮其受試者、研究病種、納入與排除標準、結局指標、評價方法、隨訪時間及觀察時點等多個方面,使研究結果與其 OPC 具有可比性[61]。
國內諸多 OPC 法方法學文獻[1, 3, 62, 63]對研究最終結果與 OPC 比較方法的介紹存在一定的差異,但本文在系統梳理外文文獻時發現,結局指標的比較方法主要可分為兩種:可信區間法和假設檢驗法[61, 64]。在使用可信區間法進行比較時,其主要與 OPC 比較的結局指標性質有密切關系。當結局指標為高優指標時,結局指標 95%CI 的下限大于 OPC,結局指標為低優指標時,95%CI 的上限小于 OPC,則可認為獲得的結果符合研究目的[61]。假設檢驗法則是通過單樣本率同已知總體率進行比較[64, 65],根據結局指標性質不同,判斷其樣本率結果大于或小于 OPC。
雖然運用 OPC 法的臨床研究前期準備工作,尤其是在 OPC 的確定上較為困難,但不能消除某些干擾因素對研究的影響[63]。但正如納入的 1 篇發表于影響因子為 3 分的 SCI 雜志的研究[21]所說,通過與已納入美國 FDA 其他治療方式的大量歷史數據進行比較,可減少設置對照組和樣本量的需求。OPC 法在中醫臨床研究中也存在很大的發展空間。特別是在隨機分組存在障礙、中藥安慰劑制作較為困難、針灸推拿等手法難以施盲時,也可用于驗證干預措施的有效性和安全性等結局。
在開展隨機分組或設立對照組存在障礙的情況下,如何尋找一種可補充替代的療效和安全性評價設計方法,仍是研究者亟待考慮的問題。美國 FDA 將 OPC 法作為醫療器械研究無法使用 RCT 或非隨機的同期對照設計時的替代方法之一[2]。但他們也認為由于文獻發表的異質性和疾病研究的快速進展,選擇一個合適的 OPC 相對較為困難。
本文采用全面的英文檢索策略和嚴格的流程來篩選文獻和提取數據,系統歸納總結了外文研究中運用的 OPC 法的研究方法學特征,分析了外文文獻中 OPC 法的使用規律。通過對外文文獻具體臨床試驗 OPC 法的細節應用進行梳理,可為臨床研究者應用 OPC 法提供更容易理解參考。但本文僅對英文發表的實施 OPC 法具體臨床研究進行特征分析,并非形成一個更加權威的 OPC 使用標準。當試驗設計無法做到隨機時,對照組的價值與 OPC 相比,究竟誰優誰劣仍有待后續考慮。此外,本文在樣本量計算方面仍有欠缺,為確保提供的樣本量計算方法的準確性和嚴謹性,尚需進行更深入更細致統計方法學的探討論證,我們也希望可以在后續的研究中對樣本量計算方法進行單獨研究。