在醫學研究領域,先行性與可行性研究是為降低正式試驗的不確定性、提高正式試驗的總體質量及成功率而實施的先行性探索性試驗;先行性與可行性研究是為了回答“未來的正式試驗能否實行、是否應該實行(如果應該實行,如何實行)”這樣的問題。Ⅲ期臨床試驗耗時耗力、需大量的資源投入,所以在實施正式試驗前往往需要開展先行性探索性的小規模試驗、以確保正式試驗的可行性與順利開展。目前先行性與可行性研究越來越受到關注,然而在國內此類研究才剛引起重視。本文就先行性與可行性研究的相關概念、對正式試驗的價值、實例分析與研究現狀作簡單介紹。
引用本文: 黎國威, 吳大嶸, 張穎, 張靜怡, 李子一, 商洪才. 先行性與可行性研究在醫學研究領域中的價值與應用簡介. 中國循證醫學雜志, 2021, 21(5): 617-620. doi: 10.7507/1672-2531.202011065 復制
在醫學研究領域,高質量的Ⅲ期臨床試驗提供的證據通常可作為金標準來衡量干預的有效性與安全性。然而Ⅲ期臨床試驗耗時耗力、需大量的資源投入,所以在實施正式試驗前往往需要開展先行性的小規模試驗、以確保正式試驗的可行性與順利開展。此類探索性試驗稱為先行性與可行性研究(pilot and feasibility studies,PAFS)。目前 PAFS 越來越受到關注,然而在國內 PAFS 仍處于起始階段。本文就醫學研究領域 PAFS 的相關概念、對正式試驗的價值、實例分析與研究現狀作簡單介紹。
1 PAFS 定義與相關概念
在醫學研究領域,PAFS 是為降低正式試驗的不確定性、提高正式試驗的總體質量及成功率而實施的先行試探性試驗[1]。先行性(pilot)和可行性研究(feasibility study)都是為了回答“未來的正式試驗能否實行、是否應該實行(如果應該實行,如何實行)”這樣的問題(表 1),譬如能否及時納入足夠的受試者、失訪率是否過高、納入排除標準是否過于苛刻、干預措施和結局的測量能否被研究人員與受試者所接受等[2]。先行性與可行性的定義存在著細微的差別,此差別在于先行性是遵照未來正式試驗的設計特點去實行的小規模試驗,可行性則可能不需過多考慮未來試驗的設計要素而去開展;因此可行性包含了先行性,先行性是可行性的一個子集[3]。在醫學研究領域,PAFS 通常分為隨機對照試驗(randomized controlled trial,RCT)、非 RCT 及其他研究設計類型的預試驗;其中 RCT 是 PAFS 最主要的種類、是充分考慮了正式試驗設計要素而實行的,也是當前文獻報道最多的一種 PAFS[1, 4]。本文下面著重討論的也是 PAFS-RCT。

使用先行性或可行性研究 RCT 的英文名詞比較繁雜,包括 pilot RCT、feasibility RCT、randomized pilot study、feasibility trial、randomized feasibility study、pilot investigation 等。當前達成的共識認為:只要 PAFS 是在正式 RCT 開展前實行的、是為探索正式試驗是否可行而做的研究,都屬于 PAFS-RCT 的范疇[1]。
PAFS 也可分為外部試驗(external PAFS)與內部試驗(internal PAFS)兩種類型。兩者的區別在于:外部試驗是獨立于正式試驗的,正式試驗的設計及實行可能會因為外部試驗的結果而改變(例如由于納入排除標準的改變導致目標人群的改變),因此外部試驗的數據是不與正式試驗合并作分析使用的、不會影響正式試驗的效應估計;而內部試驗的數據將會與正式試驗合并后使用[3]。由于內部試驗本質上屬于正式試驗的一部分,當前文獻對內部試驗(尤其是使用適應性研究設計的內部試驗)的研究報道較多;例如英國的醫學研究委員會對內部試驗發表了系列的指導性文章[5, 6]。相對而言,現有文獻對外部試驗的研究比較欠缺;而目前對外部試驗的研究也逐漸成為了 PAFS 的主流,包括 2016 發表在 BMJ 的 CONSORT 擴展版中對 PAFS 報告規范也是針對外部試驗而言的[3],發表在 BMC Pilot and Feasibility Studies 雜志上的 PAFS 大部分也是屬于外部試驗[7]。
值得注意的是,由于 PAFS 是為解決正式試驗不確定性而實行的試驗,其并非受假設檢驗驅動,所以 PAFS 與Ⅱ期臨床試驗具有明顯的區別:Ⅱ期臨床試驗往往是為了探索干預的安全性與初步評估干預的有效性;而 PAFS 是為了回答未來的正式試驗是否可行這一科學問題,通常是在Ⅱ期臨床試驗之后、Ⅲ期試驗之前開展的。PAFS 應以可行性為主要研究目的,而不鼓勵以探索干預措施的有效性為目的(因為有效性安全性的初步評價需開展的是Ⅱ期 RCT、進一步大樣本系統評估有效性安全性需開展的是Ⅲ期 RCT)[2, 3]。即使有些 PAFS 的結果能為干預的有效性、安全性(尤其是效應值與樣本量的估計)提供一定的證據與經驗,這些信息需十分謹慎看待、而且需強調關注的應是區間估計(例如 95%CI)而并非點估計值,因為 PAFS 是為了解決正式試驗的可行性為目的,其樣本量可能過小而不足以提供可信的估計值[8, 9]。
2 PAFS 的價值
如上所述,PAFS 是為解決正式試驗的不確定性、提高其可行性與總體質量而實行的試驗,因此 PAFS 往往是正式試驗實施前的一個關鍵步驟。具體而言,PAFS 可改進正式試驗的設計及完善試驗方案,包括試驗流程、信息采集表、提高患者參與實驗的意愿及依從性等;也可測試試驗的方法學要點,包括隨機化、盲法的實施、患者對干預的可接受程度等等;評估各種試驗所需的資源情況,包括招募受試者的數量與速度、所需的人財物力、各種機構的協調配合程度等;也可為正式試驗提供一定的數據與經驗,包括主要結局的選擇、效應值初步評估與不確定性、樣本量的估算等[10]。
由于Ⅲ期 RCT 往往是多中心大樣本、耗費大量資金與時間、花費各種資源的臨床試驗,所以在開展前須確保正式試驗的可行性;國外某些研究機構目前甚至要求研究者須提交 PAFS 證據證明Ⅲ期 RCT 可行性,才會給予資助。2001 年發表在 BMJ 的研究指出,缺乏可行性是造成Ⅲ期 RCT 提前終止的第二大原因;因缺乏可行性而提前終止正式試驗的做法,是違反了赫爾辛基原則的,是不倫理的科學研究行為[11, 12]。因此除非特殊情況,在開展Ⅲ期正式試驗前,通常要求研究者先實行 PAFS 以確保正式試驗的可行性[3, 9]。
3 實例分析
2014 年發表在 CMAJ 的一項名為 HIP ATTACK 的 PAFS-RCT[13],旨在探索在髖骨骨折患者中,開展一項大型的、探索快速手術治療模式的有效性的正式試驗是否可行。該 PAFS 的可行性結局是在 18 個月以內須成功隨機分配 60 例符合標準的患者(30 例入組快速手術治療模式、30 例入組常規手術治療模式)、不低于 70% 符合標準的患者同意自愿參加試驗、30 天內隨訪率不低于 95%。
該試驗的結果最終均滿足可行性的標準:在 14 個月以內成功分配 60 例患者、80% 的患者同意參加試驗、隨訪率 100%。該試驗同時匯報了一些關于快速手術治療模式有效性的結果[HR=0.60,95%CI(0.26,1.39)];此結果也在文章的討論部分被詳細解讀,并強調了由于此 PAFS 并非受假設檢驗(快速手術治療模式的效果不同于常規手術治療模式)驅動的、樣本量肯定也不足以檢驗假設,因此應該更關注其結果的 95%CI,而非點估計值。基于此 PAFS 的結果,作者結論是支持進行未來的Ⅲ期正式試驗,其具有明確的可行性。該 PAFS 的匯報也很好地遵循了 CONSORT 可行性研究擴展版:除了部分條目不適用以外(6b、6c、7b 和 19a),其余條目要求的內容在該文章中都得到了詳細匯報。
4 當前 PAFS 發展現狀
PAFS 還屬于一個較新的領域,而且由于 PAFS 屬于在正式試驗開展前的一類試探性試驗,所以往往容易被忽略[14]。從 2016 年關于 PAFS 的匯報指南(CONSORT extension to randomized PAFS)發表在 BMJ 以后,PAFS 越來越受到重視。例如 BMC Pilot and Feasibility Studies 發表的關于 PAFS 的文章,從 2016 年的 73 篇上升到 2019 年的 156 篇,該雜志收到的投稿也從 2016 年的 182 篇上升到 2019 年的 531 篇;英國某些研究機構也逐漸開設關于 PAFS 的專門網站,旨在推廣 PAFS 的標準化實施與匯報、提高 PAFS 的整體質量。然而國內的 PAFS 目前還處于起步階段,不受關注。譬如我們團隊之前的一項關于中醫藥 PAFS 研究現狀的調查發現:國內中醫藥 PAFS 的質量低下,很多研究甚至 PAFS 概念不清,報告也沒有遵循 CONSORT 可行性研究擴展版要求[15]。故 PAFS 在國內還需進一步的推廣與重視。
同時,PAFS 的方法學要素還需進一步的深入研究。譬如發表 BMJ 的指南雖然要求 PAFS 的文章明確匯報可行性的標準(即 PAFS 達到了何種標準才能明確未來的正式試驗具有可行性),然而如何確定這個標準,還缺乏明確的詳細解釋。以招募受試者的成功率為例,在所有符合標準的受試者中,同意自愿參加試驗的患者需達到 60% 還是 80% 的比例,才能確定未來的正式試驗具有明顯的可行性?當前并無研究對此進行解釋。同理,如何確定 PAFS 的樣本量,也需更多的研究證據。因為 PAFS 并非受假設檢驗驅動的,所以 PAFS 的樣本量往往是基于研究者的經驗或專業判斷估算的[16]。PAFS 的開展也可能會遇到倫理方面的質疑:因為 PAFS 并非受假設檢驗驅動的,故某些 PAFS 中受試者權益能否得到最大程度的保護和實現,是研究亟待解決的一個重要問題[9]。這些方法學的要點都仍需進一步的研究。
5 小結
PAFS 是為降低正式試驗不確定性、增加正式試驗成功率、提高正式試驗質量而開展的關鍵探索性試驗。PAFS 目前越來越受到關注,然而國內對 PAFS 的推廣與重視仍需大力加強。PAFS 的方法學要點也需更多的研究與證據來完善。高質量的 PAFS RCT 的開展,將會為正式試驗的順利開展、降低試驗失敗風險、避免研究資源的浪費提供不可或缺的數據支持和關鍵證據。
致謝:由衷感謝北京中醫藥大學的劉建平教授為本文提供的非常有價值的建議與意見。
在醫學研究領域,高質量的Ⅲ期臨床試驗提供的證據通常可作為金標準來衡量干預的有效性與安全性。然而Ⅲ期臨床試驗耗時耗力、需大量的資源投入,所以在實施正式試驗前往往需要開展先行性的小規模試驗、以確保正式試驗的可行性與順利開展。此類探索性試驗稱為先行性與可行性研究(pilot and feasibility studies,PAFS)。目前 PAFS 越來越受到關注,然而在國內 PAFS 仍處于起始階段。本文就醫學研究領域 PAFS 的相關概念、對正式試驗的價值、實例分析與研究現狀作簡單介紹。
1 PAFS 定義與相關概念
在醫學研究領域,PAFS 是為降低正式試驗的不確定性、提高正式試驗的總體質量及成功率而實施的先行試探性試驗[1]。先行性(pilot)和可行性研究(feasibility study)都是為了回答“未來的正式試驗能否實行、是否應該實行(如果應該實行,如何實行)”這樣的問題(表 1),譬如能否及時納入足夠的受試者、失訪率是否過高、納入排除標準是否過于苛刻、干預措施和結局的測量能否被研究人員與受試者所接受等[2]。先行性與可行性的定義存在著細微的差別,此差別在于先行性是遵照未來正式試驗的設計特點去實行的小規模試驗,可行性則可能不需過多考慮未來試驗的設計要素而去開展;因此可行性包含了先行性,先行性是可行性的一個子集[3]。在醫學研究領域,PAFS 通常分為隨機對照試驗(randomized controlled trial,RCT)、非 RCT 及其他研究設計類型的預試驗;其中 RCT 是 PAFS 最主要的種類、是充分考慮了正式試驗設計要素而實行的,也是當前文獻報道最多的一種 PAFS[1, 4]。本文下面著重討論的也是 PAFS-RCT。

使用先行性或可行性研究 RCT 的英文名詞比較繁雜,包括 pilot RCT、feasibility RCT、randomized pilot study、feasibility trial、randomized feasibility study、pilot investigation 等。當前達成的共識認為:只要 PAFS 是在正式 RCT 開展前實行的、是為探索正式試驗是否可行而做的研究,都屬于 PAFS-RCT 的范疇[1]。
PAFS 也可分為外部試驗(external PAFS)與內部試驗(internal PAFS)兩種類型。兩者的區別在于:外部試驗是獨立于正式試驗的,正式試驗的設計及實行可能會因為外部試驗的結果而改變(例如由于納入排除標準的改變導致目標人群的改變),因此外部試驗的數據是不與正式試驗合并作分析使用的、不會影響正式試驗的效應估計;而內部試驗的數據將會與正式試驗合并后使用[3]。由于內部試驗本質上屬于正式試驗的一部分,當前文獻對內部試驗(尤其是使用適應性研究設計的內部試驗)的研究報道較多;例如英國的醫學研究委員會對內部試驗發表了系列的指導性文章[5, 6]。相對而言,現有文獻對外部試驗的研究比較欠缺;而目前對外部試驗的研究也逐漸成為了 PAFS 的主流,包括 2016 發表在 BMJ 的 CONSORT 擴展版中對 PAFS 報告規范也是針對外部試驗而言的[3],發表在 BMC Pilot and Feasibility Studies 雜志上的 PAFS 大部分也是屬于外部試驗[7]。
值得注意的是,由于 PAFS 是為解決正式試驗不確定性而實行的試驗,其并非受假設檢驗驅動,所以 PAFS 與Ⅱ期臨床試驗具有明顯的區別:Ⅱ期臨床試驗往往是為了探索干預的安全性與初步評估干預的有效性;而 PAFS 是為了回答未來的正式試驗是否可行這一科學問題,通常是在Ⅱ期臨床試驗之后、Ⅲ期試驗之前開展的。PAFS 應以可行性為主要研究目的,而不鼓勵以探索干預措施的有效性為目的(因為有效性安全性的初步評價需開展的是Ⅱ期 RCT、進一步大樣本系統評估有效性安全性需開展的是Ⅲ期 RCT)[2, 3]。即使有些 PAFS 的結果能為干預的有效性、安全性(尤其是效應值與樣本量的估計)提供一定的證據與經驗,這些信息需十分謹慎看待、而且需強調關注的應是區間估計(例如 95%CI)而并非點估計值,因為 PAFS 是為了解決正式試驗的可行性為目的,其樣本量可能過小而不足以提供可信的估計值[8, 9]。
2 PAFS 的價值
如上所述,PAFS 是為解決正式試驗的不確定性、提高其可行性與總體質量而實行的試驗,因此 PAFS 往往是正式試驗實施前的一個關鍵步驟。具體而言,PAFS 可改進正式試驗的設計及完善試驗方案,包括試驗流程、信息采集表、提高患者參與實驗的意愿及依從性等;也可測試試驗的方法學要點,包括隨機化、盲法的實施、患者對干預的可接受程度等等;評估各種試驗所需的資源情況,包括招募受試者的數量與速度、所需的人財物力、各種機構的協調配合程度等;也可為正式試驗提供一定的數據與經驗,包括主要結局的選擇、效應值初步評估與不確定性、樣本量的估算等[10]。
由于Ⅲ期 RCT 往往是多中心大樣本、耗費大量資金與時間、花費各種資源的臨床試驗,所以在開展前須確保正式試驗的可行性;國外某些研究機構目前甚至要求研究者須提交 PAFS 證據證明Ⅲ期 RCT 可行性,才會給予資助。2001 年發表在 BMJ 的研究指出,缺乏可行性是造成Ⅲ期 RCT 提前終止的第二大原因;因缺乏可行性而提前終止正式試驗的做法,是違反了赫爾辛基原則的,是不倫理的科學研究行為[11, 12]。因此除非特殊情況,在開展Ⅲ期正式試驗前,通常要求研究者先實行 PAFS 以確保正式試驗的可行性[3, 9]。
3 實例分析
2014 年發表在 CMAJ 的一項名為 HIP ATTACK 的 PAFS-RCT[13],旨在探索在髖骨骨折患者中,開展一項大型的、探索快速手術治療模式的有效性的正式試驗是否可行。該 PAFS 的可行性結局是在 18 個月以內須成功隨機分配 60 例符合標準的患者(30 例入組快速手術治療模式、30 例入組常規手術治療模式)、不低于 70% 符合標準的患者同意自愿參加試驗、30 天內隨訪率不低于 95%。
該試驗的結果最終均滿足可行性的標準:在 14 個月以內成功分配 60 例患者、80% 的患者同意參加試驗、隨訪率 100%。該試驗同時匯報了一些關于快速手術治療模式有效性的結果[HR=0.60,95%CI(0.26,1.39)];此結果也在文章的討論部分被詳細解讀,并強調了由于此 PAFS 并非受假設檢驗(快速手術治療模式的效果不同于常規手術治療模式)驅動的、樣本量肯定也不足以檢驗假設,因此應該更關注其結果的 95%CI,而非點估計值。基于此 PAFS 的結果,作者結論是支持進行未來的Ⅲ期正式試驗,其具有明確的可行性。該 PAFS 的匯報也很好地遵循了 CONSORT 可行性研究擴展版:除了部分條目不適用以外(6b、6c、7b 和 19a),其余條目要求的內容在該文章中都得到了詳細匯報。
4 當前 PAFS 發展現狀
PAFS 還屬于一個較新的領域,而且由于 PAFS 屬于在正式試驗開展前的一類試探性試驗,所以往往容易被忽略[14]。從 2016 年關于 PAFS 的匯報指南(CONSORT extension to randomized PAFS)發表在 BMJ 以后,PAFS 越來越受到重視。例如 BMC Pilot and Feasibility Studies 發表的關于 PAFS 的文章,從 2016 年的 73 篇上升到 2019 年的 156 篇,該雜志收到的投稿也從 2016 年的 182 篇上升到 2019 年的 531 篇;英國某些研究機構也逐漸開設關于 PAFS 的專門網站,旨在推廣 PAFS 的標準化實施與匯報、提高 PAFS 的整體質量。然而國內的 PAFS 目前還處于起步階段,不受關注。譬如我們團隊之前的一項關于中醫藥 PAFS 研究現狀的調查發現:國內中醫藥 PAFS 的質量低下,很多研究甚至 PAFS 概念不清,報告也沒有遵循 CONSORT 可行性研究擴展版要求[15]。故 PAFS 在國內還需進一步的推廣與重視。
同時,PAFS 的方法學要素還需進一步的深入研究。譬如發表 BMJ 的指南雖然要求 PAFS 的文章明確匯報可行性的標準(即 PAFS 達到了何種標準才能明確未來的正式試驗具有可行性),然而如何確定這個標準,還缺乏明確的詳細解釋。以招募受試者的成功率為例,在所有符合標準的受試者中,同意自愿參加試驗的患者需達到 60% 還是 80% 的比例,才能確定未來的正式試驗具有明顯的可行性?當前并無研究對此進行解釋。同理,如何確定 PAFS 的樣本量,也需更多的研究證據。因為 PAFS 并非受假設檢驗驅動的,所以 PAFS 的樣本量往往是基于研究者的經驗或專業判斷估算的[16]。PAFS 的開展也可能會遇到倫理方面的質疑:因為 PAFS 并非受假設檢驗驅動的,故某些 PAFS 中受試者權益能否得到最大程度的保護和實現,是研究亟待解決的一個重要問題[9]。這些方法學的要點都仍需進一步的研究。
5 小結
PAFS 是為降低正式試驗不確定性、增加正式試驗成功率、提高正式試驗質量而開展的關鍵探索性試驗。PAFS 目前越來越受到關注,然而國內對 PAFS 的推廣與重視仍需大力加強。PAFS 的方法學要點也需更多的研究與證據來完善。高質量的 PAFS RCT 的開展,將會為正式試驗的順利開展、降低試驗失敗風險、避免研究資源的浪費提供不可或缺的數據支持和關鍵證據。
致謝:由衷感謝北京中醫藥大學的劉建平教授為本文提供的非常有價值的建議與意見。