單病例隨機對照試驗(N-of-1 trials)是一種基于單個患者所設計的多輪試驗期交替的前瞻性臨床隨機交叉對照試驗,可為臨床決策者提供干預措施效果比較的高級別證據。近期,由多位學者組成的國際團隊在BMJ上發表了N-of-1 trials方案規范清單(SPENT 2019),目的在于明確N-of-1 trials方案的內容設計,提高研究方案的完整性和透明度。本文將結合具體實例對SPENT 2019清單的14個主要擴展子條目進行詳細解讀,以期進一步規范國內N-of-1 trials研究的發表。
引用本文: 李艷飛, 儲夏靜, 盧存存, 韓嘉妮, 鄭忠禮, 李秀霞, 楊克虎. 單病例隨機對照試驗方案清單(SPENT 2019)解讀. 中國循證醫學雜志, 2022, 22(4): 475-482. doi: 10.7507/1672-2531.202112091 復制
隨著循證醫學理念的深入,如何獲取高質量的原始研究證據變得尤為重要[1]。隨機對照試驗(randomized controlled trial,RCT)作為重要的原始研究設計,因其設計內部固有的科學研究特性,被認為是明確臨床干預措施效果的首選方法,是評價臨床研究中因果關系的“金標準”[2]。單病例RCT(N-of-1 trials)是一種基于單個患者所設計的多輪試驗期交替的前瞻性臨床隨機交叉對照試驗,在傳統的RCT并非總是可行或適合的情況下,可為包括罕見病、合并癥或同時接受兩種及以上干預患者在內的研究提供高級別證據。同時,當個體之間干預效果的異質性較大時,N-of-1 trials能提高個體試驗結果的準確性,從而確保研究結果的可靠性,也符合目前醫學領域所強調的“個體化”醫學的特征[3-4]。一般情況下,研究者會同時開展多個N-of-1 trials,這些試驗采用相同的試驗方案,稱為系列N-of-1 trials[4]。針對N-of-1 trials研究質量不佳的情況[2-3],相關學者制訂發布了N-of-1 trials的報告規范(CENT 2015)[5]。近期,中醫藥領域的學者制訂發布了中醫藥N-of-1 trials的報告規范(CENT for TCM)[6],對進一步提升我國N-of-1 trials報告質量,改善N-of-1 trials在中醫藥研究方面的應用發揮了重要的作用。
加拿大McMaster大學Gordon Guyatt教授指出,在最新的醫學證據金字塔中,N-of-1 trials可作為最高級別的臨床研究證據。然而,當某些N-of-1 trials存在研究缺陷或不足時,研究者需要考慮降低其證據級別[7-8]。臨床試驗方案是開展、實施、報告和評價一個臨床研究的基礎,其設計是否規范一定程度上會影響臨床試驗的質量[9-10]。為規范臨床試驗方案的設計和報告,相關學者制訂并于2013年發布了臨床試驗方案規范指南(SPIRIT 2013)[11]。國內學者亦制訂并于2019年發布了中醫藥臨床試驗方案規范指南(SPIRIT-TCM Extension 2018)[12]。目前,已由多篇N-of-1 trials方案被公開發表,但在方法學報告,尤其是隨機化和盲法方面質量尚存不足,而SPIRIT 2013聲明并不完全適用于N-of-1 trials方案的報告[9],鑒于此,由多位學者組成的國際團隊基于CENT 2015和SPIRIT 2013研制出N-of-1 trials方案規范清單(SPENT 2019),并在BMJ上發表[9],旨在明確N-of-1 trials方案的內容設計,提高研究方案報告的完整性和透明度。目前,CENT 2015和SPIRIT 2013均已被國內學者詳細介紹[10,13],極大促進了我國相關研究的透明、規范化開展,而SPENT 2019清單尚缺乏國內研究者解讀,因此,本文將結合具體實例對SPENT 2019清單[9]的14個主要擴展子條目進行詳細解讀,以期進一步規范國內N-of-1 trials研究。
1 SPENT 2019制訂過程
SPENT 2019是在對此前所有N-of-1 trials方案報告的推薦意見進行系統評價基礎上,與SPIRIT 2013和CENT 2015條目相對比,由來自澳大利亞、加拿大、中國和美國等9個國家的53名專家經3輪德爾菲法形成初始條目[9]。每輪德爾菲法均由小組成員以8分制的評價標準(斷然拒絕、很可能拒絕、可能拒絕、無法決定、可能保留、很可能保留、必須保留、沒有判斷)對各個初始條目進行打分,并提出相關討論意見和新的條目。3輪結束后,中位數得分為6分或以上的條目被保留,得分2分或更少的條目則被排除。隨后,工作組通過兩次討論會議確定共識條目,并根據德爾菲法的意見對條目進行完善。最后,由工作組完成草案撰寫,經全體成員校訂后定稿[9]。
2 SPENT 2019條目解讀與實例
SPENT 2019清單包括5大部分,33個條目,共計53個子條目(表1),其中14個子條目為擴展條目(1b為新增子條目,原有子條目20a擴展為20a1和20a2)。此外,參考CONSORT 2010聲明[14],研究團隊制訂了專門的N-of-1 trials方案摘要清單(表2)。本文將結合實例對14個擴展的子條目進行解讀。


2.1 標題
2.1.1 條目1a
增加:體現“(系列)單病例隨機對照試驗”和“方案”。
解釋與實例:規范報告的論文標題有利于該研究被有效標引和快速識別,因此,條目1a建議的研究者應該在標題中體現“(系列)單病例隨機試驗”和“方案”等能表明研究設計的詞,從而有利于該研究的標引與識別。該條目的應用實例可參考Fielenbach等[15]和Kaplan等[16]的文章。
2.1.2 條目1b
新增:結構式摘要。
解釋與實例:摘要作為研究論文的重要部分,是讀者快速獲取研究發現的重要途徑,也是決定讀者是否進一步閱讀研究全文的判斷依據。除此之外,考慮到非開放獲取期刊的限制,摘要也可能是讀者獲取研究結果的唯一途徑。與傳統摘要相比,結構式摘要具有內容完整、信息量大和一目了然等特點,目前已被各學科雜志所接受。條目1b作為新增子條目,對摘要部分的撰寫規范進行了單獨論述。建議采用結構式摘要對方案進行總結性描述,應該包括標題、背景與基本原理、目的、方法、討論和試驗注冊等內容,見表2。該條目的應用實例可參考Stunnenberg等的研究[17],在該研究方案中,作者采用結構式摘要,介紹了研究背景和目的、研究方法和設計、研究意義及研究注冊情況等內容。
2.2 研究背景和原理
2.2.1 條目6a
增加:開展單病例隨機對照試驗的原由。
解釋與實例:研究背景部分主要通過回顧相關領域的已有文獻,展示該研究的現狀及存在的問題,進而論述開展該研究的原因及其必要性等,以突出開展該項研究對該研究領域的重要性。對于N-of-1 trials方案,條目6a建議為增強讀者對N-of-1 trials的理解,方案背景部分需描述試驗的基本原理及開展N-of-1 trials的原由。該條目的應用實例可參考Alemayehu等的研究[18],該研究背景部分詳細介紹了埃塞俄比亞高血壓的流行病學,通過系統回顧已發表文獻說明了目前埃塞俄比亞地區藥物治療高血壓的現狀,亦對開展此研究的原因和試驗的基本原理進行了詳細報告,向讀者闡述了研究開展的必要性和合理性。這些做法值得未來的研究者借鑒參考。同時,該清單建議研究者撰寫文獻回顧部分時最好總結和引用最新的系統評價結果。
2.3 試驗設計
2.3.1 條目8
試驗類型修改為:單病例或系列單病例隨機對照試驗;增加:系列單病例隨機對照試驗還需說明針對每位受試者的試驗設計。
解釋與實例:詳盡地描述干預措施有利于干預措施的實施,同時可作為相關人員評價和應用干預措施的依據。一般而言,干預措施應該在文章的方法部分進行詳細報告,同時,在背景部分也應予以體現,確保讀者可對該研究有較深的理解。條目8建議試驗設計相關內容應該在研究背景中盡早地報告,以為后續方法學部分提供依據。通常情況下,N-of-1 trials是基于單個受試者所設計,因此在系列N-of-1 trials中,應針對每位受試者量身定制,例如,適當調整干預的周期、劑量、交叉次數等關鍵要素,并報告該研究設計是否適合每位受試者。該條目的應用實例可參考Senior等的研究[19],研究詳細說明了中樞神經系統刺激的干預實施方案,同時對納入的42例創傷性腦損傷患兒的干預框架進行了完整報告。
2.4 納入標準
2.4.1 條目10
增加:診斷結果、診斷標準、基礎疾病及并行治療措施。系列單病例隨機對照試驗:無變化。
解釋與實例:納入、排除標準是評價試驗樣本能否代表總體的關鍵內容,是關乎受試者是否能夠入組的決定性因素,也是試驗結果進行推廣的重要參考。此外,研究單位或個人的專業資質水平是評價該項研究能否實施和完成的重要依據。條目10建議N-of-1 trials一般不用專門報告納入、排除標準,但需要描述特定受試者的基線信息,包括診斷標準、基礎疾病及并行治療措施等,并在適當的情況下,可說明研究單位或個人的專業資質水平,而系列N-of-1 trials則需專門報告納入、排除標準。該條目的應用實例可參考Clanchy等研究[20],作者詳細報告了6例慢性頸椎扭傷成人患者的納入與排除標準,包括疾病診斷、病史、治療史和康復經歷等。
2.5 干預措施
2.5.1 條目11a
修改為:各試驗輪次的詳細干預措施(時點及其方法)、計劃的試驗輪次數量和交叉數量、各試驗輪次的時長(可包括導入期和洗脫期)。系列單病例隨機對照試驗還需說明:針對每位受試者的試驗設計。
解釋與實例:研究方案中對干預進行詳細報告有利于方案實施,是試驗按照初始計劃順利進行的保障,也是相關研究人員評價研究結果的真實性和進行臨床引用的依據。條目11a建議N-of-1 trials方案應詳細描述每個試驗期干預的具體情況,包括試驗期數量和持續周期,以及導入期和洗脫期的具體信息等。導入期可幫助記錄受試者的基線狀態,確定耐受性,評估依從性,及判斷是否需要變動不合理的試驗干預措施。而洗脫期則盡可能地讓每位受試者在接受下一輪干預時回歸基線狀態。此外,系列N-of-1 trials方案還應說明研究設計是否對每位受試者都適用。該條目的應用實例可參考Clanchy等的研究[20],在該研究中,研究者詳細說明了每個參與者在試驗中的基線、干預期、隨訪期的時長,同時,研究者亦說明了干預措施在各試驗輪次的干預次數、干預時長、預期結果、失訪和不良反應的處理方法。
2.6 樣本量
2.6.1 條目14
增加:預計的試驗輪次和測量次數,或每個試驗輪次所需的觀察次數。系列單病例隨機對照試驗還需說明:預計的受試者數量。
解釋與實例:通常情況下,臨床RCT應基于研究假設和研究目的計算開展該項研究所需的受試者數量,可通過參考已發表的相關研究或開展預試驗確定,合適樣本量是避免研究出現“假陽性”或“假陰性”結果的重要保障,但N-of-1 trials作為一種特殊的交叉隨機試驗,其樣本量為“1”,因此條目14建議N-of-1 trials中,需明確試驗的輪次及每個試驗期中觀察的次數,而在系列N-of-1 trials中,應事先估算為實現研究目標所需受試者的數量及其理由。該條目的應用實例可參考Gimeno等的研究[21],在該研究中,作者用時間線圖可視化展示各階段的試驗方案,介紹了樣本量設置的方法及其合理性,并對每位受試者的試驗輪次、樣本量的大小及其合理性進行了單獨的詳細報告。
2.7 招募研究對象
2.7.1 條目15
僅針對系列單病例隨機對照試驗:招募受試者的方法。
解釋與實例:條目15專為系列N-of-1 trials所設計。臨床試驗應該按照研究所需的樣本量完成合格受試者的招募,其中采用合理的招募方法至關重要。條目15建議對于系列N-of-1 trials的方案,需要報告招募到足夠受試者的方法。該條目的應用實例可參考Nikles等的研究[22],該研究報告將通過向專業機構網站和簡報中投放廣告的方式進行受試者招募。
2.8 分配序列產生
2.8.1 條目16a
修改為:分配序列的產生方法(如計算機隨機、平衡法),避免受試者招募人員、干預措施分配人員知曉分配序列。系列單病例隨機對照試驗還需說明:分層因素。
解釋與實例:基于可靠的方法產生隨機分配序列是隨機化成功的重要保障之一,好的分配序列應該具有不可預測性,而“隨機”可通過平衡已知和未知的潛在影響因素,確保研究結果的可靠性。條目16a建議無論采用何種方法產生分配序列,都應該描述設置干預序列的影響因素和基本原理。此外還應詳細報告潛在的、各個試驗期之間的、可能的影響(如逐步惡化或改善)。該條目的應用實例可參考Simons等的研究[23],該研究報告運用在線隨機數生成器產生隨機序列,詳細報告了隨機化的程序,包括試驗前、中、后的隨機化,同時,研究報告了各個試驗期之間可能產生的影響及減少兩個試驗期之間不平衡性的措施。
2.9 統計方法
2.9.1 條目20a1
修改為:每位受試者的主要和次要結局指標的統計方法。如試驗方案中未提及,需說明從何處獲取。系列單病例隨機對照試驗還需說明:計劃的定量合并單個病例試驗數據的方法和受試者間異質性的評估方法。
解釋與實例:條目20a1由SPIRIT 2013的條目20a擴展而來,增加了系列N-of-1 trials的部分。預先設定研究數據的統計分析及呈現方法,一定程度上可減少因數據不理想所導致的選擇性報告或“結果操縱”。該條目建議無論是采用可視化還是Meta分析方法等,都應在試驗方案中予以報告。此外,對于系列N-of-1 trials方案,如有必要,還應該報告如何合并不同的試驗結果及處理異質性、數據轉換等采用的統計模型與方法。該條目的應用實例可參考Herrett等的研究[24],研究對主要、次要結局指標的統計分析方法做了詳細報告,主要包括回歸模型分析、二次分析和敏感性分析等。
2.9.2 條目20a2
新增:重復測量和交叉設計引起的沾染、輪次和序列效應。
解釋與實例:N-of-1 trials是一種特殊的交叉隨機試驗,因此,常涉及同一受試者隨時間實施多次干預與重復測量,這將導致突出的自相關問題,若這種情況下假設數據具有獨立性,將可能導致嚴重的結果偏倚,甚至得出錯誤結論。因此,條目20a2建議在研究方案中詳細描述分析相關性或清除周期效應的內容,特別是對于合并數據或Meta分析。該條目的應用實例可參考Herrett等的研究[24],研究對受試者干預的獨立性分析進行了詳細報告,如通過建模分析方法驗證各個研究數據之間的自相關性。
2.9.3 條目20b
僅針對系列單病例隨機對照試驗:附加分析的統計方法(如亞組分析和校正分析)。
解釋與實例:條目20b專為系列N-of-1 trials所設計。該條目建議系列N-of-1 trials方案中應報告可能采取的附加分析的統計方法,例如亞組分析和校正分析。亞組分析可通過比較亞組人群間干預效果的一致性程度,從而幫助判斷研究結果的異質性。此外,應報告分析具有高度偏倚結果的探索性分析方法。該條目的應用實例可參考Herrett等研究[24],研究對于附加分析的統計方法進行了詳細報告,擬定了探索性的計劃,“如果檢測到人群特征對試驗結果有顯著影響,將進行亞組分析”。
2.9.4 條目20c
修改為:處理缺失數據的統計方法(如:填補)。系列單病例隨機對照試驗還需說明:違背試驗方案者的相關分析(如:意向性分析)。
解釋與實例:是否正確合理地處理臨床試驗中的缺失數據關乎試驗結果的科學性和可靠性。因直接排除缺失數據和不正確的數據處理方法都會導致研究的實際樣本數據與期望的樣本數據不一致,從而導致研究結果發生偏倚甚至得出錯誤的結論。因此,條目20c建議研究方案中應包括缺失數據的處理方法,如填補法和建模法等。此外,系列N-of-1 trials方案中還應描述違背試驗方案者(退出、失訪或未完成完整的試驗方案者)的相關分析(例如,意向性分析)。該條目的應用實例可參考Punja等的研究[25],研究詳細報告了基于不同數據缺失機制開發的缺失數據處理方法,如多重填補法等。
2.10 結果的發布
2.10.1 條目31a
增加:研究者向每位受試者反饋各自試驗結果的方法。
解釋與實例:臨床試驗的受試者承擔著參與試驗的風險,而臨床試驗的結果可能會對醫學研究的進步和臨床實踐服務水平的提高做出巨大貢獻,因此臨床試驗相關人員,特別是受試者有權利知道試驗的結果,同時臨床試驗的研究人員也有義務向他們反饋臨床試驗結果。條目31a建議研究方案中報告試驗結果的傳播方法與涉及人群及傳播的限制等信息。該條目的應用實例可參考Punja等的研究[25],該研究報告了數據的管理方案,對于每一個受試者的試驗數據將通過傳真分享給其他人員,例如受試者的醫生等。此外,該研究報告了在試驗結束后,會形成一份試驗報告,報告的摘要和大綱會分享給每一位受試者。
3 小結
N-of-1 trials作為一種特殊的隨機交叉試驗,在充分利用傳統RCT方法學的基礎上,很好地解決了不同患者間異質性可能導致的試驗結果出現偏倚的問題,對于推動“個體化”醫療的發展具有重要價值。此外,N-of-1 trials能適用于小規模試驗,亦可為包括罕見病、合并癥或同時接受兩種及以上干預的患者在內的干預性研究提供高級別證據,對于一些欠發達地區來說,由于N-of-1 trials能夠以較少的樣本量解決一些迫切的研究問題,亦將使臨床試驗更加經濟可行[18],因其臨床價值與經濟可行的優勢,N-of-1 trials將有機會成為一種主流的研究類型。目前,N-of-1 trials被廣泛應用于各類臨床疾病,如神經系統疾病、呼吸系統疾病、循環系統疾病和消化系統疾病等。然而N-of-1 trials也有一定的局限性,即這種試驗設計并不適用于所有的健康狀況和干預措施,并且需要受試者在每個試驗輪次保持相對穩定的癥狀以及完全、徹底的洗脫期管理。只有方法學嚴謹和報告清晰明確的醫學研究才會真正對臨床實踐產生促進作用,因此,確保N-of-1 trials按照規范的方法學指南設計與報告顯得尤為重要。臨床試驗質量高低的影響因素眾多,而方案設計是否合理,報告是否規范便是其中重要的因素之一,而N-of-1 trials方案的設計與報告將會極大影響方案的審核、試驗的實施和評估及試驗結果的最終報告[9]。近期BMJ雜志發表了N-of-1 trials方案清單(SPENT 2019),該清單描述了設計和實施N-of-1 trials所需的關鍵要素,并對報告做了詳細的描述[9]。考慮到該清單的重要價值和國內臨床研究人員的需求,本研究對其主要擴展條目內容進行了翔實解讀,并輔以具體參考實例,以供國內相關研究人員參考借鑒。建議國內醫學期刊將該清單引入稿約,希望國內的研究人員、期刊編輯、審稿專家等相關利益團體共同致力于產生高質量的N-of-1 trials證據,不斷提高臨床研究質量,最終使目標患者真正獲益。
隨著循證醫學理念的深入,如何獲取高質量的原始研究證據變得尤為重要[1]。隨機對照試驗(randomized controlled trial,RCT)作為重要的原始研究設計,因其設計內部固有的科學研究特性,被認為是明確臨床干預措施效果的首選方法,是評價臨床研究中因果關系的“金標準”[2]。單病例RCT(N-of-1 trials)是一種基于單個患者所設計的多輪試驗期交替的前瞻性臨床隨機交叉對照試驗,在傳統的RCT并非總是可行或適合的情況下,可為包括罕見病、合并癥或同時接受兩種及以上干預患者在內的研究提供高級別證據。同時,當個體之間干預效果的異質性較大時,N-of-1 trials能提高個體試驗結果的準確性,從而確保研究結果的可靠性,也符合目前醫學領域所強調的“個體化”醫學的特征[3-4]。一般情況下,研究者會同時開展多個N-of-1 trials,這些試驗采用相同的試驗方案,稱為系列N-of-1 trials[4]。針對N-of-1 trials研究質量不佳的情況[2-3],相關學者制訂發布了N-of-1 trials的報告規范(CENT 2015)[5]。近期,中醫藥領域的學者制訂發布了中醫藥N-of-1 trials的報告規范(CENT for TCM)[6],對進一步提升我國N-of-1 trials報告質量,改善N-of-1 trials在中醫藥研究方面的應用發揮了重要的作用。
加拿大McMaster大學Gordon Guyatt教授指出,在最新的醫學證據金字塔中,N-of-1 trials可作為最高級別的臨床研究證據。然而,當某些N-of-1 trials存在研究缺陷或不足時,研究者需要考慮降低其證據級別[7-8]。臨床試驗方案是開展、實施、報告和評價一個臨床研究的基礎,其設計是否規范一定程度上會影響臨床試驗的質量[9-10]。為規范臨床試驗方案的設計和報告,相關學者制訂并于2013年發布了臨床試驗方案規范指南(SPIRIT 2013)[11]。國內學者亦制訂并于2019年發布了中醫藥臨床試驗方案規范指南(SPIRIT-TCM Extension 2018)[12]。目前,已由多篇N-of-1 trials方案被公開發表,但在方法學報告,尤其是隨機化和盲法方面質量尚存不足,而SPIRIT 2013聲明并不完全適用于N-of-1 trials方案的報告[9],鑒于此,由多位學者組成的國際團隊基于CENT 2015和SPIRIT 2013研制出N-of-1 trials方案規范清單(SPENT 2019),并在BMJ上發表[9],旨在明確N-of-1 trials方案的內容設計,提高研究方案報告的完整性和透明度。目前,CENT 2015和SPIRIT 2013均已被國內學者詳細介紹[10,13],極大促進了我國相關研究的透明、規范化開展,而SPENT 2019清單尚缺乏國內研究者解讀,因此,本文將結合具體實例對SPENT 2019清單[9]的14個主要擴展子條目進行詳細解讀,以期進一步規范國內N-of-1 trials研究。
1 SPENT 2019制訂過程
SPENT 2019是在對此前所有N-of-1 trials方案報告的推薦意見進行系統評價基礎上,與SPIRIT 2013和CENT 2015條目相對比,由來自澳大利亞、加拿大、中國和美國等9個國家的53名專家經3輪德爾菲法形成初始條目[9]。每輪德爾菲法均由小組成員以8分制的評價標準(斷然拒絕、很可能拒絕、可能拒絕、無法決定、可能保留、很可能保留、必須保留、沒有判斷)對各個初始條目進行打分,并提出相關討論意見和新的條目。3輪結束后,中位數得分為6分或以上的條目被保留,得分2分或更少的條目則被排除。隨后,工作組通過兩次討論會議確定共識條目,并根據德爾菲法的意見對條目進行完善。最后,由工作組完成草案撰寫,經全體成員校訂后定稿[9]。
2 SPENT 2019條目解讀與實例
SPENT 2019清單包括5大部分,33個條目,共計53個子條目(表1),其中14個子條目為擴展條目(1b為新增子條目,原有子條目20a擴展為20a1和20a2)。此外,參考CONSORT 2010聲明[14],研究團隊制訂了專門的N-of-1 trials方案摘要清單(表2)。本文將結合實例對14個擴展的子條目進行解讀。


2.1 標題
2.1.1 條目1a
增加:體現“(系列)單病例隨機對照試驗”和“方案”。
解釋與實例:規范報告的論文標題有利于該研究被有效標引和快速識別,因此,條目1a建議的研究者應該在標題中體現“(系列)單病例隨機試驗”和“方案”等能表明研究設計的詞,從而有利于該研究的標引與識別。該條目的應用實例可參考Fielenbach等[15]和Kaplan等[16]的文章。
2.1.2 條目1b
新增:結構式摘要。
解釋與實例:摘要作為研究論文的重要部分,是讀者快速獲取研究發現的重要途徑,也是決定讀者是否進一步閱讀研究全文的判斷依據。除此之外,考慮到非開放獲取期刊的限制,摘要也可能是讀者獲取研究結果的唯一途徑。與傳統摘要相比,結構式摘要具有內容完整、信息量大和一目了然等特點,目前已被各學科雜志所接受。條目1b作為新增子條目,對摘要部分的撰寫規范進行了單獨論述。建議采用結構式摘要對方案進行總結性描述,應該包括標題、背景與基本原理、目的、方法、討論和試驗注冊等內容,見表2。該條目的應用實例可參考Stunnenberg等的研究[17],在該研究方案中,作者采用結構式摘要,介紹了研究背景和目的、研究方法和設計、研究意義及研究注冊情況等內容。
2.2 研究背景和原理
2.2.1 條目6a
增加:開展單病例隨機對照試驗的原由。
解釋與實例:研究背景部分主要通過回顧相關領域的已有文獻,展示該研究的現狀及存在的問題,進而論述開展該研究的原因及其必要性等,以突出開展該項研究對該研究領域的重要性。對于N-of-1 trials方案,條目6a建議為增強讀者對N-of-1 trials的理解,方案背景部分需描述試驗的基本原理及開展N-of-1 trials的原由。該條目的應用實例可參考Alemayehu等的研究[18],該研究背景部分詳細介紹了埃塞俄比亞高血壓的流行病學,通過系統回顧已發表文獻說明了目前埃塞俄比亞地區藥物治療高血壓的現狀,亦對開展此研究的原因和試驗的基本原理進行了詳細報告,向讀者闡述了研究開展的必要性和合理性。這些做法值得未來的研究者借鑒參考。同時,該清單建議研究者撰寫文獻回顧部分時最好總結和引用最新的系統評價結果。
2.3 試驗設計
2.3.1 條目8
試驗類型修改為:單病例或系列單病例隨機對照試驗;增加:系列單病例隨機對照試驗還需說明針對每位受試者的試驗設計。
解釋與實例:詳盡地描述干預措施有利于干預措施的實施,同時可作為相關人員評價和應用干預措施的依據。一般而言,干預措施應該在文章的方法部分進行詳細報告,同時,在背景部分也應予以體現,確保讀者可對該研究有較深的理解。條目8建議試驗設計相關內容應該在研究背景中盡早地報告,以為后續方法學部分提供依據。通常情況下,N-of-1 trials是基于單個受試者所設計,因此在系列N-of-1 trials中,應針對每位受試者量身定制,例如,適當調整干預的周期、劑量、交叉次數等關鍵要素,并報告該研究設計是否適合每位受試者。該條目的應用實例可參考Senior等的研究[19],研究詳細說明了中樞神經系統刺激的干預實施方案,同時對納入的42例創傷性腦損傷患兒的干預框架進行了完整報告。
2.4 納入標準
2.4.1 條目10
增加:診斷結果、診斷標準、基礎疾病及并行治療措施。系列單病例隨機對照試驗:無變化。
解釋與實例:納入、排除標準是評價試驗樣本能否代表總體的關鍵內容,是關乎受試者是否能夠入組的決定性因素,也是試驗結果進行推廣的重要參考。此外,研究單位或個人的專業資質水平是評價該項研究能否實施和完成的重要依據。條目10建議N-of-1 trials一般不用專門報告納入、排除標準,但需要描述特定受試者的基線信息,包括診斷標準、基礎疾病及并行治療措施等,并在適當的情況下,可說明研究單位或個人的專業資質水平,而系列N-of-1 trials則需專門報告納入、排除標準。該條目的應用實例可參考Clanchy等研究[20],作者詳細報告了6例慢性頸椎扭傷成人患者的納入與排除標準,包括疾病診斷、病史、治療史和康復經歷等。
2.5 干預措施
2.5.1 條目11a
修改為:各試驗輪次的詳細干預措施(時點及其方法)、計劃的試驗輪次數量和交叉數量、各試驗輪次的時長(可包括導入期和洗脫期)。系列單病例隨機對照試驗還需說明:針對每位受試者的試驗設計。
解釋與實例:研究方案中對干預進行詳細報告有利于方案實施,是試驗按照初始計劃順利進行的保障,也是相關研究人員評價研究結果的真實性和進行臨床引用的依據。條目11a建議N-of-1 trials方案應詳細描述每個試驗期干預的具體情況,包括試驗期數量和持續周期,以及導入期和洗脫期的具體信息等。導入期可幫助記錄受試者的基線狀態,確定耐受性,評估依從性,及判斷是否需要變動不合理的試驗干預措施。而洗脫期則盡可能地讓每位受試者在接受下一輪干預時回歸基線狀態。此外,系列N-of-1 trials方案還應說明研究設計是否對每位受試者都適用。該條目的應用實例可參考Clanchy等的研究[20],在該研究中,研究者詳細說明了每個參與者在試驗中的基線、干預期、隨訪期的時長,同時,研究者亦說明了干預措施在各試驗輪次的干預次數、干預時長、預期結果、失訪和不良反應的處理方法。
2.6 樣本量
2.6.1 條目14
增加:預計的試驗輪次和測量次數,或每個試驗輪次所需的觀察次數。系列單病例隨機對照試驗還需說明:預計的受試者數量。
解釋與實例:通常情況下,臨床RCT應基于研究假設和研究目的計算開展該項研究所需的受試者數量,可通過參考已發表的相關研究或開展預試驗確定,合適樣本量是避免研究出現“假陽性”或“假陰性”結果的重要保障,但N-of-1 trials作為一種特殊的交叉隨機試驗,其樣本量為“1”,因此條目14建議N-of-1 trials中,需明確試驗的輪次及每個試驗期中觀察的次數,而在系列N-of-1 trials中,應事先估算為實現研究目標所需受試者的數量及其理由。該條目的應用實例可參考Gimeno等的研究[21],在該研究中,作者用時間線圖可視化展示各階段的試驗方案,介紹了樣本量設置的方法及其合理性,并對每位受試者的試驗輪次、樣本量的大小及其合理性進行了單獨的詳細報告。
2.7 招募研究對象
2.7.1 條目15
僅針對系列單病例隨機對照試驗:招募受試者的方法。
解釋與實例:條目15專為系列N-of-1 trials所設計。臨床試驗應該按照研究所需的樣本量完成合格受試者的招募,其中采用合理的招募方法至關重要。條目15建議對于系列N-of-1 trials的方案,需要報告招募到足夠受試者的方法。該條目的應用實例可參考Nikles等的研究[22],該研究報告將通過向專業機構網站和簡報中投放廣告的方式進行受試者招募。
2.8 分配序列產生
2.8.1 條目16a
修改為:分配序列的產生方法(如計算機隨機、平衡法),避免受試者招募人員、干預措施分配人員知曉分配序列。系列單病例隨機對照試驗還需說明:分層因素。
解釋與實例:基于可靠的方法產生隨機分配序列是隨機化成功的重要保障之一,好的分配序列應該具有不可預測性,而“隨機”可通過平衡已知和未知的潛在影響因素,確保研究結果的可靠性。條目16a建議無論采用何種方法產生分配序列,都應該描述設置干預序列的影響因素和基本原理。此外還應詳細報告潛在的、各個試驗期之間的、可能的影響(如逐步惡化或改善)。該條目的應用實例可參考Simons等的研究[23],該研究報告運用在線隨機數生成器產生隨機序列,詳細報告了隨機化的程序,包括試驗前、中、后的隨機化,同時,研究報告了各個試驗期之間可能產生的影響及減少兩個試驗期之間不平衡性的措施。
2.9 統計方法
2.9.1 條目20a1
修改為:每位受試者的主要和次要結局指標的統計方法。如試驗方案中未提及,需說明從何處獲取。系列單病例隨機對照試驗還需說明:計劃的定量合并單個病例試驗數據的方法和受試者間異質性的評估方法。
解釋與實例:條目20a1由SPIRIT 2013的條目20a擴展而來,增加了系列N-of-1 trials的部分。預先設定研究數據的統計分析及呈現方法,一定程度上可減少因數據不理想所導致的選擇性報告或“結果操縱”。該條目建議無論是采用可視化還是Meta分析方法等,都應在試驗方案中予以報告。此外,對于系列N-of-1 trials方案,如有必要,還應該報告如何合并不同的試驗結果及處理異質性、數據轉換等采用的統計模型與方法。該條目的應用實例可參考Herrett等的研究[24],研究對主要、次要結局指標的統計分析方法做了詳細報告,主要包括回歸模型分析、二次分析和敏感性分析等。
2.9.2 條目20a2
新增:重復測量和交叉設計引起的沾染、輪次和序列效應。
解釋與實例:N-of-1 trials是一種特殊的交叉隨機試驗,因此,常涉及同一受試者隨時間實施多次干預與重復測量,這將導致突出的自相關問題,若這種情況下假設數據具有獨立性,將可能導致嚴重的結果偏倚,甚至得出錯誤結論。因此,條目20a2建議在研究方案中詳細描述分析相關性或清除周期效應的內容,特別是對于合并數據或Meta分析。該條目的應用實例可參考Herrett等的研究[24],研究對受試者干預的獨立性分析進行了詳細報告,如通過建模分析方法驗證各個研究數據之間的自相關性。
2.9.3 條目20b
僅針對系列單病例隨機對照試驗:附加分析的統計方法(如亞組分析和校正分析)。
解釋與實例:條目20b專為系列N-of-1 trials所設計。該條目建議系列N-of-1 trials方案中應報告可能采取的附加分析的統計方法,例如亞組分析和校正分析。亞組分析可通過比較亞組人群間干預效果的一致性程度,從而幫助判斷研究結果的異質性。此外,應報告分析具有高度偏倚結果的探索性分析方法。該條目的應用實例可參考Herrett等研究[24],研究對于附加分析的統計方法進行了詳細報告,擬定了探索性的計劃,“如果檢測到人群特征對試驗結果有顯著影響,將進行亞組分析”。
2.9.4 條目20c
修改為:處理缺失數據的統計方法(如:填補)。系列單病例隨機對照試驗還需說明:違背試驗方案者的相關分析(如:意向性分析)。
解釋與實例:是否正確合理地處理臨床試驗中的缺失數據關乎試驗結果的科學性和可靠性。因直接排除缺失數據和不正確的數據處理方法都會導致研究的實際樣本數據與期望的樣本數據不一致,從而導致研究結果發生偏倚甚至得出錯誤的結論。因此,條目20c建議研究方案中應包括缺失數據的處理方法,如填補法和建模法等。此外,系列N-of-1 trials方案中還應描述違背試驗方案者(退出、失訪或未完成完整的試驗方案者)的相關分析(例如,意向性分析)。該條目的應用實例可參考Punja等的研究[25],研究詳細報告了基于不同數據缺失機制開發的缺失數據處理方法,如多重填補法等。
2.10 結果的發布
2.10.1 條目31a
增加:研究者向每位受試者反饋各自試驗結果的方法。
解釋與實例:臨床試驗的受試者承擔著參與試驗的風險,而臨床試驗的結果可能會對醫學研究的進步和臨床實踐服務水平的提高做出巨大貢獻,因此臨床試驗相關人員,特別是受試者有權利知道試驗的結果,同時臨床試驗的研究人員也有義務向他們反饋臨床試驗結果。條目31a建議研究方案中報告試驗結果的傳播方法與涉及人群及傳播的限制等信息。該條目的應用實例可參考Punja等的研究[25],該研究報告了數據的管理方案,對于每一個受試者的試驗數據將通過傳真分享給其他人員,例如受試者的醫生等。此外,該研究報告了在試驗結束后,會形成一份試驗報告,報告的摘要和大綱會分享給每一位受試者。
3 小結
N-of-1 trials作為一種特殊的隨機交叉試驗,在充分利用傳統RCT方法學的基礎上,很好地解決了不同患者間異質性可能導致的試驗結果出現偏倚的問題,對于推動“個體化”醫療的發展具有重要價值。此外,N-of-1 trials能適用于小規模試驗,亦可為包括罕見病、合并癥或同時接受兩種及以上干預的患者在內的干預性研究提供高級別證據,對于一些欠發達地區來說,由于N-of-1 trials能夠以較少的樣本量解決一些迫切的研究問題,亦將使臨床試驗更加經濟可行[18],因其臨床價值與經濟可行的優勢,N-of-1 trials將有機會成為一種主流的研究類型。目前,N-of-1 trials被廣泛應用于各類臨床疾病,如神經系統疾病、呼吸系統疾病、循環系統疾病和消化系統疾病等。然而N-of-1 trials也有一定的局限性,即這種試驗設計并不適用于所有的健康狀況和干預措施,并且需要受試者在每個試驗輪次保持相對穩定的癥狀以及完全、徹底的洗脫期管理。只有方法學嚴謹和報告清晰明確的醫學研究才會真正對臨床實踐產生促進作用,因此,確保N-of-1 trials按照規范的方法學指南設計與報告顯得尤為重要。臨床試驗質量高低的影響因素眾多,而方案設計是否合理,報告是否規范便是其中重要的因素之一,而N-of-1 trials方案的設計與報告將會極大影響方案的審核、試驗的實施和評估及試驗結果的最終報告[9]。近期BMJ雜志發表了N-of-1 trials方案清單(SPENT 2019),該清單描述了設計和實施N-of-1 trials所需的關鍵要素,并對報告做了詳細的描述[9]。考慮到該清單的重要價值和國內臨床研究人員的需求,本研究對其主要擴展條目內容進行了翔實解讀,并輔以具體參考實例,以供國內相關研究人員參考借鑒。建議國內醫學期刊將該清單引入稿約,希望國內的研究人員、期刊編輯、審稿專家等相關利益團體共同致力于產生高質量的N-of-1 trials證據,不斷提高臨床研究質量,最終使目標患者真正獲益。