臨床試驗報告規范 CONSORT(Consolidated Standards of Reporting Trials,CONSORT)聲明旨在提高隨機對照試驗(randomized controlled trail,RCT)的報告質量,然而該聲明卻缺少專門關于患者報告結局(patient-reported outcomes,PROs)的指引,而這部分內容恰恰也是臨床試驗經常報告不足的內容。患者報告結局指標數據的缺失影響了臨床試驗結果的價值。本文報告了依據“提高醫療衛生研究的質量和透明度協作網”(EQUATOR Network)所提出的報告規范研發方法學框架制定的臨床試驗報告規范—CONSORT 患者報告結局擴展版(CONSORT PROs)。最終推薦 5 個 CONSORT 患者報告結局清單條目,用于以患者報告結局為主要或關鍵的次要結局指標的隨機對照試驗。這些推薦條目強烈要求:① 在摘要中需明確說明將患者報告結局作為主要或次要結局指標;② 提供針對患者報告結局指標及其相關適用范疇的假設(如是否使用了多維度患者報告結局指標的檢測工具);③ 提供或引用患者報告結局測量工具效度和信度的證據;④ 明確說明處理缺失數據的統計學方法;⑤ 討論以患者報告結局指標為研究結果指標的特定局限性和結果對其他人群和臨床實踐的影響。本文還提供了相關條目的示例和附有患者報告結局的 CONSORT 流程圖。建議在報告以患者報告結局作為主要結局指標或關鍵的次要結局指標時,以 CONSORT 患者報告結局擴展版與原版的 CONSORT 報告規范相互參考進行報告。改進后的患者報告結局試驗數據將大大促進對隨機對照試驗結果的全面解釋,并較好指導患者的治療。
引用本文: 陳澤, 陳玨璇, 段玉婷, 張弛, 陳耀龍, 卞兆祥, 譯. 隨機對照試驗中的患者報告結局:CONSORT PRO 擴展版. 中國循證醫學雜志, 2021, 21(3): 347-354. doi: 10.7507/1672-2531.202008183 復制
臨床試驗報告規范 CONSORT(Consolidated Standards of Reporting Trials,CONSORT)聲明首次發表于 1996 年,于 2010 年完成最近一次修訂[1, 2],這份聲明提供了基于證據的、用以提高隨機對照試驗(randomized control trail,RCT)報告完整性的推薦意見。該聲明著重于平行對照試驗,但隨后的一系列其他報告規范,如針對試驗設計(隊列、非劣效性和等效性)、干預措施(非藥物和植物用藥療法)和特定數據(如副作用等)的擴展版已經制定完成[3]。CONSORT 聲明不僅得到了國際醫學期刊編輯委員會(International Committee of Medical Journal Editors,ICMJE)等主要期刊和編輯團體的支持,其使用更大大提高了隨機臨床試驗的報告質量[4]。
1 患者報告結局 CONSORT 擴展版的制定理由
患者報告結局(patient report outcome,PRO)包括:與健康相關的生存質量評價(health-related quality of life,HRQL)、患者癥狀、效用和患者滿意度評分等相關數據,并規定這類數據必須是由患者報告而非由觀察者報告。當前,隨機對照試驗中的患者報告結局數據越來越多地被用于指導以患者為中心的臨床治療、臨床決策、健康政策制定或財務報銷決策中[5-7]。
患者報告結局指標數據的應用,取決于準確、有效、可獲取的報告,但這部分常常不被關注。在一個納入 794 個以患者報告結局為主要結局指標的隨機對照試驗的研究中發現:只有 56% 的試驗提供了所選患者報告結局的理由;50% 的報告有患者報告結局假設;28% 的報告提供了關于患者報告結局缺失的信息;64% 的報告則在其他相關試驗中討論了患者報告結局[8]。
本研發工作的目的是為隨機臨床對照試驗中患者報告結局研發一份基于證據的 CONSORT 聲明擴展版本,并詳細闡述現有的 CONSORT 2010 聲明中部分適用于患者報告結局(詳述)的條目。本文詳細敘述了擴展版獲取共識、展現結果的具體方法,并為每一個條目提供了良好的示例和解釋。
2 報告規范研發方法
2.1 CONSORT PROs 的研發
擴展版是基于由 EQUATOR 協作網提出的臨床試驗報告規范制定方法學框架而研制的[9]。最初工作由國際生存質量研究學會(international society for quality of life research,ISOQOL)報告規范工作組領導,旨在建立和研發以生存質量評價為結局的隨機對照試驗報告規范[10]。根據相關利益方的反饋,將報告規范的范圍擴大到整個患者報告結局指標。伯明翰大學倫理審查委員會批準了此次專家共識會議和調查。
2.2 對現有報告規范的系統評價和關鍵利益相關方的調查
在本研究開展之前,一份詳細的系統評價已預先發表,該系統評價[10]簡要地回顧了現有關于隨機對照試驗生存質量評價報告規范(文獻時間:數據庫建庫至 2011 年 4 月)。兩名研究人員通過對 MEDLINE 進行文獻標題檢索,并輔以文獻回顧的方式獨立檢索所需文獻。報告隨機對照試驗中生存質量評價結果數據的備選標準是從符合條件的文章中提取出來的[10]。文獻檢索進行了兩次,檢索時間更新到 2013 年 1 月,以確定從最初的系統評價以來,是否有其他新的候選報告規范已經發表。
這一過程最終確定了 6 篇可能相關的文獻,盡管除了在 CONSORT 擴展版德爾菲會議上考慮的那些標準之外,沒有發現任何其他已發表的報告規范。這個研究結果使得報告規范擴展版的研究最初是以生存質量評價為重點的。之后,工作組收到了來自國際生存質量研究學會和其他利益相關方的反饋,使得共識過程研究的內容擴展到包括所有患者報告結局指標,以便明確評估報告規范對患者報告結局整體的適用性,從而允許研究人員將報告規范推廣到以患者報告結局為主要結局指標的所有臨床試驗中。
2.3 主要利益相關方的調查
我們針對采用系統評價[10]獲取的備選報告條目開展了一項在線調查。調查首先邀請了國際生存質量研究學會成員名單中的成員[10],隨后也對其他利益相關方群體發出邀請。在調查中,調查者被要求:當生存質量是生物醫學干預隨機對照試驗的主要結局和次要結局指標時,被邀成員需要對每個報告條目的重要性進行評分(本項研究的設計方案、受調查利益相關方及相關結果詳見原文附件 1,并可于網站 http://www.jama.com 查詢)。
2.4 報告規范的制定
工作組將調查結果和專家意見綜合成報告規范的草案。然后,將該草案發給所有國際生存質量研究學會成員,并且在 2011 年 10 月的丹佛國際生存質量年會上進行了討論,同時鼓勵會后的書面反饋意見。基于反饋意見,工作組再次對報告規范草案進行了修訂,將報告規范的涵括范圍擴大到包括所有的患者報告結局指標,并在 CONSORT PROs 共識會議上進行討論。
2012 年 1 月,29 名專家出席了在英國倫敦舉行的為期 2 天的共識會議。此次會議旨在就 CONSORT PROs 的內容達成共識,參與者包括期刊編輯、方法學家、臨床試驗專家、衛生政策決策者、臨床醫生、翻譯學專家、英國和美國的資助機構、業界和患者代表。原文附件 2 概述了共識會議過程,舉例說明了調查結果,并在原文附錄圖 1 和附錄圖 2 中分別描述了投票過程。
3 共識結果
3.1 CONSORT 患者報告結局項目清單:理由、示例和解釋
最終的 CONSORT PROs 確定了所有以患者報告結局為主要結局指標或關鍵的次要結局指標的隨機對照試驗所需報告的 5 個重要條目。術語表中包含了諸如關鍵的次要結局指標等的術語定義(并在 eBox 中舉例說明)。表 1 列出了 CONSORT 2010 清單中的 25 項條目(左列)和 CONSORT PROs 的 5 項條目(右列以字母 P 開頭)。與患者報告結局相關的具體條目有:① 在摘要中需明確說明將患者報告結局作為主要或次要結局指標;② 提供針對患者報告結局指標及其相關適用范疇的假設(如是否使用了多維度患者報告結局指標的檢測工具);③ 提供或引用患者報告結局測量工具效度和信度的證據;④ 明確說明處理缺失數據的統計學方法;⑤ 討論以患者報告結局指標為研究結果指標的特定局限性和結果對其他人群和臨床實踐的影響。雖然對于一些原有的 CONSORT 條目沒有擴展,但共識會議還是推薦了與患者報告結局條目相關的應用說明(表 1,右欄,純文本)。下面我們逐一說明在表 1 中列出的每個患者報告結局指標的理由及范例。

3.2 摘要
3.2.1 原版 CONSORT 2010 條目 1b:結構式摘要,包括試驗設計、方法、結果、結論幾個部分。
CONSORT PROs:在摘要中需要明確說明將患者報告結局作為主要或次要結局指標。
示例:“試驗主要結局指標是慢性阻塞性肺病患者在 24 個月里的生存質量變化,用慢性呼吸系統問卷的總分來衡量[11]。”
解釋:如果患者報告結局已經預先在試驗開始前被確定為主要結局指標或者關鍵的次要結局指標,至少應當在摘要中明確說明,以便于索引和識別研究類型,進而協助臨床治療及證據綜合。
3.3 簡介
3.3.1 原版 CONSORT 2010 條目 2a:科學背景和對試驗理由的解釋。
CONSORT PROs:需要簡要說明在試驗中評估患者報告結局指標的背景和理由。
示例:“偏頭痛使一半以上(57%)的患者健康嚴重受損或需要臥床休息,發作期和發作間期均使得患者存在明顯的生存質量受損、缺勤率增加、工作效率降低等情況,并與患者醫療保健費用的增加有關[12]。”
解釋:鑒于患者報告結局指標的文獻越來越多,可用于評估患者報告結局的工具也越來越多,背景或方法部分應簡要說明將患者報告結局作為試驗主要結局的理由以及選擇具體結局的原因,因此需要為特定目標結局和假設提供適當的文獻依據(條目 2b)。當患者報告結局是一個主要結局指標時,更詳細的文獻總結將對闡釋研究的結局和目標有很大幫助。
3.3.2 原版 CONSORT 2010 條目 2b:具體目的或假設。
CONSORT PROs:如適用,應說明患者報告結局的假設并確定相關適用范疇。
示例:“潛在的生存效益需要與治療代價相權衡。因此在 EORTC18991 研究中,一個多維結構的健康相關生存質量(health-related quality of life,HRQOL)評價被作為次要結局指標。研究方案假設兩組患者的整體健康相關生存質量得分存在差異,假定 PEG-IFN-2b 組患者的 HRQOL 得分更低。然后,其余 HRQOL 變量在探索性的基礎上被檢測[13]。”
解釋:患者報告結局指標的測量可以是一維或多維的,以評估健康相關的一個或多個方面(如身體、社會功能,或者是癥狀,如疲勞程度)。此外,在隨機對照試驗中,患者報告結局的測量可能在幾個時間點評估整體健康狀況或生存質量。如果沒有預先的研究假設,就有可能根據統計顯著性結果進行多重統計評估,并出現基于統計結果的顯著性而進行選擇性報告的情況。建議作者報告選擇特定患者報告結局指標的理由,并說明試驗中關注的患者報告結局指標相應的時間區限,并列出生物學或心理學證據說明干預措施對這些結局指標預期的益處或危害。
3.4 方法
3.4.1 原版 CONSORT 2010 條目 6a:完整而準確地說明預先設定的主要和次要結局指標,包括它們是在何時、如何測評的。
CONSORT PROs:如果有,應提供或引用患者報告結局測量工具效度和信度的證據。
示例:“皮膚病生存質量指數(dermatology life quality index,DLQI)在皮膚科使用時具有良好的信度和效度,并且也經常用于銀屑病臨床試驗[14]。”
解釋:理想狀態下,應該建立隨機對照試驗中使用的、所有患者報告結局指標對研究目標人群有效性關系,并應提供選擇該患者報告結局指標檢測方法的理由。這一依據還可以包括指標檢測方法的相關翻譯版本或其他特定文化版本。
現有 700 多個患者報告結局評價方法可用于臨床試驗[15]。患者報告結局數據的臨床應用要求有關該臨床試驗的結果是全面的,而患者報告結局指標是否全面取決于該指標是否有效和可信。應引用證據證明試驗中使用的檢測方法的信度和效度,以便讀者能夠獲取這些信息。如果一個隨機對照試驗使用了一個尚未公開發表的心理測量評價方法(例如,一個專門為試驗開發的新工具),并且文章中不允許報告這些方法的具體細節,作者至少應該在附錄中提供關于該方法信度和效度的證據[16]。
3.4.2 原版 CONSORT 2010 條目 6a:完整而準確地說明預先設定的主要和次要結局指標,包括它們是在何時、如何測評的。
CONSORT PROs:理想狀態下,當患者報告結局指標是主要結局指標時,試驗還應提供患者報告結局完成形式的詳細信息(特別是當代理人代表患者完成問卷調查時)及數據收集方法(紙質版、電話、電子版、或其他方式)。
示例:“參與者被要求在隨機化后 4、8 和 12 個月的三個時間點提供數據,使用自我完成調查問卷的形式上交數據,從而消除任何觀察者的偏倚[17]。”
解釋:在某些情況下,患者可能無法直接完成患者報告結局指標評估。如果結果測評是由一個代理人完成的話,那么試驗報告應該說明這種情況,以便讀者能夠評估任何潛在的偏倚或對結果的影響。不同的數據收集方法也可能影響結果,如果在干預組之間使用不同的方法,可能會導致潛在的偏倚。例如,通過電話或專業人員面對面訪談的形式收集資料,可能會導致患者的反應不同于他們私下在問卷中的自我調查結果。
3.4.3 原版 CONSORT 2010 條目 12a:用于比較各組主要和次要結局指標的統計學方法。
CONSORT PROs:對于將患者報告結局作為主要結局指標或關鍵的次要結局指標的臨床隨機對照試驗,需明確說明處理缺失數據的統計學方法。
示例:“提供對完整病例實施的末次觀察,以及每個時間點評估結果的期望分值和較差分值等的相關分析,以檢驗主要結局指標的穩定性[18]。”
解釋:臨床試驗結局數據的缺失會降低試驗的說服力,是潛在偏倚的來源,并能產生誤導性的結果。患者報告結局指標的數據缺失程度通常相對較高。對隨機挑選發表在國際主流期刊,且以生存質量評價為主要結局指標的隨機對照試驗(n=61)進行系統評價后發現,只有 10% 的研究報告沒有出現數據缺失的情況;21% 的研究報告缺失數據程度為“不清楚”;36% 的研究報告數據缺失率超過 10%[19]。重要的是:患者報告結局數據通常不是隨機丟失的,而是與感興趣的試驗結果相關,如健康狀況的改善或惡化。不同統計方法處理缺失數據有各自的優勢和局限[2, 20]。例如,在如上所示的例子中[18],“實施的末次觀察”方法受到了一部分作者的批評(這些內容為感興趣的讀者提供了針對這些觀察方法的指導)[21]。因此,為了允許對作者所使用的方法進行裁決,作者應明晰說明這一方法的實施過程,并在必要時討論這一方法對患者報告結局指標效度的潛在影響[2, 22, 23]。
3.4.4 原版 CONSORT 2010 條目 13a:隨機分配到各組的受試者例數,接受已分配治療的例數,以及納入主要結局分析的例數。
CONSORT PROs:應明晰報告在基線和隨后時間節點患者報告結局指標數據的參與者人數。
示例:“原文附錄圖 3 是一個包括提供患者報告結局數據的參與者例數的 CONSORT 流程圖(可從 http://www.jama.com 獲得)。”
解釋:CONSORT 流程圖為讀者提供了隨機對照試驗各個階段(注冊、干預措施的分配、隨訪和數據分析)受試者流程的概況。作者應積極考慮如何最好地報告與患者報告結局相關的試驗參與者的流程,包括缺少患者報告結局信息的原因,如缺少問卷回復、翻譯不可用或其他已知原因(原文附錄圖 3)[24-27]。這些信息將有助于讀者解讀患者報告結局的數據,并評估潛在的偏倚,特別是當缺失數據是由于健康狀況惡化所導致時。作者也可以考慮以表格形式為每個治療組提供這些信息[28],或在流程圖的腳注中說明。
3.5 結果
3.5.1 原版 CONSORT 2010 條目 15:用一張表格列出每一組受試者的基線數據,包括人口學資料和臨床特征。
CONSORT PROs:收集時應包括患者報告結局指標的基線數據。
示例:“一個隨機對照試驗中,有關患者報告結局指標基線數據的例子,詳見表 2[29]。”

解釋:臨床醫生和政策制定者可以使用患者報告結局指標的基線數據來評估臨床試驗結果的相關性和可推廣性[30]。
3.5.2 原版 CONSORT 2010 條目 17a:各組每一項主要和次要結局指標的結果,效應估計值及其精確性(如 95% 可信區間)
CONSORT PROs:對于多維患者報告結局指標,應包括多個范疇和時間點的對應結果。
示例:“表 3 中關于生活質量結局指標治療效果的示例,取自于一項比較兩種干預措施治療耐藥性顳葉癲癇的 RCT 報告[31]。”

解釋:由于研究工具通常包含多個量表和項目,因此選擇性報告患者報告結局的可能性會增加。一般來說,建議所有患者報告結局指標結果應與其他結果數據一起以表格形式呈現。重要的、患者報告的次要結局指標,應在文章主體中呈現,以促進與其他預定的重要臨床結果的整合。其他的患者報告結局指標,或者患者報告結局指標分項目的分值,如有可能,應作為附件,或者是作為擴展的報告副本在文章主體中呈現,以減少對重要結果的選擇性報告,并確保患者報告結局指標的可獲得性,從而用于指導臨床實踐和證據綜合[32, 33]。
3.6 討論
3.6.1 原版 CONSORT 2010 條目 20:試驗的局限性,報告潛在偏倚和不精確的原因及出現多種分析結果的原因。
條目 21:試驗結果被推廣的可能性(外部可靠性和實用性)。
CONSORT PROs:患者報告結局指標對研究結果和臨床實踐的局限性和啟示。
示例 1:“偏倚的一個潛在來源是在評估期間對生存質量評價表格總體數量的缺失,而在 Gemcitibine 組丟失的數據更多。這些問題降低了未來我們將這一干預措施的遠期影響推廣到患者身上的可能性[34]。”
示例 2:“然而,一年未就診患者的癥狀和生存質量可能與就診者不同,因此可能存在一定程度的選擇性偏倚[35]。”
解釋:除了設計和實施問題與 RCT 試驗結果的可推廣性相關外,一些患者報告結局指標相關的限制(包括患者和中心水平的特征等)可能會影響患者報告結局結果的可推廣性。例如,如果患者報告結局指標評估僅限于主要試驗人群的一個亞組,建議提供受試者被排除在患者報告結局評估之外的原因(例如在沒有適當翻譯的情況下)。如果缺少患者報告結局指標數據,對缺失的可能原因進行討論,并對其進行任何相關的支持性(如敏感性)分析等特別重要,尤其在討論與這些缺失數據指標的臨床內涵相關聯時。此外,由于先前描述的許多患者報告結局評估方法細節可能會影響隨機對照試驗結果,因此建議對患者報告結局指標的這些細節進行解釋,特別是對這些細節的疑惑會影響對結局指標結果的判斷時。
條目 22:與結果相對應的解釋,權衡試驗結果的利弊,并且考慮其他相關證據。
CONSORT PROs:患者報告的結局指標數據應從臨床結局相關的角度進行解讀,如適用,應包括生存相關的指標。
示例:“接受西妥昔單抗的患者,生存質量惡化的情況明顯減少,接受治療后臨床癥狀出現惡化的時間明顯延長。這些結果很重要,因為雖然接受西妥昔單抗治療,結果顯示總體生存率、無惡化生存率、復發率和疾病控制率均有提高,但這些好處的臨床重要性不是很大。”
總結:西妥昔單抗給預先治療的晚期結直腸癌(colorectal cancer,CRC)患者明顯改善了生存質量和生存率[36]。
解釋:患者報告結局的臨床重要性通常沒有在隨機對照試驗報告中討論,但應與其他重要的臨床結局指標(如生存率)結合起來討論,尤其是在權衡患者報告結局指標與遠期生存等結局相關的臨床試驗中[37]。患者報告結局的進一步解釋還可以包括:對最小重要變化、對干預措施應答定義的討論(是否對研究中使用的特定患者報告結局工具進行了驗證)、與其他類似的隨機對照試驗比較、或將患者報告結局的臨床意義與其他試驗結果(如毒性發生率)聯系起來。
4 討論
CONSORT PROs 旨在提高隨機對照試驗中以患者報告結局為主要結局指標或關鍵的次要結局指標的透明度。改進后的報告將有助于對臨床試驗中患者報告結局指標的解讀,正如在“使用者指南”中所述,同時亦有助于證據綜合和健康政策的制定[23, 38]。明晰地報告將有助于全面理解數據的局限性和潛在偏倚來源。主要臨床試驗文章通常是報告患者報告結局數據的唯一機會,這一結果可以在試驗報告中與其他臨床試驗結果一起被解讀。單一報告患者報告結局指標的文章往往在主要的臨床試驗文章發表數月或數年后被公開,這可能是提取患者報告結局數據的障礙。因此,我們建議作者在主要的臨床試驗文章中,根據本文描述的 5 個條目,報告以患者報告結局指標為主要結局指標或關鍵次要指標的結果數據,并建議期刊提供適當的機制以促進患者報告結局的最佳報告(例如模板和在線附錄)。CONSORT 患者報告結局檢查清單還闡述了現有 CONSORT 2010 的具體條目如何結合 CONSORT PROs 的要求使用。
我們鼓勵作者、同行評議和讀者將 CONSORT PROs 與原版 CONSORT 2010 聲明及其他解釋和擴展版本(適用于試驗設計、干預和結果)結合使用[1-3]。CONSORT 小組正在考慮合并一些指導性聲明,以便于作者理解,因為他們可能發現現有清單難以真正實施。
在這個擴展版中,我們引用了重要或關鍵的次要結局指標的概念,其可被定義為在臨床試驗方案中預先設定的有假設效應值的,或在統計效能和樣本量的計算中予以考量的患者報告結局范疇。我們認識到,這些概念并沒有得到真正廣泛應用,在為這些重要或關鍵的次要結局指標提供標準化術語(臨床的及與患者報告結局相關的)方面仍需要更多的努力。在共識會議期間討論的另一個問題是,項目 P12a“明確說明處理缺失數據的統計學方法”與其他隨機對照試驗結局指標的關聯性,我們鼓勵作者考慮為所有結果報告此類信息。
我們嚴格按照現行的制定報告規范的方法制定了 CONSORT PROs[9]。與其他報告規范一樣,CONSORT PROs 的研發也是一項持續進行的工作。我們將繼續更新檢索文獻,以幫助指導我們進行進一步的改進。同樣我們鼓勵讀者就本報告規范以及如何進一步完善提供反饋。
我們鼓勵期刊修改相關的作者須知,以支持 CONSORT PROs。我們計劃將 CONSORT PROs 發放給目前已知的支持 CONSORT 2010[39]的期刊和其他相關團體,如“提高醫療衛生研究的質量和透明度”協作網[40],我們計劃評估 CONSORT 患者報告結局擴展版是否達到預期效果,改進報告隨機對照試驗中以患者報告結局作為主要或關鍵次要指標的完整性。
最后,雖然這些規范著重于患者報告結局指標的報告,但涉及到患者報告結局指標的臨床試驗設計也可能因此得到改進。我們建議臨床試驗者參照美國食品和藥物管理局(Food and Drug Administration,FDA)在隨機對照試驗中制定、驗證和實施患者報告結局指標的檢測及其分析的有關指導文件[5]。臨床試驗參與者在考慮患者報告結局指標特異性的臨床試驗方案要求時,亦應參照 FDA 的指導意見及臨床試驗方案報告規范(SPIRIT)的建議[40, 41]。
參考文獻
見原文。
臨床試驗報告規范 CONSORT(Consolidated Standards of Reporting Trials,CONSORT)聲明首次發表于 1996 年,于 2010 年完成最近一次修訂[1, 2],這份聲明提供了基于證據的、用以提高隨機對照試驗(randomized control trail,RCT)報告完整性的推薦意見。該聲明著重于平行對照試驗,但隨后的一系列其他報告規范,如針對試驗設計(隊列、非劣效性和等效性)、干預措施(非藥物和植物用藥療法)和特定數據(如副作用等)的擴展版已經制定完成[3]。CONSORT 聲明不僅得到了國際醫學期刊編輯委員會(International Committee of Medical Journal Editors,ICMJE)等主要期刊和編輯團體的支持,其使用更大大提高了隨機臨床試驗的報告質量[4]。
1 患者報告結局 CONSORT 擴展版的制定理由
患者報告結局(patient report outcome,PRO)包括:與健康相關的生存質量評價(health-related quality of life,HRQL)、患者癥狀、效用和患者滿意度評分等相關數據,并規定這類數據必須是由患者報告而非由觀察者報告。當前,隨機對照試驗中的患者報告結局數據越來越多地被用于指導以患者為中心的臨床治療、臨床決策、健康政策制定或財務報銷決策中[5-7]。
患者報告結局指標數據的應用,取決于準確、有效、可獲取的報告,但這部分常常不被關注。在一個納入 794 個以患者報告結局為主要結局指標的隨機對照試驗的研究中發現:只有 56% 的試驗提供了所選患者報告結局的理由;50% 的報告有患者報告結局假設;28% 的報告提供了關于患者報告結局缺失的信息;64% 的報告則在其他相關試驗中討論了患者報告結局[8]。
本研發工作的目的是為隨機臨床對照試驗中患者報告結局研發一份基于證據的 CONSORT 聲明擴展版本,并詳細闡述現有的 CONSORT 2010 聲明中部分適用于患者報告結局(詳述)的條目。本文詳細敘述了擴展版獲取共識、展現結果的具體方法,并為每一個條目提供了良好的示例和解釋。
2 報告規范研發方法
2.1 CONSORT PROs 的研發
擴展版是基于由 EQUATOR 協作網提出的臨床試驗報告規范制定方法學框架而研制的[9]。最初工作由國際生存質量研究學會(international society for quality of life research,ISOQOL)報告規范工作組領導,旨在建立和研發以生存質量評價為結局的隨機對照試驗報告規范[10]。根據相關利益方的反饋,將報告規范的范圍擴大到整個患者報告結局指標。伯明翰大學倫理審查委員會批準了此次專家共識會議和調查。
2.2 對現有報告規范的系統評價和關鍵利益相關方的調查
在本研究開展之前,一份詳細的系統評價已預先發表,該系統評價[10]簡要地回顧了現有關于隨機對照試驗生存質量評價報告規范(文獻時間:數據庫建庫至 2011 年 4 月)。兩名研究人員通過對 MEDLINE 進行文獻標題檢索,并輔以文獻回顧的方式獨立檢索所需文獻。報告隨機對照試驗中生存質量評價結果數據的備選標準是從符合條件的文章中提取出來的[10]。文獻檢索進行了兩次,檢索時間更新到 2013 年 1 月,以確定從最初的系統評價以來,是否有其他新的候選報告規范已經發表。
這一過程最終確定了 6 篇可能相關的文獻,盡管除了在 CONSORT 擴展版德爾菲會議上考慮的那些標準之外,沒有發現任何其他已發表的報告規范。這個研究結果使得報告規范擴展版的研究最初是以生存質量評價為重點的。之后,工作組收到了來自國際生存質量研究學會和其他利益相關方的反饋,使得共識過程研究的內容擴展到包括所有患者報告結局指標,以便明確評估報告規范對患者報告結局整體的適用性,從而允許研究人員將報告規范推廣到以患者報告結局為主要結局指標的所有臨床試驗中。
2.3 主要利益相關方的調查
我們針對采用系統評價[10]獲取的備選報告條目開展了一項在線調查。調查首先邀請了國際生存質量研究學會成員名單中的成員[10],隨后也對其他利益相關方群體發出邀請。在調查中,調查者被要求:當生存質量是生物醫學干預隨機對照試驗的主要結局和次要結局指標時,被邀成員需要對每個報告條目的重要性進行評分(本項研究的設計方案、受調查利益相關方及相關結果詳見原文附件 1,并可于網站 http://www.jama.com 查詢)。
2.4 報告規范的制定
工作組將調查結果和專家意見綜合成報告規范的草案。然后,將該草案發給所有國際生存質量研究學會成員,并且在 2011 年 10 月的丹佛國際生存質量年會上進行了討論,同時鼓勵會后的書面反饋意見。基于反饋意見,工作組再次對報告規范草案進行了修訂,將報告規范的涵括范圍擴大到包括所有的患者報告結局指標,并在 CONSORT PROs 共識會議上進行討論。
2012 年 1 月,29 名專家出席了在英國倫敦舉行的為期 2 天的共識會議。此次會議旨在就 CONSORT PROs 的內容達成共識,參與者包括期刊編輯、方法學家、臨床試驗專家、衛生政策決策者、臨床醫生、翻譯學專家、英國和美國的資助機構、業界和患者代表。原文附件 2 概述了共識會議過程,舉例說明了調查結果,并在原文附錄圖 1 和附錄圖 2 中分別描述了投票過程。
3 共識結果
3.1 CONSORT 患者報告結局項目清單:理由、示例和解釋
最終的 CONSORT PROs 確定了所有以患者報告結局為主要結局指標或關鍵的次要結局指標的隨機對照試驗所需報告的 5 個重要條目。術語表中包含了諸如關鍵的次要結局指標等的術語定義(并在 eBox 中舉例說明)。表 1 列出了 CONSORT 2010 清單中的 25 項條目(左列)和 CONSORT PROs 的 5 項條目(右列以字母 P 開頭)。與患者報告結局相關的具體條目有:① 在摘要中需明確說明將患者報告結局作為主要或次要結局指標;② 提供針對患者報告結局指標及其相關適用范疇的假設(如是否使用了多維度患者報告結局指標的檢測工具);③ 提供或引用患者報告結局測量工具效度和信度的證據;④ 明確說明處理缺失數據的統計學方法;⑤ 討論以患者報告結局指標為研究結果指標的特定局限性和結果對其他人群和臨床實踐的影響。雖然對于一些原有的 CONSORT 條目沒有擴展,但共識會議還是推薦了與患者報告結局條目相關的應用說明(表 1,右欄,純文本)。下面我們逐一說明在表 1 中列出的每個患者報告結局指標的理由及范例。

3.2 摘要
3.2.1 原版 CONSORT 2010 條目 1b:結構式摘要,包括試驗設計、方法、結果、結論幾個部分。
CONSORT PROs:在摘要中需要明確說明將患者報告結局作為主要或次要結局指標。
示例:“試驗主要結局指標是慢性阻塞性肺病患者在 24 個月里的生存質量變化,用慢性呼吸系統問卷的總分來衡量[11]。”
解釋:如果患者報告結局已經預先在試驗開始前被確定為主要結局指標或者關鍵的次要結局指標,至少應當在摘要中明確說明,以便于索引和識別研究類型,進而協助臨床治療及證據綜合。
3.3 簡介
3.3.1 原版 CONSORT 2010 條目 2a:科學背景和對試驗理由的解釋。
CONSORT PROs:需要簡要說明在試驗中評估患者報告結局指標的背景和理由。
示例:“偏頭痛使一半以上(57%)的患者健康嚴重受損或需要臥床休息,發作期和發作間期均使得患者存在明顯的生存質量受損、缺勤率增加、工作效率降低等情況,并與患者醫療保健費用的增加有關[12]。”
解釋:鑒于患者報告結局指標的文獻越來越多,可用于評估患者報告結局的工具也越來越多,背景或方法部分應簡要說明將患者報告結局作為試驗主要結局的理由以及選擇具體結局的原因,因此需要為特定目標結局和假設提供適當的文獻依據(條目 2b)。當患者報告結局是一個主要結局指標時,更詳細的文獻總結將對闡釋研究的結局和目標有很大幫助。
3.3.2 原版 CONSORT 2010 條目 2b:具體目的或假設。
CONSORT PROs:如適用,應說明患者報告結局的假設并確定相關適用范疇。
示例:“潛在的生存效益需要與治療代價相權衡。因此在 EORTC18991 研究中,一個多維結構的健康相關生存質量(health-related quality of life,HRQOL)評價被作為次要結局指標。研究方案假設兩組患者的整體健康相關生存質量得分存在差異,假定 PEG-IFN-2b 組患者的 HRQOL 得分更低。然后,其余 HRQOL 變量在探索性的基礎上被檢測[13]。”
解釋:患者報告結局指標的測量可以是一維或多維的,以評估健康相關的一個或多個方面(如身體、社會功能,或者是癥狀,如疲勞程度)。此外,在隨機對照試驗中,患者報告結局的測量可能在幾個時間點評估整體健康狀況或生存質量。如果沒有預先的研究假設,就有可能根據統計顯著性結果進行多重統計評估,并出現基于統計結果的顯著性而進行選擇性報告的情況。建議作者報告選擇特定患者報告結局指標的理由,并說明試驗中關注的患者報告結局指標相應的時間區限,并列出生物學或心理學證據說明干預措施對這些結局指標預期的益處或危害。
3.4 方法
3.4.1 原版 CONSORT 2010 條目 6a:完整而準確地說明預先設定的主要和次要結局指標,包括它們是在何時、如何測評的。
CONSORT PROs:如果有,應提供或引用患者報告結局測量工具效度和信度的證據。
示例:“皮膚病生存質量指數(dermatology life quality index,DLQI)在皮膚科使用時具有良好的信度和效度,并且也經常用于銀屑病臨床試驗[14]。”
解釋:理想狀態下,應該建立隨機對照試驗中使用的、所有患者報告結局指標對研究目標人群有效性關系,并應提供選擇該患者報告結局指標檢測方法的理由。這一依據還可以包括指標檢測方法的相關翻譯版本或其他特定文化版本。
現有 700 多個患者報告結局評價方法可用于臨床試驗[15]。患者報告結局數據的臨床應用要求有關該臨床試驗的結果是全面的,而患者報告結局指標是否全面取決于該指標是否有效和可信。應引用證據證明試驗中使用的檢測方法的信度和效度,以便讀者能夠獲取這些信息。如果一個隨機對照試驗使用了一個尚未公開發表的心理測量評價方法(例如,一個專門為試驗開發的新工具),并且文章中不允許報告這些方法的具體細節,作者至少應該在附錄中提供關于該方法信度和效度的證據[16]。
3.4.2 原版 CONSORT 2010 條目 6a:完整而準確地說明預先設定的主要和次要結局指標,包括它們是在何時、如何測評的。
CONSORT PROs:理想狀態下,當患者報告結局指標是主要結局指標時,試驗還應提供患者報告結局完成形式的詳細信息(特別是當代理人代表患者完成問卷調查時)及數據收集方法(紙質版、電話、電子版、或其他方式)。
示例:“參與者被要求在隨機化后 4、8 和 12 個月的三個時間點提供數據,使用自我完成調查問卷的形式上交數據,從而消除任何觀察者的偏倚[17]。”
解釋:在某些情況下,患者可能無法直接完成患者報告結局指標評估。如果結果測評是由一個代理人完成的話,那么試驗報告應該說明這種情況,以便讀者能夠評估任何潛在的偏倚或對結果的影響。不同的數據收集方法也可能影響結果,如果在干預組之間使用不同的方法,可能會導致潛在的偏倚。例如,通過電話或專業人員面對面訪談的形式收集資料,可能會導致患者的反應不同于他們私下在問卷中的自我調查結果。
3.4.3 原版 CONSORT 2010 條目 12a:用于比較各組主要和次要結局指標的統計學方法。
CONSORT PROs:對于將患者報告結局作為主要結局指標或關鍵的次要結局指標的臨床隨機對照試驗,需明確說明處理缺失數據的統計學方法。
示例:“提供對完整病例實施的末次觀察,以及每個時間點評估結果的期望分值和較差分值等的相關分析,以檢驗主要結局指標的穩定性[18]。”
解釋:臨床試驗結局數據的缺失會降低試驗的說服力,是潛在偏倚的來源,并能產生誤導性的結果。患者報告結局指標的數據缺失程度通常相對較高。對隨機挑選發表在國際主流期刊,且以生存質量評價為主要結局指標的隨機對照試驗(n=61)進行系統評價后發現,只有 10% 的研究報告沒有出現數據缺失的情況;21% 的研究報告缺失數據程度為“不清楚”;36% 的研究報告數據缺失率超過 10%[19]。重要的是:患者報告結局數據通常不是隨機丟失的,而是與感興趣的試驗結果相關,如健康狀況的改善或惡化。不同統計方法處理缺失數據有各自的優勢和局限[2, 20]。例如,在如上所示的例子中[18],“實施的末次觀察”方法受到了一部分作者的批評(這些內容為感興趣的讀者提供了針對這些觀察方法的指導)[21]。因此,為了允許對作者所使用的方法進行裁決,作者應明晰說明這一方法的實施過程,并在必要時討論這一方法對患者報告結局指標效度的潛在影響[2, 22, 23]。
3.4.4 原版 CONSORT 2010 條目 13a:隨機分配到各組的受試者例數,接受已分配治療的例數,以及納入主要結局分析的例數。
CONSORT PROs:應明晰報告在基線和隨后時間節點患者報告結局指標數據的參與者人數。
示例:“原文附錄圖 3 是一個包括提供患者報告結局數據的參與者例數的 CONSORT 流程圖(可從 http://www.jama.com 獲得)。”
解釋:CONSORT 流程圖為讀者提供了隨機對照試驗各個階段(注冊、干預措施的分配、隨訪和數據分析)受試者流程的概況。作者應積極考慮如何最好地報告與患者報告結局相關的試驗參與者的流程,包括缺少患者報告結局信息的原因,如缺少問卷回復、翻譯不可用或其他已知原因(原文附錄圖 3)[24-27]。這些信息將有助于讀者解讀患者報告結局的數據,并評估潛在的偏倚,特別是當缺失數據是由于健康狀況惡化所導致時。作者也可以考慮以表格形式為每個治療組提供這些信息[28],或在流程圖的腳注中說明。
3.5 結果
3.5.1 原版 CONSORT 2010 條目 15:用一張表格列出每一組受試者的基線數據,包括人口學資料和臨床特征。
CONSORT PROs:收集時應包括患者報告結局指標的基線數據。
示例:“一個隨機對照試驗中,有關患者報告結局指標基線數據的例子,詳見表 2[29]。”

解釋:臨床醫生和政策制定者可以使用患者報告結局指標的基線數據來評估臨床試驗結果的相關性和可推廣性[30]。
3.5.2 原版 CONSORT 2010 條目 17a:各組每一項主要和次要結局指標的結果,效應估計值及其精確性(如 95% 可信區間)
CONSORT PROs:對于多維患者報告結局指標,應包括多個范疇和時間點的對應結果。
示例:“表 3 中關于生活質量結局指標治療效果的示例,取自于一項比較兩種干預措施治療耐藥性顳葉癲癇的 RCT 報告[31]。”

解釋:由于研究工具通常包含多個量表和項目,因此選擇性報告患者報告結局的可能性會增加。一般來說,建議所有患者報告結局指標結果應與其他結果數據一起以表格形式呈現。重要的、患者報告的次要結局指標,應在文章主體中呈現,以促進與其他預定的重要臨床結果的整合。其他的患者報告結局指標,或者患者報告結局指標分項目的分值,如有可能,應作為附件,或者是作為擴展的報告副本在文章主體中呈現,以減少對重要結果的選擇性報告,并確保患者報告結局指標的可獲得性,從而用于指導臨床實踐和證據綜合[32, 33]。
3.6 討論
3.6.1 原版 CONSORT 2010 條目 20:試驗的局限性,報告潛在偏倚和不精確的原因及出現多種分析結果的原因。
條目 21:試驗結果被推廣的可能性(外部可靠性和實用性)。
CONSORT PROs:患者報告結局指標對研究結果和臨床實踐的局限性和啟示。
示例 1:“偏倚的一個潛在來源是在評估期間對生存質量評價表格總體數量的缺失,而在 Gemcitibine 組丟失的數據更多。這些問題降低了未來我們將這一干預措施的遠期影響推廣到患者身上的可能性[34]。”
示例 2:“然而,一年未就診患者的癥狀和生存質量可能與就診者不同,因此可能存在一定程度的選擇性偏倚[35]。”
解釋:除了設計和實施問題與 RCT 試驗結果的可推廣性相關外,一些患者報告結局指標相關的限制(包括患者和中心水平的特征等)可能會影響患者報告結局結果的可推廣性。例如,如果患者報告結局指標評估僅限于主要試驗人群的一個亞組,建議提供受試者被排除在患者報告結局評估之外的原因(例如在沒有適當翻譯的情況下)。如果缺少患者報告結局指標數據,對缺失的可能原因進行討論,并對其進行任何相關的支持性(如敏感性)分析等特別重要,尤其在討論與這些缺失數據指標的臨床內涵相關聯時。此外,由于先前描述的許多患者報告結局評估方法細節可能會影響隨機對照試驗結果,因此建議對患者報告結局指標的這些細節進行解釋,特別是對這些細節的疑惑會影響對結局指標結果的判斷時。
條目 22:與結果相對應的解釋,權衡試驗結果的利弊,并且考慮其他相關證據。
CONSORT PROs:患者報告的結局指標數據應從臨床結局相關的角度進行解讀,如適用,應包括生存相關的指標。
示例:“接受西妥昔單抗的患者,生存質量惡化的情況明顯減少,接受治療后臨床癥狀出現惡化的時間明顯延長。這些結果很重要,因為雖然接受西妥昔單抗治療,結果顯示總體生存率、無惡化生存率、復發率和疾病控制率均有提高,但這些好處的臨床重要性不是很大。”
總結:西妥昔單抗給預先治療的晚期結直腸癌(colorectal cancer,CRC)患者明顯改善了生存質量和生存率[36]。
解釋:患者報告結局的臨床重要性通常沒有在隨機對照試驗報告中討論,但應與其他重要的臨床結局指標(如生存率)結合起來討論,尤其是在權衡患者報告結局指標與遠期生存等結局相關的臨床試驗中[37]。患者報告結局的進一步解釋還可以包括:對最小重要變化、對干預措施應答定義的討論(是否對研究中使用的特定患者報告結局工具進行了驗證)、與其他類似的隨機對照試驗比較、或將患者報告結局的臨床意義與其他試驗結果(如毒性發生率)聯系起來。
4 討論
CONSORT PROs 旨在提高隨機對照試驗中以患者報告結局為主要結局指標或關鍵的次要結局指標的透明度。改進后的報告將有助于對臨床試驗中患者報告結局指標的解讀,正如在“使用者指南”中所述,同時亦有助于證據綜合和健康政策的制定[23, 38]。明晰地報告將有助于全面理解數據的局限性和潛在偏倚來源。主要臨床試驗文章通常是報告患者報告結局數據的唯一機會,這一結果可以在試驗報告中與其他臨床試驗結果一起被解讀。單一報告患者報告結局指標的文章往往在主要的臨床試驗文章發表數月或數年后被公開,這可能是提取患者報告結局數據的障礙。因此,我們建議作者在主要的臨床試驗文章中,根據本文描述的 5 個條目,報告以患者報告結局指標為主要結局指標或關鍵次要指標的結果數據,并建議期刊提供適當的機制以促進患者報告結局的最佳報告(例如模板和在線附錄)。CONSORT 患者報告結局檢查清單還闡述了現有 CONSORT 2010 的具體條目如何結合 CONSORT PROs 的要求使用。
我們鼓勵作者、同行評議和讀者將 CONSORT PROs 與原版 CONSORT 2010 聲明及其他解釋和擴展版本(適用于試驗設計、干預和結果)結合使用[1-3]。CONSORT 小組正在考慮合并一些指導性聲明,以便于作者理解,因為他們可能發現現有清單難以真正實施。
在這個擴展版中,我們引用了重要或關鍵的次要結局指標的概念,其可被定義為在臨床試驗方案中預先設定的有假設效應值的,或在統計效能和樣本量的計算中予以考量的患者報告結局范疇。我們認識到,這些概念并沒有得到真正廣泛應用,在為這些重要或關鍵的次要結局指標提供標準化術語(臨床的及與患者報告結局相關的)方面仍需要更多的努力。在共識會議期間討論的另一個問題是,項目 P12a“明確說明處理缺失數據的統計學方法”與其他隨機對照試驗結局指標的關聯性,我們鼓勵作者考慮為所有結果報告此類信息。
我們嚴格按照現行的制定報告規范的方法制定了 CONSORT PROs[9]。與其他報告規范一樣,CONSORT PROs 的研發也是一項持續進行的工作。我們將繼續更新檢索文獻,以幫助指導我們進行進一步的改進。同樣我們鼓勵讀者就本報告規范以及如何進一步完善提供反饋。
我們鼓勵期刊修改相關的作者須知,以支持 CONSORT PROs。我們計劃將 CONSORT PROs 發放給目前已知的支持 CONSORT 2010[39]的期刊和其他相關團體,如“提高醫療衛生研究的質量和透明度”協作網[40],我們計劃評估 CONSORT 患者報告結局擴展版是否達到預期效果,改進報告隨機對照試驗中以患者報告結局作為主要或關鍵次要指標的完整性。
最后,雖然這些規范著重于患者報告結局指標的報告,但涉及到患者報告結局指標的臨床試驗設計也可能因此得到改進。我們建議臨床試驗者參照美國食品和藥物管理局(Food and Drug Administration,FDA)在隨機對照試驗中制定、驗證和實施患者報告結局指標的檢測及其分析的有關指導文件[5]。臨床試驗參與者在考慮患者報告結局指標特異性的臨床試驗方案要求時,亦應參照 FDA 的指導意見及臨床試驗方案報告規范(SPIRIT)的建議[40, 41]。
參考文獻
見原文。