引用本文: 張明妍, 楊豐文, 李越, 張俊華,譯. 核心指標集報告規范:COS-STAR 聲明. 中國循證醫學雜志, 2017, 17(4): 470-474. doi: 10.7507/1672-2531.201702053 復制
1 前言
臨床試驗的結局指標沒有得到足夠的重視,對這個問題的認識也不斷加深。如果研究結果要影響實踐和未來研究,其結局指標需要與衛生服務使用者和其他衛生保健決策者緊密相關。此外,結局指標報告偏倚,即根據結果選擇納入試驗報告的結局指標,已被確定是影響發表數據解讀的一個問題。
核心結局指標集(core outcome set,COS)的形成與實施,目前引起了衛生研究所有領域越來越多的關注[1],并與全球范圍內的研究實踐密切相關。一項最新調查顯示,目前一些試驗者、系統評價員和指南制定者(COS 使用者)將 COS 研究作為工作中結局指標選擇的起點[1]。COS 的使用可幫助提高指標測量的一致性,并能夠減少結局指標報告偏倚。而報告偏倚會導致研究實施和報告過程中的大量不必要的浪費[2]。
新近一篇系統評價確認已有 200 多個發表的 COS 研究[1],并且還有許多已知的在研 COS 研究[3]。COS 形成的第一步應該是“測量什么”,而“如何做”和“何時做”通常是下一步。COS 的價值在很大程度上取決于它“為什么做”和“如何做”。COS 制定工作組的可靠性,與他們指標評價的經驗和如何讓主要利益相關群體參與制定過程相關,這會影響到 COS 的后續采用。此外,COS 形成研究的報告質量也影響其推行。最近研究顯示,目前的報告質量參差不齊[4],限制了臨床試驗者、系統評價員和指南制定者等 COS 潛在用戶評估與他們自己工作相關性的能力。
核心結局指標集之前被定義是健康或衛生保健特定領域中所有臨床試驗都必須測量和報告的,最小的、公認的、標準化的指標集合[2]。COS 正在研究用于臨床試驗以外的領域。盡管先前制定了關于 COS 研究中德爾菲調查的報告建議[5],但因在 COS 形成過程中包含了其他各種方法和內容,故也應及時廣泛收集這一領域漸增的活動共識[1]。在本文中,我們介紹了一個研究項目的結果,其目標是采用“提高衛生研究質量和透明度網絡”(Enhancing the QUAlity and Transparency Of health Research,EQUATOR)[6]提供的方法制定 COS 形成研究的報告指南(Core Outcome Set-Standards for Reporting,COS-STAR)。報告清單不僅關乎 COS 形成中使用的共識方法,還可以應用于有效性試驗、系統評價或常規治療的 COS 形成[7]。
2 術語
一個核心指標集描述了在特定研究或實踐環境中應該測量的內容,下一步需要確定如何界定或測量每個結局指標。僅有 38% 的已發表研究中含有測量 COS 結局指標的推薦意見[4]。制定這個報告指南是為解決形成 COS 的第一階段問題,即應該測量什么。
3 倫理審批
本研究已咨詢利物浦大學倫理委員會并通過倫理批準(參考 RETH000841)。如果參與者回復了德爾菲調查或同意參加共識會議,則被認為是已知情同意。
4 COS-STAR 聲明的形成
一份概述了 COS-STAR 研究中德爾菲過程的完整方案已經發表[8],包括提供一份配套的解釋和闡釋的文檔(Explanation and Elaboration,E+E)的意向,其中給出了每個清單條目的含義和合理性。
初始清單包括 48 個報告條目,產生于以前一個關于 COS 研究的系統評價,包括德爾菲調查[5]、制定 COS 的個人經驗以及項目管理工作組報告(COS-STAR 工作組)。這份包括潛在報告條目的初始清單被納入到一個國際性的兩輪德爾菲調查中,以確定這些報告條目的重要性。
德爾菲調查涉及四個主要利益相關者群體,他們將參與到 COS 形成、報告和應用等方面。邀請函通過電子郵件發送到:(1)在核心指標集有效性試驗數據庫(Core Outcome Measures in Effectiveness Trials,COMET,www.comet-initiative.org)中已發表的 196 個 COS 研究的主要作者,并請他們將邀請函轉發給參與的所有方法學家;(2)250 種發表過 COS 研究和 70 種涉及女性健康(CoRe Outcomes in WomeN’s health,CROWN,)核心指標的期刊編輯,主動支持采用 COS;(3)COS 潛在用戶:① 商業或非商業、在 clinicaltrials.gov 數據庫注冊(來自 8 449 項注冊試驗的 20% 隨機樣本)的開放性 III/IV 期試驗主要研究者,② 來自 53 個 Cochrane 評價小組的 76 位協調編輯;(4)33 名患者代表,先前參加過 COMET 專題會和 COMET 公眾與患者參與、介入或協同工作組(Public and Patient Participation,Involvement and Engagement,PoPPIE)。邀請在指南國際協作網網站()上列出的臨床指南制定者參與的可行性不大,因為他們是成員組織。因此調查問卷中增加了涉及臨床指南制定的問題作為替代辦法。目的是從每個利益相關者群體中招聘盡可能多的人員來進行德爾菲調查。給參與者發送一封個性化電子郵件,概述項目情況-類似于研究計劃中的描述和 COS 研究的第一個系統評價[4]。
德爾菲參與者評價每個報告條目的重要性,方案中界定尺度從 1 分(不重要)到 9 分(至關重要)[8]。在第一輪德爾菲調查中,參與者可建議將新的報告條目納入到第二輪調查中。在第二輪調查中,給參與第一輪的所有參與者展示每個條目的回復數量和分數分布情況,不同相關方分別提供,連同自己在內的第一輪的評分。第一輪德爾菲調查中建議增加的 9 個報告條目,也用于第二輪評分。根據前期規定[8],每個相關方至少 70% 的投票參與者評分在 7~9 分之間,則被認為達成共識。25 名 COS 制定者、107 名 COS 使用者、40 名醫學期刊編輯和 11 名患者代表參與了兩輪德爾菲研究,其中 13 人曾參與過臨床指南制定。因第二輪的反饋是按組表述的,則每個利益相關群體反饋人數變化不會影響結果。德爾菲過程運用 COMET()開發的 DelphiManager 軟件進行控制和管理。兩輪德爾菲研究的匿名數據,按照利益相關組逐項列出,可在“S1 Delphi Data”中獲取。
共識會議已于 2016 年 1 月在英國倫敦舉行,為期一天,共有 17 名國際代表參加,包括 6 名 COS 制定者、4 名醫學期刊編輯、5 名 COS 使用者[1 名試驗者、2 名 Cochrane 系統評價協作編輯和 2 名臨床指南制定者]和 2 名患者代表。參會個人的遴選和邀請使用以下寬泛的原則:① 完成兩輪德爾菲過程的參與者;② 四個利益相關者群體之間保持平衡;③ 使用德爾菲調查方法與使用其他方法的 COS 制定者之間保持平衡;④ 試驗者、系統評價員及指南制定者等 COS 使用者之間保持平衡;⑤ 合理的地理分布。最初的邀請是由作者根據他們個人的專業知識確定的。如果某個人不能參加,將盡可能地讓來自相同利益相關群體的其他人來代替。
每個參與者的作用不存在沖突,綜合了臨床與方法學經驗。會議的目的是對 57 個潛在重要的可能納入 COS-STAR 清單的報告條目進行討論并投票表決。3 名額外的參與者(一名推廣員和兩名記錄員)出席了會議,但沒有參加討論或投票。
所有 57 個報告條目的德爾菲結果在會前和會議期間均提供給共識會議代表(S1 Consensus Matrix Delphi)。共識會議的幻燈片展示了每個利益相關者群體的應答率、地理分布和第二輪德爾菲結果,可在 S1 Consensus Meeting Presentation 中獲取。雖然調查的回復率低,但超過 86%(183/214)的第一輪參與者完成了第二輪,并且兩輪間沒有失訪偏倚的證據(S1 Consensus Meeting Presentation)。
不能參加會議的 COS-STAR 工作組成員(研究作者)需要提前聯系與他們討論結果,他們的意見會被記錄并納入會議討論。每個可能報告條目的德爾菲結果介紹后,接著參會代表進行討論并投票,如果超過 70% 的投票者(17 個投票者中至少 12 個)打分在 7~9 分之間,則保留該條目。投票使用 OMBEA 應答系統()進行。在討論共識過程第二個條目時,“介紹起初呈遞給參與者的共識過程信息”,一位代表提出缺少一個倫理審批相關條目。工作組同意就此進行表決,并達成一致意見,故將此條目列入報告指南(S1Consensus Meeting Critical Scores)。因在 COS 形成過程中納入患者參與不斷增加,所以這個問題變得更具實質意義。
管理工作組考慮報告清單格式的討論。確認了與 COS 報告相關的必要條目,不論是為有效性試驗、系統評價還是常規治療形成的 COS 都要滿足。鑒于以前報告指南形成的經驗,會上代表提出了一個警示:避免第一個指南太過嚴格導致制定者不使用的風險增加。一些報告條目需要合并,增加一些子條目,以及建議另列一份解釋性文件來提高。最終 COS-STAR 清單的有效性都得到考慮。具體來說,會后 COS-STAR 工作組做了以下修改:
(1)參與者(方法):這個主題下的四個條目存在交叉。建議被提出并被工作組采納,用一個包括“誰、如何以及為什么”的條目更有價值。
(2)共識過程:普遍認為,雖然主題下的五個條目都可以提供有用的信息,但有些條目太具體而無需納入,承認沒有金標準的途徑。工作組提出并接受了這個建議,認為一個條目包括共識過程的描述更容易被參考使用。
(3)指標打分:建議將兩方面都包括到單個條目中。
(4)參與者(結果部分):建議將一些問題都合并到單個條目中。
(5)指標結果:普遍認為,因許多條目過于詳細,應該合并到一起。這些問題在解釋性文件中詳細闡述(S1 Explanation and Elaboration)。
(6)局限性:一致認為,納入一個與局限性有關的條目并在解釋性文件中提供例子的做法較好。
會后,COS-STAR 清單草案被發給 COS-STAR 工作組和其他共識會議參會者。考慮了所有評論和修改意見,清單也作了相應地修訂。經過多次反饋收集和清單完善的過程,直到不需要進一步改變。
最終清單條目的合理性得到兩位指南制定專家(Douglas G. Altman,David Moher)的審查。檢測由兩個正撰寫 COS 研究報告的 COS 制定者執行。正在制定 COS 的兩名研究人員也審閱了該聲明。測試人員獨立于 COS-STAR 制定過程。這次測試反饋支持 COS-STAR 清單的最終版本。
5 COS-STAR 聲明
表 1 中所提供的 18 個條目的 COS-STAR 清單適用于 COS 制定研究,其目的是決定 COS 應納入哪些結局指標,但不包括這些指標如何定義或測量等工作的報告。這份清單旨在涵蓋此類研究最少的報告要求,包括背景、領域、方法、結果、結論和局限性。在配套的解釋性文件中(S1 Explanation and Elaboration),為每個清單條目的含義和合理性提供了說明。這份清單設計注重實用性,對在之前的系統評價中已經確定的問題不做限制[4],如 COS 形成共識的方法學(包括混合方法)和結局指標選擇可能涉及的各參與群體(包括患者代表)。COS-STAR 清單為 COS 研究最小的報告提供指導,但在某些情況下,研究作者可酌情增加額外的報告條目。例如,如果研究者認為重要,可能希望描述確定如何測量核心結局指標的步驟[9]。

6 討論
COS-STAR 清單的形成運用了制定醫學報告指南推薦的方法[6]。COS-STAR 清單的目的是提高 COS 研究報告的透明性和完整性,以便 COS 使用者能夠判斷這個推薦的集合是否與他們的工作相關。例如,盡管 COS 的范圍描述日益充分[1],但是仍需改進以便最大限度推廣應用并不斷評估。
制定 COS-STAR 配套解釋文件(S1 Explanation and Elaboration),提供每個 COS-STAR 清單條目的解釋和良好報告實踐框架,并配以實例為有興趣開展 COS 研究和報告形成工作的研究者服務。格式與其他解釋性文件[10,11]中使用的格式類似。解釋性文件還描述了計劃好的 COS-STAR 聲明的認可和推廣應用策略。
COS-STAR 不是質量評估工具,也不應用于這方面,例如,比較類似 COS 相關性研究的正確性。同樣,該清單也不推薦 COS 研究項目中達成共識應該使用的方法學或納入哪些利益相關群體。這些問題的相關指導可以在其他地方找到[2,12]。例如,有幾個研究已經考慮制定兒童哮喘相關的 COS,每個研究使用不同的方法且產生了具有輕微差異的核心結局指標[13-16]。盡管 COS-STAR 聲明可能有助于對已發表的 COS 進行嚴格的評價,但其不能從不同 COS 中區分哪個應該被使用。
與經過多次修訂的類似報告指南[17]一樣,COS-STAR 是一個不斷發展的指南,未來可能需要更好地完善。共識會議代表承認:對考慮納入或排除一些與報告條目相關的經驗證據和方法學發展方面還有很多不足,這些問題今后需要更好地關注。例如,有證據表明,反饋方法確實會影響人們如何為結局指標評分[18],這或許表明這是重要的報告信息。然而,該條目被從報告清單中排除,除非有更好的關于 COS 制定者應該如何表述反饋的指南。
隨著具有相關利益和經驗的新利益相關方出現,該指南可能也需要修正。例如,監管機構最近建議在哮喘患者的相關醫療產品的試驗中使用 COS[19],這可能促進對聲明提出反饋意見。德爾菲調查與共識會議的參與人員是 COS 研究形成者代表,他們的地理分布主要是在北美和歐洲[4]。這是一個公認缺陷,因為 COS 研究和本報告指南都應該考慮到低收入與中等收入國家的關聯性。邀請患者代表參加,而不是患者。由于這是一個相對復雜的方法領域,選擇對 COS 形成參與有一定程度了解的人員,因此需要加強他們的理解。隨著 COS 形成研究中患者關注和參與程度增加,他們對未來修訂本報告指南的貢獻將會被尋求。COMET 倡議的一個重要目標是促進更廣泛的參與。
雖然德爾菲邀請的接受率可能較低,但每個利益相關者群體第二輪的參與度高達 85% 以上,且沒有失訪偏倚證據(S1Consensus Meeting Presentation)。邀請讀者通過 COMET 網站()提出評論、批評、經驗和見解,這些會被考慮用于將來完善 COS-STAR 聲明。
1 前言
臨床試驗的結局指標沒有得到足夠的重視,對這個問題的認識也不斷加深。如果研究結果要影響實踐和未來研究,其結局指標需要與衛生服務使用者和其他衛生保健決策者緊密相關。此外,結局指標報告偏倚,即根據結果選擇納入試驗報告的結局指標,已被確定是影響發表數據解讀的一個問題。
核心結局指標集(core outcome set,COS)的形成與實施,目前引起了衛生研究所有領域越來越多的關注[1],并與全球范圍內的研究實踐密切相關。一項最新調查顯示,目前一些試驗者、系統評價員和指南制定者(COS 使用者)將 COS 研究作為工作中結局指標選擇的起點[1]。COS 的使用可幫助提高指標測量的一致性,并能夠減少結局指標報告偏倚。而報告偏倚會導致研究實施和報告過程中的大量不必要的浪費[2]。
新近一篇系統評價確認已有 200 多個發表的 COS 研究[1],并且還有許多已知的在研 COS 研究[3]。COS 形成的第一步應該是“測量什么”,而“如何做”和“何時做”通常是下一步。COS 的價值在很大程度上取決于它“為什么做”和“如何做”。COS 制定工作組的可靠性,與他們指標評價的經驗和如何讓主要利益相關群體參與制定過程相關,這會影響到 COS 的后續采用。此外,COS 形成研究的報告質量也影響其推行。最近研究顯示,目前的報告質量參差不齊[4],限制了臨床試驗者、系統評價員和指南制定者等 COS 潛在用戶評估與他們自己工作相關性的能力。
核心結局指標集之前被定義是健康或衛生保健特定領域中所有臨床試驗都必須測量和報告的,最小的、公認的、標準化的指標集合[2]。COS 正在研究用于臨床試驗以外的領域。盡管先前制定了關于 COS 研究中德爾菲調查的報告建議[5],但因在 COS 形成過程中包含了其他各種方法和內容,故也應及時廣泛收集這一領域漸增的活動共識[1]。在本文中,我們介紹了一個研究項目的結果,其目標是采用“提高衛生研究質量和透明度網絡”(Enhancing the QUAlity and Transparency Of health Research,EQUATOR)[6]提供的方法制定 COS 形成研究的報告指南(Core Outcome Set-Standards for Reporting,COS-STAR)。報告清單不僅關乎 COS 形成中使用的共識方法,還可以應用于有效性試驗、系統評價或常規治療的 COS 形成[7]。
2 術語
一個核心指標集描述了在特定研究或實踐環境中應該測量的內容,下一步需要確定如何界定或測量每個結局指標。僅有 38% 的已發表研究中含有測量 COS 結局指標的推薦意見[4]。制定這個報告指南是為解決形成 COS 的第一階段問題,即應該測量什么。
3 倫理審批
本研究已咨詢利物浦大學倫理委員會并通過倫理批準(參考 RETH000841)。如果參與者回復了德爾菲調查或同意參加共識會議,則被認為是已知情同意。
4 COS-STAR 聲明的形成
一份概述了 COS-STAR 研究中德爾菲過程的完整方案已經發表[8],包括提供一份配套的解釋和闡釋的文檔(Explanation and Elaboration,E+E)的意向,其中給出了每個清單條目的含義和合理性。
初始清單包括 48 個報告條目,產生于以前一個關于 COS 研究的系統評價,包括德爾菲調查[5]、制定 COS 的個人經驗以及項目管理工作組報告(COS-STAR 工作組)。這份包括潛在報告條目的初始清單被納入到一個國際性的兩輪德爾菲調查中,以確定這些報告條目的重要性。
德爾菲調查涉及四個主要利益相關者群體,他們將參與到 COS 形成、報告和應用等方面。邀請函通過電子郵件發送到:(1)在核心指標集有效性試驗數據庫(Core Outcome Measures in Effectiveness Trials,COMET,www.comet-initiative.org)中已發表的 196 個 COS 研究的主要作者,并請他們將邀請函轉發給參與的所有方法學家;(2)250 種發表過 COS 研究和 70 種涉及女性健康(CoRe Outcomes in WomeN’s health,CROWN,)核心指標的期刊編輯,主動支持采用 COS;(3)COS 潛在用戶:① 商業或非商業、在 clinicaltrials.gov 數據庫注冊(來自 8 449 項注冊試驗的 20% 隨機樣本)的開放性 III/IV 期試驗主要研究者,② 來自 53 個 Cochrane 評價小組的 76 位協調編輯;(4)33 名患者代表,先前參加過 COMET 專題會和 COMET 公眾與患者參與、介入或協同工作組(Public and Patient Participation,Involvement and Engagement,PoPPIE)。邀請在指南國際協作網網站()上列出的臨床指南制定者參與的可行性不大,因為他們是成員組織。因此調查問卷中增加了涉及臨床指南制定的問題作為替代辦法。目的是從每個利益相關者群體中招聘盡可能多的人員來進行德爾菲調查。給參與者發送一封個性化電子郵件,概述項目情況-類似于研究計劃中的描述和 COS 研究的第一個系統評價[4]。
德爾菲參與者評價每個報告條目的重要性,方案中界定尺度從 1 分(不重要)到 9 分(至關重要)[8]。在第一輪德爾菲調查中,參與者可建議將新的報告條目納入到第二輪調查中。在第二輪調查中,給參與第一輪的所有參與者展示每個條目的回復數量和分數分布情況,不同相關方分別提供,連同自己在內的第一輪的評分。第一輪德爾菲調查中建議增加的 9 個報告條目,也用于第二輪評分。根據前期規定[8],每個相關方至少 70% 的投票參與者評分在 7~9 分之間,則被認為達成共識。25 名 COS 制定者、107 名 COS 使用者、40 名醫學期刊編輯和 11 名患者代表參與了兩輪德爾菲研究,其中 13 人曾參與過臨床指南制定。因第二輪的反饋是按組表述的,則每個利益相關群體反饋人數變化不會影響結果。德爾菲過程運用 COMET()開發的 DelphiManager 軟件進行控制和管理。兩輪德爾菲研究的匿名數據,按照利益相關組逐項列出,可在“S1 Delphi Data”中獲取。
共識會議已于 2016 年 1 月在英國倫敦舉行,為期一天,共有 17 名國際代表參加,包括 6 名 COS 制定者、4 名醫學期刊編輯、5 名 COS 使用者[1 名試驗者、2 名 Cochrane 系統評價協作編輯和 2 名臨床指南制定者]和 2 名患者代表。參會個人的遴選和邀請使用以下寬泛的原則:① 完成兩輪德爾菲過程的參與者;② 四個利益相關者群體之間保持平衡;③ 使用德爾菲調查方法與使用其他方法的 COS 制定者之間保持平衡;④ 試驗者、系統評價員及指南制定者等 COS 使用者之間保持平衡;⑤ 合理的地理分布。最初的邀請是由作者根據他們個人的專業知識確定的。如果某個人不能參加,將盡可能地讓來自相同利益相關群體的其他人來代替。
每個參與者的作用不存在沖突,綜合了臨床與方法學經驗。會議的目的是對 57 個潛在重要的可能納入 COS-STAR 清單的報告條目進行討論并投票表決。3 名額外的參與者(一名推廣員和兩名記錄員)出席了會議,但沒有參加討論或投票。
所有 57 個報告條目的德爾菲結果在會前和會議期間均提供給共識會議代表(S1 Consensus Matrix Delphi)。共識會議的幻燈片展示了每個利益相關者群體的應答率、地理分布和第二輪德爾菲結果,可在 S1 Consensus Meeting Presentation 中獲取。雖然調查的回復率低,但超過 86%(183/214)的第一輪參與者完成了第二輪,并且兩輪間沒有失訪偏倚的證據(S1 Consensus Meeting Presentation)。
不能參加會議的 COS-STAR 工作組成員(研究作者)需要提前聯系與他們討論結果,他們的意見會被記錄并納入會議討論。每個可能報告條目的德爾菲結果介紹后,接著參會代表進行討論并投票,如果超過 70% 的投票者(17 個投票者中至少 12 個)打分在 7~9 分之間,則保留該條目。投票使用 OMBEA 應答系統()進行。在討論共識過程第二個條目時,“介紹起初呈遞給參與者的共識過程信息”,一位代表提出缺少一個倫理審批相關條目。工作組同意就此進行表決,并達成一致意見,故將此條目列入報告指南(S1Consensus Meeting Critical Scores)。因在 COS 形成過程中納入患者參與不斷增加,所以這個問題變得更具實質意義。
管理工作組考慮報告清單格式的討論。確認了與 COS 報告相關的必要條目,不論是為有效性試驗、系統評價還是常規治療形成的 COS 都要滿足。鑒于以前報告指南形成的經驗,會上代表提出了一個警示:避免第一個指南太過嚴格導致制定者不使用的風險增加。一些報告條目需要合并,增加一些子條目,以及建議另列一份解釋性文件來提高。最終 COS-STAR 清單的有效性都得到考慮。具體來說,會后 COS-STAR 工作組做了以下修改:
(1)參與者(方法):這個主題下的四個條目存在交叉。建議被提出并被工作組采納,用一個包括“誰、如何以及為什么”的條目更有價值。
(2)共識過程:普遍認為,雖然主題下的五個條目都可以提供有用的信息,但有些條目太具體而無需納入,承認沒有金標準的途徑。工作組提出并接受了這個建議,認為一個條目包括共識過程的描述更容易被參考使用。
(3)指標打分:建議將兩方面都包括到單個條目中。
(4)參與者(結果部分):建議將一些問題都合并到單個條目中。
(5)指標結果:普遍認為,因許多條目過于詳細,應該合并到一起。這些問題在解釋性文件中詳細闡述(S1 Explanation and Elaboration)。
(6)局限性:一致認為,納入一個與局限性有關的條目并在解釋性文件中提供例子的做法較好。
會后,COS-STAR 清單草案被發給 COS-STAR 工作組和其他共識會議參會者。考慮了所有評論和修改意見,清單也作了相應地修訂。經過多次反饋收集和清單完善的過程,直到不需要進一步改變。
最終清單條目的合理性得到兩位指南制定專家(Douglas G. Altman,David Moher)的審查。檢測由兩個正撰寫 COS 研究報告的 COS 制定者執行。正在制定 COS 的兩名研究人員也審閱了該聲明。測試人員獨立于 COS-STAR 制定過程。這次測試反饋支持 COS-STAR 清單的最終版本。
5 COS-STAR 聲明
表 1 中所提供的 18 個條目的 COS-STAR 清單適用于 COS 制定研究,其目的是決定 COS 應納入哪些結局指標,但不包括這些指標如何定義或測量等工作的報告。這份清單旨在涵蓋此類研究最少的報告要求,包括背景、領域、方法、結果、結論和局限性。在配套的解釋性文件中(S1 Explanation and Elaboration),為每個清單條目的含義和合理性提供了說明。這份清單設計注重實用性,對在之前的系統評價中已經確定的問題不做限制[4],如 COS 形成共識的方法學(包括混合方法)和結局指標選擇可能涉及的各參與群體(包括患者代表)。COS-STAR 清單為 COS 研究最小的報告提供指導,但在某些情況下,研究作者可酌情增加額外的報告條目。例如,如果研究者認為重要,可能希望描述確定如何測量核心結局指標的步驟[9]。

6 討論
COS-STAR 清單的形成運用了制定醫學報告指南推薦的方法[6]。COS-STAR 清單的目的是提高 COS 研究報告的透明性和完整性,以便 COS 使用者能夠判斷這個推薦的集合是否與他們的工作相關。例如,盡管 COS 的范圍描述日益充分[1],但是仍需改進以便最大限度推廣應用并不斷評估。
制定 COS-STAR 配套解釋文件(S1 Explanation and Elaboration),提供每個 COS-STAR 清單條目的解釋和良好報告實踐框架,并配以實例為有興趣開展 COS 研究和報告形成工作的研究者服務。格式與其他解釋性文件[10,11]中使用的格式類似。解釋性文件還描述了計劃好的 COS-STAR 聲明的認可和推廣應用策略。
COS-STAR 不是質量評估工具,也不應用于這方面,例如,比較類似 COS 相關性研究的正確性。同樣,該清單也不推薦 COS 研究項目中達成共識應該使用的方法學或納入哪些利益相關群體。這些問題的相關指導可以在其他地方找到[2,12]。例如,有幾個研究已經考慮制定兒童哮喘相關的 COS,每個研究使用不同的方法且產生了具有輕微差異的核心結局指標[13-16]。盡管 COS-STAR 聲明可能有助于對已發表的 COS 進行嚴格的評價,但其不能從不同 COS 中區分哪個應該被使用。
與經過多次修訂的類似報告指南[17]一樣,COS-STAR 是一個不斷發展的指南,未來可能需要更好地完善。共識會議代表承認:對考慮納入或排除一些與報告條目相關的經驗證據和方法學發展方面還有很多不足,這些問題今后需要更好地關注。例如,有證據表明,反饋方法確實會影響人們如何為結局指標評分[18],這或許表明這是重要的報告信息。然而,該條目被從報告清單中排除,除非有更好的關于 COS 制定者應該如何表述反饋的指南。
隨著具有相關利益和經驗的新利益相關方出現,該指南可能也需要修正。例如,監管機構最近建議在哮喘患者的相關醫療產品的試驗中使用 COS[19],這可能促進對聲明提出反饋意見。德爾菲調查與共識會議的參與人員是 COS 研究形成者代表,他們的地理分布主要是在北美和歐洲[4]。這是一個公認缺陷,因為 COS 研究和本報告指南都應該考慮到低收入與中等收入國家的關聯性。邀請患者代表參加,而不是患者。由于這是一個相對復雜的方法領域,選擇對 COS 形成參與有一定程度了解的人員,因此需要加強他們的理解。隨著 COS 形成研究中患者關注和參與程度增加,他們對未來修訂本報告指南的貢獻將會被尋求。COMET 倡議的一個重要目標是促進更廣泛的參與。
雖然德爾菲邀請的接受率可能較低,但每個利益相關者群體第二輪的參與度高達 85% 以上,且沒有失訪偏倚證據(S1Consensus Meeting Presentation)。邀請讀者通過 COMET 網站()提出評論、批評、經驗和見解,這些會被考慮用于將來完善 COS-STAR 聲明。