引用本文: 張明妍, 張俊華, 杜亮, 張永剛, 楊豐文, 馮睿, 季昭臣, 譯. 譯文:核心指標集研制標準:COS-STAD 推薦. 中國循證醫學雜志, 2018, 18(7): 753-757. doi: 10.7507/1672-2531.201802007 復制
1 前言
想要使研究結果具有實用性、可靠性,并且與患者、醫療專業人員以及其他醫療供給決策者息息相關,那么科學界需要高度重視在臨床試驗和系統評價中選擇恰當的結局指標。核心指標集(Core Outcome Sets,COS)是一組在特定健康或保健領域中所有臨床試驗均應該測量和報告的最小的、共識的標準化指標集合[1]。制定 COS 的主要原因,是提高相似臨床試驗的可比性、減少結局指標選擇性報告以及增加試驗和系統評價結果相關性的需求。
“有效性試驗核心結局指標(the Core Outcome Measures in Effectiveness Trials,COMET)”組織,系統檢索到數百個已經發布的 COS 研究[2-4],且已有 150 多個正在進行或計劃開展的 COS 研究注冊在一個免費、公開、可檢索的數據庫中[5]。雖然之前已經描述了 COS 形成中需要考慮的問題[1],但高質量 COS 的要點,還沒有通過一個涵蓋所有相關利益相關群體的系統過程來確定。COMET 系統評價[2-4]已經涵蓋了 COS 形成中幾個方面的變量,包括范圍、相關方和共識過程。
定義 COS 的質量并不那么簡單。原則上,一個“好的”COS 在實施后可以引導改善患者的結局,但是這個影響力還在研制過程的下游,且不能通過 COS 研制項目信息來評價[6]。本文中,我們介紹了一個關于確定一套 COS 研制的最低標準研究項目的結果。這些標準將幫助 COS 研制者改進他們的方法學,并幫助使用者評估某個 COS 研究的優劣。
2 COS-STAD 推薦規范的應用范圍
盡管已開始出現 COS 研制的經驗性證據,但目前還沒有研制 COS 的金標準方法[6]。鑒于在 COMET 數據庫中注冊的新 COS 研究數量,以及 COS 研制經驗越來越多,現在評估是否能達成有關 COS 設計原則的國際共識的時機已成熟。COS-STAD 項目的目的是確定 COS 研制的最低標準,且不管具體選擇哪種共識方法,最低標準都能夠被公認和應用。COS-STAD 推薦涉及到 COS 研制過程和需求確定的假設[6],適應于所有 COS,不論何種醫療保健領域,也無論 COS 研制是用于有效性試驗、系統評價還是日常照護。與“核心指標集報告規范”(Core Outcome Set-STAndards for Reporting,COS-STAR)平行[7],COS-STAD 推薦是為了解決 COS 研制的第一階段,即在測量什么方面取得共識,同時明確一個 COS 應描述在特定的研究或實踐環境中應該測量什么,以及后續工作需要確定如何定義或測量每個指標。COS-STAD 和 COS-STAR 的區別在于 COS-STAD 重點是 COS 研制過程相關的設計原則,而 COS-STAR 重在 COS 研制研究的報告。
3 倫理批準
COS-STAR 研究通過快速審查協議(參考 RETH000841)獲取了倫理批準。由于參與者篩選和參加 COS-STAD 的過程與 COS-STAR 相同,因此未進行單獨的研究倫理審批。如果參與者回復了調查問卷,被認為是知情同意。
4 COS-STAD 推薦的形成
研究組成員(COS-STAR 作者和共識會議參與者)被邀請參與在線問卷調查,闡述他們認為研制一個 COS 需要考慮的最重要的方面。將 COS-STAR 報告指南條目提供給參與者作為組織可能性建議的框架。問卷調查的問題為:“請列出你認為研制一個 COS 重要的‘最低標準’”。每個反饋者可以提供他或她所希望的所有條目。所有的反饋都會由兩位經驗豐富的 COS 研制者(JJK 和 PRW)分別進行審查,剔除相同的建議,并將余下的建議按域歸類。同時也會要求反饋者進一步明確含糊或模棱兩可的建議。將參與者的建議轉換成域的過程說明和初步的條目清單見原文附件文件 S1。經與該 COS-STAD 管理組其他核心成員(DGA,JMB,MC 和 ST)討論后,包括 16 個條目的初步清單得到了共識。這些條目包括 3 個領域:范圍(4 個條目)、參與方(4 個條目)和共識過程(8 個條目)。
該初步清單被用于涉及 4 個主要利益相關方的德爾菲(Delphi)調查,詳見表 1。參與者會收到一封個性化的電子郵件,并附有問卷的鏈接、一份 COS-STAR 報告指南[7]以及首次更新的 COS 研究系統評價[3]。在展開調查之前,為了確認語言的可讀性,所有 Delphi 調查文本都經過 COMET PoPPIE(Patient Participation,Involvement and Engagement)協調員審定。

Delphi 調查參與者根據每個候選條目的重要程度從 1 分(不重要)到 9 分(關鍵)進行打分。在第一輪 Delphi 調查中,參與者可建議新的、可能納入到第二輪調查中的條目,但也要求不要推薦與改善研究操作相關的一般條目(例如,獲取倫理批準)。在第二輪調查中,給第一輪的所有參與者展示每個條目的回復數量和每個條目分數的分布情況,以及自己的第一輪評分。且按不同利益參與方分別提供,單獨呈現 3 個 COS 用戶組的數據。在第一輪中提出的 4 個附加條目列入到第二輪中進行評分;文件 S2 中列出了第一輪調查中建議增加而未被納入第二輪調查的條目的完整列表及不納入的理由。事先確定達成共識的標準:即每個利益相關方至少 70% 的參與投票者評分在 7~9 分之間。103 名 COS 研制者、83 名 COS 使用者(31 名系統評價者、41 名試驗研究者以及 11 名臨床指南制定者)、36 名醫學雜志編輯和 11 名患者代表參與了兩輪 Delphi 研究。Delphi 過程運用 COMET 工作組[13]開發的 Delphi Manager 軟件進行在線控制和管理。兩輪 Delphi 研究按照利益參與方分組排列的匿名數據可在 S1 Data 中獲取。
最終 8 個條目被全部利益相關方達成共識,自動進入 COS-STAD 推薦的最終集合中。COS-STAD 管理組成員每人有一份結果總結(原文附件 S1 表),他們對利益相關方沒有達成共識的剩余 12 個條目進行獨立思考,并投票決定這些條目是否應該列入最后的標準集合中。投票結束后,2 個條目通過所有 COS-STAD 管理組成員的支持被納入標準的終集,6 個條目被排除。剩余條目則通過討論來決定,又有 1 個條目被納入,3 個條目被排除。投票和討論過程摘要可見原文附件表 S2。
2017 年 3 月,15 位博士生測試了 COS 研制最低標準的實用性,這也是利物浦大學與歐洲聯合博士生項目共同舉辦的研究方法學培訓的一部分[14]。所有的學生均沒有參與過 COS-STAD 研制過程,他們以小組形式評估已發布的 COS 對最低標準的遵守情況[15]。他們也被要求對 COS-STAD 的內容、格式和實用性提出意見。這次測試的反饋表明,如果用該標準評估 COS 的研究者能夠事先了解 COS 研究過程相關的論文,包括研究方案(如果有的話),將大有幫助。
5 COS-STAD 推薦
表 2 中列出 11 條最低標準。適用于以決定哪些指標應列入 COS 為目的的研究。該標準不解決指標應該如何定義和測量,因為關于這個過程的指南已經存在[16]。這份規范涉及 COS 研制過程的三個方面:范圍、參與方和共識過程。

5.1 具體范圍
具體范圍應該根據 COS 被應用的研究或實踐場景進行確定(條目 1),包括健康問題(條目 2),目標人群(條目 3)和干預措施(條目 4)。關于 COS 的范圍寬窄,沒有制定推薦或規范,但該規范強調必須考慮和明確以上 4 個部分。例如,COS 研制者需要決定 COS 是用于研究、日常照護還是兩者均可(條目 1)。健康問題(條目 2)可能是寬泛的,比如,所有的癌癥,或者更具體的,如前列腺癌。COS(條目 3)涵蓋的人群可能是所有患有某種疾病的患者,或可能是一個特定亞組,比如局部或晚期的前列腺癌患者。最后,COS 研制者需要考慮并明確該 COS 是用于對疾病有益的所有干預措施,還是僅適用于特定的干預類型,如手術、藥物或醫療器械(條目 4)。在共識過程之初定義好 COS 的范圍,會減少后續因目標不清可能導致的困難。一份明確的說明還將幫助潛在使用者決定該 COS 與他們工作的相關性。
5.2 相關參與方
在 COS 的形成過程中,3 個參與方小組已被確定為 COS 研制中必須具備的最低要求,包括:在研究中會使用到 COS 的群體(條目 5)、醫療專業人員(條目 6)以及患者或他們的代表(條目 7)。臨床試驗人員是在研究場景下將使用 COS 的代表。醫療專業人員是那些直接參與照護或管理 COS 研制所涉及病種患者的人員。另外,為了讓 COS 中涵蓋與患者和護理人員最相關的結局指標,COS 研制過程中納入患者和護理人員至關重要。
5.3 共識過程透明化
為評估 COS 推薦是否是在嚴格、無偏倚的條件下制定的,共識過程中的透明度則十分重要。有關共識過程的標準涉及 4 個方面。共識過程中考慮的結局指標應該反映所有相關方的觀點(條目 8)。COS 研制者因此可能需要考慮結合多種產生初始結局指標清單的方法:例如,來源于已發表臨床試驗的指標清單,可以通過對調研患者意見的定性研究的綜述或患者訪談信息來加以補充。事先確定評分體系和共識定義(條目 9),可以降低由于看到結果后改變標準帶來的偏倚風險。過于寬泛的共識標準可能會產生過長的指標清單,則可能會讓潛在使用者認為不是一個核心指標集;而過于嚴格的標準則可能導致關鍵指標達不到納入域值。同樣的,納入、剔除和增加指標的標準應該提前確定好(條目 10)。描述核心指標集中每個潛在指標的語言應該明確(條目 11)。在審議語言時,應該充分考慮共識過程參與者及潛在使用者都能正確理解,這可能需要既使用通俗的語言描述,也使用醫學術語,并要進行語言理解的預測試。
6 討論
我們制定 COS-STAD 推薦的初衷是鼓勵研究人員至少達到研制 COS 的最低標準,并幫助使用者評價某 COS 是否可以在實踐中采用。那些想評估和使用已發布的 COS 的人員需要根據自身的目標需求,去判斷 COS(范圍)的適用性。COS-STAD 推薦是最低標準,不限制 COS 研制者關于其他方面的方法應用。例如,如果研制者認為一些群體與 COS 的研制具有相關性,則應該納入這些額外的參與方。不管采用什么共識方法,在研制 COS 的過程中應遵循最低標準的相關原則。關于 COS 研究達成共識的不同方法及當前關于共識過程的各方面的具體證據在 COMET 手冊中可以查到[6]。
在完成 Delphi 調查后,20 個候選條目中有 8 個達成了共識。COS-STAD 管理工作組投票并討論了剩下的 12 個條目,最終認為還應納入另外 2 個條目,理由是大多數利益相關方同意或非常一致地認為這些條目非常關鍵。為與指標評分過程相關的條目保持一致,增加了與納入、剔除、添加指標相關的條目。事先明確定義共識、評分標準以及納入、剔除、添加指標的標準(分別為條目 9 和 10),能夠提高方法學報告的透明度,并有助于避免在結果分析以后更改標準。
雖然保證 COS 研制項目的方案可公開獲取未被共識成為一個最低標準,但研究方案的可公開獲取會提高 COS 研制過程的透明度。一般而言,好的研究在研究開始之前就設計了方案并使其可在合適的平臺上公開獲取。在共識定義中如何考慮多個參與方的觀點,以及在決定納入、剔除、填加結局指標的共識過程中如何考慮多方觀點,這兩個條目沒有被納入到最后的推薦條目中。雖然這兩個條目在 Delphi 調查中被一些參與方認為很重要,但 COS-STAD 管理工作組沒有明確采用,因為這兩條已經被涵蓋在條目 9 和 10 中。最后,Delphi 調查第一輪中的一些參與者建議增加一個條目,即應該適用系統評價獲得有可能被納入共識過程的指標條目。這一條被納入到 Delphi 調查第二輪評分中,但僅有一半的參與組達成共識。COS-STAD 管理組討論了該條目,但最終沒有采納,因為有人認為,雖然系統評價可能是可取的,但如果缺乏證據證明,其他形式的綜述或者初始指標清單的收集是不夠的,尚不能認為這個條目是必要的。
COS-STAD 重在 COS 研制過程的主要設計原則,而 COS-STAR[7]則專門用于 COS 研究的報告。雖然 COS-STAD 可能會在 COS 研制項目開始時使用,而 COS-STAR 在完成時使用,但這兩份指導文件間存在協同作用。比如,應該報告重要的設計原則,因為是方法學的一部分。應讓 COS-STAD 參與者在產生初始條目清單的時候,就考慮使用 COS-STAR 報告指南。我們已經能夠提供一套符合相關報告指南的最低標準。很明顯,現已發表的 COS 研究很少能符合這 11 條標準。COS 方法和共識方法過去幾年已經制定。例如,患者或其代表的參與是一個需要改善的領域[4]。與其啟動新的 COS 研究,不如進行添補工作來補充現有的 COS,例如,在那些最初沒有納入患者的 COS 研究中加入患者,可以改善現有工作,進而符合現有的最低標準。
COS-STAD 可能對于那些在同一個衛生保健領域中有多個 COS 發表的使用者有幫助。例如,兒童哮喘至少有 4 個 COS 研究,每一個都使用不同的方法,使得形成的 COS 產生了細微差異[17-20]。
雖然 Delphi 邀請的接受率可能較低(表 1),但是所有參與者繼續參加第二輪調查的比例很高,沒有減員偏倚的證據。根據 Delphi 的結果,COS-STAD 管理組決定了最終的一套最低標準。把專家召集到一起召開正式的共識會議來討論一小部分條目并不值得,尤其是要考慮管理組的專家需要覆蓋除患者外的所有利益相關方。為了解決這個局限,我們打算通過 COMET PoPPIE 工作組積極向患者組織傳播最低標準,并鼓勵他們提供反饋意見。
人們越來越關注一些 COS 與中、低收入國家研究的相關性,因為這些地域 COS 研究的參與者較少。研制 COS 研究參與者較多的地域主要是美國、英國、加拿大和其他歐洲國家[21]。在 COS-STAD 研究中,我們確實從全球名單中邀請參與者,但我們并沒有收集這項研究回復者的地理位置信息。我們沒有理由認為 COS-STAD 推薦涵蓋的設計原則不適用于所有國家。
我們歡迎有關 COS-STAD 注意事項的反饋意見。未來的工作計劃將探索是否可以制定標準用于鑒別那些已經完成的 COS 是否采用了高質量方法。歡迎讀者提出評論,特別是那些基于經驗和研究證據的意見和建議,通過 COMET 網站[22],這些反饋意見將被考慮今后用于改進本次推薦。
參考文獻及附件(略)
1 前言
想要使研究結果具有實用性、可靠性,并且與患者、醫療專業人員以及其他醫療供給決策者息息相關,那么科學界需要高度重視在臨床試驗和系統評價中選擇恰當的結局指標。核心指標集(Core Outcome Sets,COS)是一組在特定健康或保健領域中所有臨床試驗均應該測量和報告的最小的、共識的標準化指標集合[1]。制定 COS 的主要原因,是提高相似臨床試驗的可比性、減少結局指標選擇性報告以及增加試驗和系統評價結果相關性的需求。
“有效性試驗核心結局指標(the Core Outcome Measures in Effectiveness Trials,COMET)”組織,系統檢索到數百個已經發布的 COS 研究[2-4],且已有 150 多個正在進行或計劃開展的 COS 研究注冊在一個免費、公開、可檢索的數據庫中[5]。雖然之前已經描述了 COS 形成中需要考慮的問題[1],但高質量 COS 的要點,還沒有通過一個涵蓋所有相關利益相關群體的系統過程來確定。COMET 系統評價[2-4]已經涵蓋了 COS 形成中幾個方面的變量,包括范圍、相關方和共識過程。
定義 COS 的質量并不那么簡單。原則上,一個“好的”COS 在實施后可以引導改善患者的結局,但是這個影響力還在研制過程的下游,且不能通過 COS 研制項目信息來評價[6]。本文中,我們介紹了一個關于確定一套 COS 研制的最低標準研究項目的結果。這些標準將幫助 COS 研制者改進他們的方法學,并幫助使用者評估某個 COS 研究的優劣。
2 COS-STAD 推薦規范的應用范圍
盡管已開始出現 COS 研制的經驗性證據,但目前還沒有研制 COS 的金標準方法[6]。鑒于在 COMET 數據庫中注冊的新 COS 研究數量,以及 COS 研制經驗越來越多,現在評估是否能達成有關 COS 設計原則的國際共識的時機已成熟。COS-STAD 項目的目的是確定 COS 研制的最低標準,且不管具體選擇哪種共識方法,最低標準都能夠被公認和應用。COS-STAD 推薦涉及到 COS 研制過程和需求確定的假設[6],適應于所有 COS,不論何種醫療保健領域,也無論 COS 研制是用于有效性試驗、系統評價還是日常照護。與“核心指標集報告規范”(Core Outcome Set-STAndards for Reporting,COS-STAR)平行[7],COS-STAD 推薦是為了解決 COS 研制的第一階段,即在測量什么方面取得共識,同時明確一個 COS 應描述在特定的研究或實踐環境中應該測量什么,以及后續工作需要確定如何定義或測量每個指標。COS-STAD 和 COS-STAR 的區別在于 COS-STAD 重點是 COS 研制過程相關的設計原則,而 COS-STAR 重在 COS 研制研究的報告。
3 倫理批準
COS-STAR 研究通過快速審查協議(參考 RETH000841)獲取了倫理批準。由于參與者篩選和參加 COS-STAD 的過程與 COS-STAR 相同,因此未進行單獨的研究倫理審批。如果參與者回復了調查問卷,被認為是知情同意。
4 COS-STAD 推薦的形成
研究組成員(COS-STAR 作者和共識會議參與者)被邀請參與在線問卷調查,闡述他們認為研制一個 COS 需要考慮的最重要的方面。將 COS-STAR 報告指南條目提供給參與者作為組織可能性建議的框架。問卷調查的問題為:“請列出你認為研制一個 COS 重要的‘最低標準’”。每個反饋者可以提供他或她所希望的所有條目。所有的反饋都會由兩位經驗豐富的 COS 研制者(JJK 和 PRW)分別進行審查,剔除相同的建議,并將余下的建議按域歸類。同時也會要求反饋者進一步明確含糊或模棱兩可的建議。將參與者的建議轉換成域的過程說明和初步的條目清單見原文附件文件 S1。經與該 COS-STAD 管理組其他核心成員(DGA,JMB,MC 和 ST)討論后,包括 16 個條目的初步清單得到了共識。這些條目包括 3 個領域:范圍(4 個條目)、參與方(4 個條目)和共識過程(8 個條目)。
該初步清單被用于涉及 4 個主要利益相關方的德爾菲(Delphi)調查,詳見表 1。參與者會收到一封個性化的電子郵件,并附有問卷的鏈接、一份 COS-STAR 報告指南[7]以及首次更新的 COS 研究系統評價[3]。在展開調查之前,為了確認語言的可讀性,所有 Delphi 調查文本都經過 COMET PoPPIE(Patient Participation,Involvement and Engagement)協調員審定。

Delphi 調查參與者根據每個候選條目的重要程度從 1 分(不重要)到 9 分(關鍵)進行打分。在第一輪 Delphi 調查中,參與者可建議新的、可能納入到第二輪調查中的條目,但也要求不要推薦與改善研究操作相關的一般條目(例如,獲取倫理批準)。在第二輪調查中,給第一輪的所有參與者展示每個條目的回復數量和每個條目分數的分布情況,以及自己的第一輪評分。且按不同利益參與方分別提供,單獨呈現 3 個 COS 用戶組的數據。在第一輪中提出的 4 個附加條目列入到第二輪中進行評分;文件 S2 中列出了第一輪調查中建議增加而未被納入第二輪調查的條目的完整列表及不納入的理由。事先確定達成共識的標準:即每個利益相關方至少 70% 的參與投票者評分在 7~9 分之間。103 名 COS 研制者、83 名 COS 使用者(31 名系統評價者、41 名試驗研究者以及 11 名臨床指南制定者)、36 名醫學雜志編輯和 11 名患者代表參與了兩輪 Delphi 研究。Delphi 過程運用 COMET 工作組[13]開發的 Delphi Manager 軟件進行在線控制和管理。兩輪 Delphi 研究按照利益參與方分組排列的匿名數據可在 S1 Data 中獲取。
最終 8 個條目被全部利益相關方達成共識,自動進入 COS-STAD 推薦的最終集合中。COS-STAD 管理組成員每人有一份結果總結(原文附件 S1 表),他們對利益相關方沒有達成共識的剩余 12 個條目進行獨立思考,并投票決定這些條目是否應該列入最后的標準集合中。投票結束后,2 個條目通過所有 COS-STAD 管理組成員的支持被納入標準的終集,6 個條目被排除。剩余條目則通過討論來決定,又有 1 個條目被納入,3 個條目被排除。投票和討論過程摘要可見原文附件表 S2。
2017 年 3 月,15 位博士生測試了 COS 研制最低標準的實用性,這也是利物浦大學與歐洲聯合博士生項目共同舉辦的研究方法學培訓的一部分[14]。所有的學生均沒有參與過 COS-STAD 研制過程,他們以小組形式評估已發布的 COS 對最低標準的遵守情況[15]。他們也被要求對 COS-STAD 的內容、格式和實用性提出意見。這次測試的反饋表明,如果用該標準評估 COS 的研究者能夠事先了解 COS 研究過程相關的論文,包括研究方案(如果有的話),將大有幫助。
5 COS-STAD 推薦
表 2 中列出 11 條最低標準。適用于以決定哪些指標應列入 COS 為目的的研究。該標準不解決指標應該如何定義和測量,因為關于這個過程的指南已經存在[16]。這份規范涉及 COS 研制過程的三個方面:范圍、參與方和共識過程。

5.1 具體范圍
具體范圍應該根據 COS 被應用的研究或實踐場景進行確定(條目 1),包括健康問題(條目 2),目標人群(條目 3)和干預措施(條目 4)。關于 COS 的范圍寬窄,沒有制定推薦或規范,但該規范強調必須考慮和明確以上 4 個部分。例如,COS 研制者需要決定 COS 是用于研究、日常照護還是兩者均可(條目 1)。健康問題(條目 2)可能是寬泛的,比如,所有的癌癥,或者更具體的,如前列腺癌。COS(條目 3)涵蓋的人群可能是所有患有某種疾病的患者,或可能是一個特定亞組,比如局部或晚期的前列腺癌患者。最后,COS 研制者需要考慮并明確該 COS 是用于對疾病有益的所有干預措施,還是僅適用于特定的干預類型,如手術、藥物或醫療器械(條目 4)。在共識過程之初定義好 COS 的范圍,會減少后續因目標不清可能導致的困難。一份明確的說明還將幫助潛在使用者決定該 COS 與他們工作的相關性。
5.2 相關參與方
在 COS 的形成過程中,3 個參與方小組已被確定為 COS 研制中必須具備的最低要求,包括:在研究中會使用到 COS 的群體(條目 5)、醫療專業人員(條目 6)以及患者或他們的代表(條目 7)。臨床試驗人員是在研究場景下將使用 COS 的代表。醫療專業人員是那些直接參與照護或管理 COS 研制所涉及病種患者的人員。另外,為了讓 COS 中涵蓋與患者和護理人員最相關的結局指標,COS 研制過程中納入患者和護理人員至關重要。
5.3 共識過程透明化
為評估 COS 推薦是否是在嚴格、無偏倚的條件下制定的,共識過程中的透明度則十分重要。有關共識過程的標準涉及 4 個方面。共識過程中考慮的結局指標應該反映所有相關方的觀點(條目 8)。COS 研制者因此可能需要考慮結合多種產生初始結局指標清單的方法:例如,來源于已發表臨床試驗的指標清單,可以通過對調研患者意見的定性研究的綜述或患者訪談信息來加以補充。事先確定評分體系和共識定義(條目 9),可以降低由于看到結果后改變標準帶來的偏倚風險。過于寬泛的共識標準可能會產生過長的指標清單,則可能會讓潛在使用者認為不是一個核心指標集;而過于嚴格的標準則可能導致關鍵指標達不到納入域值。同樣的,納入、剔除和增加指標的標準應該提前確定好(條目 10)。描述核心指標集中每個潛在指標的語言應該明確(條目 11)。在審議語言時,應該充分考慮共識過程參與者及潛在使用者都能正確理解,這可能需要既使用通俗的語言描述,也使用醫學術語,并要進行語言理解的預測試。
6 討論
我們制定 COS-STAD 推薦的初衷是鼓勵研究人員至少達到研制 COS 的最低標準,并幫助使用者評價某 COS 是否可以在實踐中采用。那些想評估和使用已發布的 COS 的人員需要根據自身的目標需求,去判斷 COS(范圍)的適用性。COS-STAD 推薦是最低標準,不限制 COS 研制者關于其他方面的方法應用。例如,如果研制者認為一些群體與 COS 的研制具有相關性,則應該納入這些額外的參與方。不管采用什么共識方法,在研制 COS 的過程中應遵循最低標準的相關原則。關于 COS 研究達成共識的不同方法及當前關于共識過程的各方面的具體證據在 COMET 手冊中可以查到[6]。
在完成 Delphi 調查后,20 個候選條目中有 8 個達成了共識。COS-STAD 管理工作組投票并討論了剩下的 12 個條目,最終認為還應納入另外 2 個條目,理由是大多數利益相關方同意或非常一致地認為這些條目非常關鍵。為與指標評分過程相關的條目保持一致,增加了與納入、剔除、添加指標相關的條目。事先明確定義共識、評分標準以及納入、剔除、添加指標的標準(分別為條目 9 和 10),能夠提高方法學報告的透明度,并有助于避免在結果分析以后更改標準。
雖然保證 COS 研制項目的方案可公開獲取未被共識成為一個最低標準,但研究方案的可公開獲取會提高 COS 研制過程的透明度。一般而言,好的研究在研究開始之前就設計了方案并使其可在合適的平臺上公開獲取。在共識定義中如何考慮多個參與方的觀點,以及在決定納入、剔除、填加結局指標的共識過程中如何考慮多方觀點,這兩個條目沒有被納入到最后的推薦條目中。雖然這兩個條目在 Delphi 調查中被一些參與方認為很重要,但 COS-STAD 管理工作組沒有明確采用,因為這兩條已經被涵蓋在條目 9 和 10 中。最后,Delphi 調查第一輪中的一些參與者建議增加一個條目,即應該適用系統評價獲得有可能被納入共識過程的指標條目。這一條被納入到 Delphi 調查第二輪評分中,但僅有一半的參與組達成共識。COS-STAD 管理組討論了該條目,但最終沒有采納,因為有人認為,雖然系統評價可能是可取的,但如果缺乏證據證明,其他形式的綜述或者初始指標清單的收集是不夠的,尚不能認為這個條目是必要的。
COS-STAD 重在 COS 研制過程的主要設計原則,而 COS-STAR[7]則專門用于 COS 研究的報告。雖然 COS-STAD 可能會在 COS 研制項目開始時使用,而 COS-STAR 在完成時使用,但這兩份指導文件間存在協同作用。比如,應該報告重要的設計原則,因為是方法學的一部分。應讓 COS-STAD 參與者在產生初始條目清單的時候,就考慮使用 COS-STAR 報告指南。我們已經能夠提供一套符合相關報告指南的最低標準。很明顯,現已發表的 COS 研究很少能符合這 11 條標準。COS 方法和共識方法過去幾年已經制定。例如,患者或其代表的參與是一個需要改善的領域[4]。與其啟動新的 COS 研究,不如進行添補工作來補充現有的 COS,例如,在那些最初沒有納入患者的 COS 研究中加入患者,可以改善現有工作,進而符合現有的最低標準。
COS-STAD 可能對于那些在同一個衛生保健領域中有多個 COS 發表的使用者有幫助。例如,兒童哮喘至少有 4 個 COS 研究,每一個都使用不同的方法,使得形成的 COS 產生了細微差異[17-20]。
雖然 Delphi 邀請的接受率可能較低(表 1),但是所有參與者繼續參加第二輪調查的比例很高,沒有減員偏倚的證據。根據 Delphi 的結果,COS-STAD 管理組決定了最終的一套最低標準。把專家召集到一起召開正式的共識會議來討論一小部分條目并不值得,尤其是要考慮管理組的專家需要覆蓋除患者外的所有利益相關方。為了解決這個局限,我們打算通過 COMET PoPPIE 工作組積極向患者組織傳播最低標準,并鼓勵他們提供反饋意見。
人們越來越關注一些 COS 與中、低收入國家研究的相關性,因為這些地域 COS 研究的參與者較少。研制 COS 研究參與者較多的地域主要是美國、英國、加拿大和其他歐洲國家[21]。在 COS-STAD 研究中,我們確實從全球名單中邀請參與者,但我們并沒有收集這項研究回復者的地理位置信息。我們沒有理由認為 COS-STAD 推薦涵蓋的設計原則不適用于所有國家。
我們歡迎有關 COS-STAD 注意事項的反饋意見。未來的工作計劃將探索是否可以制定標準用于鑒別那些已經完成的 COS 是否采用了高質量方法。歡迎讀者提出評論,特別是那些基于經驗和研究證據的意見和建議,通過 COMET 網站[22],這些反饋意見將被考慮今后用于改進本次推薦。
參考文獻及附件(略)