為規范和提高患者和公眾參與研究的報告質量,BMJ 近期發表了患者和公眾參與研究的報告規范(guidance for reporting involvement of patients and the public,GRIPP)第二版,簡稱 GRIPP 2。本文對 GRIPP 2 產生背景、制定過程進行介紹,對其核心內容進行解讀,以期為國內研究人員開展患者和公眾參與(patient and public involvement,PPI)相關研究及撰寫 PPI 研究報告提供借鑒。
引用本文: 吳沛霞, 胡雁. 患者和公眾參與研究的報告規范(GRIPP 2)解讀. 中國循證醫學雜志, 2018, 18(1): 96-100. doi: 10.7507/1672-2531.201709138 復制
20 世紀 50 年代,英國醫療界出現的數起丑聞事件,包括死亡兒童的器官組織未經家屬許可用于科研[1]和心臟手術兒童非預期的高死亡率[2],引發了公眾對于醫療衛生行業倫理道德及執業權威的質疑。部分患者及民眾自發組建了一些群體,積極爭取在直接影響他們權利的決策中發出聲音,這是患者和公眾參與(patient and public involvement,PPI)產生的歷史雛形。隨后數十年,伴隨政治團體關于健康保險給付制度的改革、基金資助方對于受資助項目透明度要求及民眾自身科學素養的提高,壁壘重重的醫療領域逐漸敞開大門,越來越多的患者和公眾參與到醫療實踐與研究之中。
1996 年,由英國國家衛生研究所(National Health Service,NHS)發起的研究消費者組(現改名為 INVOLVE)正式成立,該組織以鼓勵和支持公眾參與 NHS、公共衛生和社會福利研究為宗旨。此后,PPI 和用戶主導(user-led)的相關研究數量逐年增加。但是,這類研究報道的質量參差不齊,多數文章幾乎沒有提供關于公眾參與的具體過程及這種參與對結果的影響[3, 4]。關鍵要素缺失意味著從這些研究中可獲得的學習資料有限,讀者很難真正評價 PPI 的實際影響,相關證據的提取和匯總會受到阻礙。2017 年 8 月,Staniszewska 等[5]在 BMJ 上發表了患者和公眾參與研究的報告規范(Guidance for Reporting Involvement of Patients and the Public,GRIPP)第二版,簡稱 GRIPP 2,其旨在規范和提高 PPI 研究的報告質量。本文對 GRIPP 2 產生背景、制定過程、核心內容進行解讀,期望為國內研究者撰寫和報告 PPI 研究論文提供參考。
1 GRIPP 2 的制作背景
第一版 GRIPP[6]發表于 2011 年,由英國 Warwick 醫學院 Staniszewska 等[4, 7]通過 2 個系統評價發現 PPI 相關研究文獻存在的共性缺陷:對 PPI 概念定義不清、缺乏理論框架、PPI 的內容效度未經驗證、研究報告的方法學質量較差、研究內容的有效性不清楚、上下文報告不一致、各研究間報告呈現方式變異性大、幾乎沒有正式 PPI 報告質量的評價、對于 PPI 負面影響的報道有限、幾乎沒有穩健的對于 PPI 影響的測量方法等。這些報告質量問題使讀者無法準確評估 PPI 的有效性和其在實踐中應用的可能性。基于此,Staniszewska 等提出了包含情景、過程、影響三要素的評價 PPI 研究的框架模式,并設計了 GRIPP 清單,旨在解決這些關鍵問題。GRIPP 清單有三個潛在用途:① 協助研究者遵循統一報告規范撰寫 PPI 相關論文;② 便于編輯和同行評審人員對 PPI 相關報告進行評審,幫助對論文錄用與否進行決策;③ 為廣大讀者評價 PPI 科研論文和報告的質量提供思路。Staniszewska 等從摘要、背景/文獻回顧、目的、方法、PPI 影響、測量、經濟評價、分析、結果、討論和結論共 10 個方面著手,每個方面擬定了數個條目用以規范 PPI 研究報告的質量,第一版的 GRIPP 清單共包含 31 個條目。第一版 GRIPP 的不足之處在于未能基于國際社會對該領域的廣泛共識,具有一定的片面性,但是其公開發表不僅有助于喚醒學術界對于 PPI 研究報告規范的重視,也為學術界和業界對 PPI 項目的設計,包括選擇重要的結局指標、項目管理、研究結果的分析和詮釋等若干方面提供了可參考的標準。GRIPP 清單自始至終滲透的透明性、一致性、嚴謹性和經濟效用性等理念,為其日后更新與完善奠定了基礎。
2 GRIPP 2 的制定過程
GRIPP 2 是在第一版 GRIPP 發表 6 年后的修訂。Staniszewska 團隊以初版 GRIPP 為基礎,遵循 EQUATOR 研究報告指南的常用方法進行 GRIPP 2 的制訂,包括現有證據的系統評價、三輪包含關鍵人群的 Delphi 調查和一次最終協商達成共識的現場會議。具體流程見表 1。來自澳大利亞、美國、加拿大和歐洲共 143 名資深人員參加了第一輪 Delphi 調查,他們的背景分別為研究人員、基金資助方、患者、照護者、編輯和來自國際研究機構的個人。第二輪 Delphi 調查回應率為 86%(123/143),第三輪調查回應率為 78%(112/143)。

Delphi 調查設計的清單每個條目根據重要程度賦值 1~10 分,1 分為不重要,10 分為非常重要。在第一輪和第二輪中位數≥8 分的條目被認為已達到共識,即予以保留;中位數≤5 分的條目被排除;中等評分即 6 分或 7 分的項目在第三輪調查中繼續篩選。第一輪的調查顯示大多數被調查者認為首先應確定 GRIPP 清單中哪些主要內容是必須和適宜的,多數人認為應有一個較短的版本,包括 PPI 的一些核心要素即可。故在第二輪的 Delphi 調查中,參與者被要求圈出哪些是“核心”條目,可包括在簡版的指南中。最終,該團隊制定了 GRIPP 2 完整版(GRIPP 2-LF)和 GRIPP 2 簡版(GRIPP 2-SF)兩個版本。完整版適用于主要目的和內容為 PPI 的研究,簡版則適用于次要研究目的為 PPI 的研究。在三輪 Delphi 調查完成之后,舉行了為期一天的現場共識會,共有 25 名代表(患者和照護者 8 人、研究人員 9 人和臨床醫師 6 人)參加會議,共同討論確定在 Delphi 調查中處于共識臨界值的條目是否應列入指導意見,并充分討論整個 GRIPP 中條目的清晰度和表達的適切性。
值得一提的是,GRIPP 2 開發組招募了 3 名患者作為研究團隊的成員,參與了制定 GRIPP 2 的整個過程,包括構建該 PPI 報告規范的重要性闡述、確定研究問題、招募 Delphi 調查的對象、分析 Delphi 調查的結果、參加共識會等,并在發布 GRIPP 2 時將他們列為共同作者。
3 GRIPP 2 的核心內容
GRIPP 2-LF 共 34 個條目,各條目按照科學論文的結構化摘要、背景、目的、方法、結果和討論部分進行分類(情況適用的話,還需要單獨報告 2 部分:PPI 影響的測量或呈現和經濟評價),共分為 8 個主要部分,每部分具體條目不等,見表 2。GRIPP 2-SF 僅 5 個條目,按論文結構的目的、方法、結果、討論和反思進行分組,每組一個條目概括說明,見表 3。


4 GRIPP 2 的解讀
GRIPP 初版發表之后,未見國內同仁翻譯或介紹,為幫助讀者準確全面理解各項條目的具體含義及應用,本文將結合 GRIPP 初版發表時開發團隊的觀點,對 GRIPP 2 清單內容進行逐一解讀。
4.1 摘要
GRIPP 2 建議采用結構式摘要。在摘要的每個部分提出明確的報告規范要求。需要特別注意的是,GRIPP 2 在方法部分要求描述 PPI 的方法,結果部分要求報告 PPI 在研究中的影響和成果,關鍵詞部分要求包括 PPI、患者和公眾參與或相關術語。在該開發團隊前期進行的兩項系統評價中,發現此類文獻若沒有在關鍵詞中呈現 PPI 以及缺乏 PPI 相關的 Mesh 詞,會導致文獻檢索十分困難;而在摘要中沒有明確關于 PPI 的描述,使得研究者不得不閱讀全文,加重了工作負擔,不利于文獻的二次利用。
4.2 背景
在論文的背景部分要求報告三部分內容:定義、理論基礎、概念和理論構建。首先需要清楚地定義 PPI,還需要報告該研究中與 PPI 有關的理論依據或者哪些理論框架或理論模型影響了該研究中 PPI 的概念構成,并且應當報告理論構建的情況。PPI 的清晰界定將為下一步測量 PPI 影響打下基礎。
4.3 目的
GRIPP 2 要求明確報告研究目的。可描述為“本研究的目的是驗證/探索 PPI 對于……的影響/效果(干預性研究)”;或“本研究旨在描述……PPI 的現況或相關因素(調查性研究)”。
4.4 方法
方法部分包括四個方面:研究設計、參與人員、參與階段、參與性質或程度。研究設計部分需提供對 PPI 方法的清晰描述。不僅報告在該研究中涉及 PPI 活動的患者、照護者和公眾的情況,還應報告在研究的不同階段如何做到 PPI:比如在研究設計階段是如何做到 PPI?在研究實施階段 PPI 的情形如何?在不同階段 PPI 發揮了什么作用?參與了哪些工作?以什么形式參與?參與的程度如何?
4.5 PPI 影響的測量、呈現和經濟學評價
這兩部分并非適用于所有的情況,但如適用的話,研究者需報告 PPI 影響的定性證據、定量證據及測量 PPI 影響所采用工具的可靠性與嚴謹性。定性的影響可能是對于研究對象訪談時的積極/消極作用,定量證據則可能表現為任何可量化的結局指標。研究者還需要報告測量工具的信效度和測量過程的質量控制。如需進行經濟學評價的話,需要報告評價 PPI 經濟影響的評估方法。
4.6 研究結果
在研究結果部分需呈現以下內容:① PPI 結果,包括陽性和陰性結果;② PPI 影響,對研究、研究所涉及的個人(包括患者和研究人員)、及更廣泛范圍的積極和消極影響;③ 研究中 PPI 的情景和過程,包括促成或阻礙 PPI 的任何情景或過程因素;④ 報告有關 PPI 的成本支出或收益的任何信息,以便政策制定者和基金團體進行利弊權衡。如涉及理論研究,則需要報告 PPI 研究過程中出現的任何概念或要素:① 涉及理論模型驗證,則要清楚描述理論驗證結果;② 涉及測量工具的開發,需要報告工具開發和測試的各個指標(如:有效性、可靠性、可行性、靈活性、可接受性、反應度、可解釋性、適用性和準確性)。
4.7 討論與結論
評論 PPI 如何影響研究的整體,描述積極和消極兩方面的影響;評論在本研究中發現的 PPI 的不同影響及其對新知識的貢獻;分析使用的 PPI 定義(在背景部分報告的)是否恰當,是否有修改的建議;評論所在研究對于 PPI 的理論發展的貢獻;評論研究中情景因素如何影響 PPI;評論研究中過程因素如何影響 PPI。如適用,還要分析所在研究是否較好地測量或呈現了 PPI 的影響;充分討論 PPI 的經濟成本或收益,特別是對未來的經濟建模的影響。最后,應對研究進行批判性地評論,反思研究過程中進展順利或不順利的部分,以便其他人從中借鑒和學習。
5 小結
GRIPP 2 是一份基于國際社會廣泛共識的用于規范 PPI 研究報告的指導性文件,對于提高 PPI 研究報告的透明度、一致性、完整性方面將有促進意義,其發布也有助于形成高質量的 PPI 證據,進而確保 PPI 實踐可基于最佳證據。但該報告規范尚未進行可用度測試,同時也需要在不同語言、不同文化場景進行測試。另外,在 GRIPP 2 制定過程的描述中未明確提及 Delphi 調查及現場共識會議參與人員是否涉及利益沖突(如學術方面的),仍存在不足。
盡管 PPI 的概念在國內醫學界還未興起,但值得注意的是,當下中國醫療界正面臨患者信任危機及公眾科學素養長足進步的雙重局面,鼓勵患者和公眾參與研究,以增進醫患理解、解除信任危機,恰逢其時。隨著互聯網時代的降臨,科研創新模式正在深刻變革,公眾參與是必然趨勢[8]。GRIPP 2 列出了 PPI 研究中哪些細節應當報告、如何報告,對于研究者而言,可以此為參考進行研究的設計、實施、資料分析和質量控制,撰寫的論文也更容易被同行評議和期刊編輯所采用。
20 世紀 50 年代,英國醫療界出現的數起丑聞事件,包括死亡兒童的器官組織未經家屬許可用于科研[1]和心臟手術兒童非預期的高死亡率[2],引發了公眾對于醫療衛生行業倫理道德及執業權威的質疑。部分患者及民眾自發組建了一些群體,積極爭取在直接影響他們權利的決策中發出聲音,這是患者和公眾參與(patient and public involvement,PPI)產生的歷史雛形。隨后數十年,伴隨政治團體關于健康保險給付制度的改革、基金資助方對于受資助項目透明度要求及民眾自身科學素養的提高,壁壘重重的醫療領域逐漸敞開大門,越來越多的患者和公眾參與到醫療實踐與研究之中。
1996 年,由英國國家衛生研究所(National Health Service,NHS)發起的研究消費者組(現改名為 INVOLVE)正式成立,該組織以鼓勵和支持公眾參與 NHS、公共衛生和社會福利研究為宗旨。此后,PPI 和用戶主導(user-led)的相關研究數量逐年增加。但是,這類研究報道的質量參差不齊,多數文章幾乎沒有提供關于公眾參與的具體過程及這種參與對結果的影響[3, 4]。關鍵要素缺失意味著從這些研究中可獲得的學習資料有限,讀者很難真正評價 PPI 的實際影響,相關證據的提取和匯總會受到阻礙。2017 年 8 月,Staniszewska 等[5]在 BMJ 上發表了患者和公眾參與研究的報告規范(Guidance for Reporting Involvement of Patients and the Public,GRIPP)第二版,簡稱 GRIPP 2,其旨在規范和提高 PPI 研究的報告質量。本文對 GRIPP 2 產生背景、制定過程、核心內容進行解讀,期望為國內研究者撰寫和報告 PPI 研究論文提供參考。
1 GRIPP 2 的制作背景
第一版 GRIPP[6]發表于 2011 年,由英國 Warwick 醫學院 Staniszewska 等[4, 7]通過 2 個系統評價發現 PPI 相關研究文獻存在的共性缺陷:對 PPI 概念定義不清、缺乏理論框架、PPI 的內容效度未經驗證、研究報告的方法學質量較差、研究內容的有效性不清楚、上下文報告不一致、各研究間報告呈現方式變異性大、幾乎沒有正式 PPI 報告質量的評價、對于 PPI 負面影響的報道有限、幾乎沒有穩健的對于 PPI 影響的測量方法等。這些報告質量問題使讀者無法準確評估 PPI 的有效性和其在實踐中應用的可能性。基于此,Staniszewska 等提出了包含情景、過程、影響三要素的評價 PPI 研究的框架模式,并設計了 GRIPP 清單,旨在解決這些關鍵問題。GRIPP 清單有三個潛在用途:① 協助研究者遵循統一報告規范撰寫 PPI 相關論文;② 便于編輯和同行評審人員對 PPI 相關報告進行評審,幫助對論文錄用與否進行決策;③ 為廣大讀者評價 PPI 科研論文和報告的質量提供思路。Staniszewska 等從摘要、背景/文獻回顧、目的、方法、PPI 影響、測量、經濟評價、分析、結果、討論和結論共 10 個方面著手,每個方面擬定了數個條目用以規范 PPI 研究報告的質量,第一版的 GRIPP 清單共包含 31 個條目。第一版 GRIPP 的不足之處在于未能基于國際社會對該領域的廣泛共識,具有一定的片面性,但是其公開發表不僅有助于喚醒學術界對于 PPI 研究報告規范的重視,也為學術界和業界對 PPI 項目的設計,包括選擇重要的結局指標、項目管理、研究結果的分析和詮釋等若干方面提供了可參考的標準。GRIPP 清單自始至終滲透的透明性、一致性、嚴謹性和經濟效用性等理念,為其日后更新與完善奠定了基礎。
2 GRIPP 2 的制定過程
GRIPP 2 是在第一版 GRIPP 發表 6 年后的修訂。Staniszewska 團隊以初版 GRIPP 為基礎,遵循 EQUATOR 研究報告指南的常用方法進行 GRIPP 2 的制訂,包括現有證據的系統評價、三輪包含關鍵人群的 Delphi 調查和一次最終協商達成共識的現場會議。具體流程見表 1。來自澳大利亞、美國、加拿大和歐洲共 143 名資深人員參加了第一輪 Delphi 調查,他們的背景分別為研究人員、基金資助方、患者、照護者、編輯和來自國際研究機構的個人。第二輪 Delphi 調查回應率為 86%(123/143),第三輪調查回應率為 78%(112/143)。

Delphi 調查設計的清單每個條目根據重要程度賦值 1~10 分,1 分為不重要,10 分為非常重要。在第一輪和第二輪中位數≥8 分的條目被認為已達到共識,即予以保留;中位數≤5 分的條目被排除;中等評分即 6 分或 7 分的項目在第三輪調查中繼續篩選。第一輪的調查顯示大多數被調查者認為首先應確定 GRIPP 清單中哪些主要內容是必須和適宜的,多數人認為應有一個較短的版本,包括 PPI 的一些核心要素即可。故在第二輪的 Delphi 調查中,參與者被要求圈出哪些是“核心”條目,可包括在簡版的指南中。最終,該團隊制定了 GRIPP 2 完整版(GRIPP 2-LF)和 GRIPP 2 簡版(GRIPP 2-SF)兩個版本。完整版適用于主要目的和內容為 PPI 的研究,簡版則適用于次要研究目的為 PPI 的研究。在三輪 Delphi 調查完成之后,舉行了為期一天的現場共識會,共有 25 名代表(患者和照護者 8 人、研究人員 9 人和臨床醫師 6 人)參加會議,共同討論確定在 Delphi 調查中處于共識臨界值的條目是否應列入指導意見,并充分討論整個 GRIPP 中條目的清晰度和表達的適切性。
值得一提的是,GRIPP 2 開發組招募了 3 名患者作為研究團隊的成員,參與了制定 GRIPP 2 的整個過程,包括構建該 PPI 報告規范的重要性闡述、確定研究問題、招募 Delphi 調查的對象、分析 Delphi 調查的結果、參加共識會等,并在發布 GRIPP 2 時將他們列為共同作者。
3 GRIPP 2 的核心內容
GRIPP 2-LF 共 34 個條目,各條目按照科學論文的結構化摘要、背景、目的、方法、結果和討論部分進行分類(情況適用的話,還需要單獨報告 2 部分:PPI 影響的測量或呈現和經濟評價),共分為 8 個主要部分,每部分具體條目不等,見表 2。GRIPP 2-SF 僅 5 個條目,按論文結構的目的、方法、結果、討論和反思進行分組,每組一個條目概括說明,見表 3。


4 GRIPP 2 的解讀
GRIPP 初版發表之后,未見國內同仁翻譯或介紹,為幫助讀者準確全面理解各項條目的具體含義及應用,本文將結合 GRIPP 初版發表時開發團隊的觀點,對 GRIPP 2 清單內容進行逐一解讀。
4.1 摘要
GRIPP 2 建議采用結構式摘要。在摘要的每個部分提出明確的報告規范要求。需要特別注意的是,GRIPP 2 在方法部分要求描述 PPI 的方法,結果部分要求報告 PPI 在研究中的影響和成果,關鍵詞部分要求包括 PPI、患者和公眾參與或相關術語。在該開發團隊前期進行的兩項系統評價中,發現此類文獻若沒有在關鍵詞中呈現 PPI 以及缺乏 PPI 相關的 Mesh 詞,會導致文獻檢索十分困難;而在摘要中沒有明確關于 PPI 的描述,使得研究者不得不閱讀全文,加重了工作負擔,不利于文獻的二次利用。
4.2 背景
在論文的背景部分要求報告三部分內容:定義、理論基礎、概念和理論構建。首先需要清楚地定義 PPI,還需要報告該研究中與 PPI 有關的理論依據或者哪些理論框架或理論模型影響了該研究中 PPI 的概念構成,并且應當報告理論構建的情況。PPI 的清晰界定將為下一步測量 PPI 影響打下基礎。
4.3 目的
GRIPP 2 要求明確報告研究目的。可描述為“本研究的目的是驗證/探索 PPI 對于……的影響/效果(干預性研究)”;或“本研究旨在描述……PPI 的現況或相關因素(調查性研究)”。
4.4 方法
方法部分包括四個方面:研究設計、參與人員、參與階段、參與性質或程度。研究設計部分需提供對 PPI 方法的清晰描述。不僅報告在該研究中涉及 PPI 活動的患者、照護者和公眾的情況,還應報告在研究的不同階段如何做到 PPI:比如在研究設計階段是如何做到 PPI?在研究實施階段 PPI 的情形如何?在不同階段 PPI 發揮了什么作用?參與了哪些工作?以什么形式參與?參與的程度如何?
4.5 PPI 影響的測量、呈現和經濟學評價
這兩部分并非適用于所有的情況,但如適用的話,研究者需報告 PPI 影響的定性證據、定量證據及測量 PPI 影響所采用工具的可靠性與嚴謹性。定性的影響可能是對于研究對象訪談時的積極/消極作用,定量證據則可能表現為任何可量化的結局指標。研究者還需要報告測量工具的信效度和測量過程的質量控制。如需進行經濟學評價的話,需要報告評價 PPI 經濟影響的評估方法。
4.6 研究結果
在研究結果部分需呈現以下內容:① PPI 結果,包括陽性和陰性結果;② PPI 影響,對研究、研究所涉及的個人(包括患者和研究人員)、及更廣泛范圍的積極和消極影響;③ 研究中 PPI 的情景和過程,包括促成或阻礙 PPI 的任何情景或過程因素;④ 報告有關 PPI 的成本支出或收益的任何信息,以便政策制定者和基金團體進行利弊權衡。如涉及理論研究,則需要報告 PPI 研究過程中出現的任何概念或要素:① 涉及理論模型驗證,則要清楚描述理論驗證結果;② 涉及測量工具的開發,需要報告工具開發和測試的各個指標(如:有效性、可靠性、可行性、靈活性、可接受性、反應度、可解釋性、適用性和準確性)。
4.7 討論與結論
評論 PPI 如何影響研究的整體,描述積極和消極兩方面的影響;評論在本研究中發現的 PPI 的不同影響及其對新知識的貢獻;分析使用的 PPI 定義(在背景部分報告的)是否恰當,是否有修改的建議;評論所在研究對于 PPI 的理論發展的貢獻;評論研究中情景因素如何影響 PPI;評論研究中過程因素如何影響 PPI。如適用,還要分析所在研究是否較好地測量或呈現了 PPI 的影響;充分討論 PPI 的經濟成本或收益,特別是對未來的經濟建模的影響。最后,應對研究進行批判性地評論,反思研究過程中進展順利或不順利的部分,以便其他人從中借鑒和學習。
5 小結
GRIPP 2 是一份基于國際社會廣泛共識的用于規范 PPI 研究報告的指導性文件,對于提高 PPI 研究報告的透明度、一致性、完整性方面將有促進意義,其發布也有助于形成高質量的 PPI 證據,進而確保 PPI 實踐可基于最佳證據。但該報告規范尚未進行可用度測試,同時也需要在不同語言、不同文化場景進行測試。另外,在 GRIPP 2 制定過程的描述中未明確提及 Delphi 調查及現場共識會議參與人員是否涉及利益沖突(如學術方面的),仍存在不足。
盡管 PPI 的概念在國內醫學界還未興起,但值得注意的是,當下中國醫療界正面臨患者信任危機及公眾科學素養長足進步的雙重局面,鼓勵患者和公眾參與研究,以增進醫患理解、解除信任危機,恰逢其時。隨著互聯網時代的降臨,科研創新模式正在深刻變革,公眾參與是必然趨勢[8]。GRIPP 2 列出了 PPI 研究中哪些細節應當報告、如何報告,對于研究者而言,可以此為參考進行研究的設計、實施、資料分析和質量控制,撰寫的論文也更容易被同行評議和期刊編輯所采用。