統計圖形是科研論文中必不可少的組成部分,通過規范、美觀的可視化圖形直觀、準確地呈現研究結果有利于促進學術成果的交流、傳播與應用。醫療干預的安全性是其臨床應用的基本前提,隨機對照試驗作為確定醫療干預療效和安全性的重要研究設計,準確地呈現其發現的安全性信息便顯得尤為重要。但是,有研究發現目前發表的隨機對照試驗報告中并沒有充分地利用可視化圖形呈現其危害結局數據。為了促進臨床研究人員更好地使用可視化圖形呈現危害結局數據,國際學者近期在BMJ發表了一項共識研究,確定并推薦10種用于呈現隨機對照試驗危害結局數據的統計圖形。為了便于國內學者了解和應用該共識,本文對該共識與推薦意見進行了解讀,以期為提高國內隨機對照試驗報告中危害結局數據可視化的質量提供幫助。
統計圖形是現代科研論文中必不可少的組成部分,通過規范、美觀的可視化圖形直觀、準確地呈現研究結果有利于促進科研成果的交流、傳播與應用[1-4]。可視化是人們認識數據,洞察數據背后規律的重要手段,可以使原本枯燥的內容變得生動、直觀[4-5]。數據可視化先驅Edward Tufte認為學術圖表主要有三方面的作用,包括真實、準確、全面地展示數據,以較少的空間展示較多的信息和揭示數據的本質、關系和規律[1]。隨著計算機技術和統計方法的飛速發展,尤其進入大數據、大健康時代后,各式各樣可視化圖形常被用于探索數據結構和展示研究結果[5-8]。
一項醫遼干預的評價主要包括其有效性、安全性和經濟學方面。隨機對照試驗被認為是確定干預措施有效性和安全性的重要研究設計,是進行因果推斷的金標準[9]。因此,藥物與醫療器械的上市審批基本都需嚴謹設計和實施的隨機對照試驗提供證據支持。然而,研究發現醫學領域中不同學科的隨機對照試驗研究論文都存在著關鍵信息報告不清晰、不完整的問題[10-12];為了提高隨機對照試驗研究論文的報告質量,相關學者已經制訂了CONSORT及其擴展版指南指導研究人員規范地報告和撰寫研究論文[13-15]。一般來說,一項干預措施的安全性是其有效性和經濟性的基本前提,同時臨床試驗中收集的危害結局數據通常是比較復雜的,因此,清晰、準確地報告安全性信息對于學術交流和決策者權衡利弊后做出決策至關重要[13,16-17]。臨床試驗中關于干預措施安全性的表述主要有“危害”、“不良事件”、“不良反應”、“并發癥”和“毒副作用”等[13,17]。CONSORT中的“危害”指干預措施任何的可能不良后果的總和[13,18]。盡管CONSORT-Harms規范被制訂用于促進隨機對照試驗中干預危害信息的報告[13],但多項研究表明已發表的隨機對照試驗中使用可視化圖形呈現干預措施的危害信息并不理想[19-21]。例如,一項方法學研究調查了來自4本頂級綜合醫學期刊的184篇隨機對照試驗研究報告,發現僅有22篇(12%)使用圖形展示了不良事件結局的信息[19]。為了幫助研究人員更好地使用可視化統計圖形清晰、準確地報告干預措施的危害結局信息,從而促進隨機對照試驗中危害結局數據的交流,Phillips等[21]近期在BMJ發表了在隨機對照試驗中使用統計圖形可視化干預危害結局信息的共識研究。為了便于國內學者更好地應用該共識,本文對該共識和其中的推薦意見進行了解讀,以期提高國內隨機對照試驗論文中干預措施危害結局數據可視化的質量。
1 制訂過程簡介
研究團隊由20位學術統計師,1位企業統計師,1位學術衛生經濟學家,1位數據圖形設計師和2位臨床醫生,共計25位研究人員組成[21]。團隊所有成員均參與過臨床試驗或對數據可視化感興趣,或二者兼有。共識文件由23位方法學家通過多次共識會議,并在采納2位臨床醫生建議的基礎上形成。研究人員首先利用概況性評價調查了2018年3月—2019年10月發表的用于分析藥物臨床試驗不良事件的新方法[22],并考慮了其他可改編后用于分析不良事件的圖形;再由23位非臨床醫生研究者使用由12個條目組成的評估框架在共識會議上對初步擬定的28種用于呈現藥物臨床試驗中干預危害信息的統計圖形進行了全面評估,并在必要時對圖形進行改進調整。此外,還對2位臨床醫生獨立進行了半結構式訪談以獲得其反饋意見。研究團隊最終確定了10種推薦用于隨機對照試驗報告中呈現危害結局信息的統計圖形,并基于已有的臨床試驗數據繪制了案例圖形[21]。為了與隨機對照試驗的主要目的(即因果推斷)保持一致[21],這些圖形主要適用于進行組間比較的危害結局數據。研究人員根據使用目的(即呈現總體危害情況還是單個危害事件;前者指所有或多個危害結局的匯總,而后者既指任何單個的不良事件,也包括由多個不良事件構成單個危害分類)和結局指標類型(即二分類、計數、連續性和時間-事件結局)對10個統計圖形的適用情況進行了分類,并提供了圖形選擇決策樹(圖1)以幫助研究人員選擇適合的圖形。

2 推薦圖形解讀
2.1 點圖
該共識推薦點圖用于同時呈現多個二分類危害結局數據,能夠同時展示多個二分類不良事件(例如,是否發生惡心、頭痛)的絕對風險和相對風險。以圖2為例,圖中左側部分展示了兩個干預組中發生的多個不良事件的比例,右側部分展示了兩組中多個不良事件的具體數量及組間的相對風險。可使用Stata軟件的“aedot”或“aedots”命令繪制點圖,也可使用R和SAS軟件繪制。

2.2 堆積條形圖
該共識同樣推薦使用堆積條形圖同時呈現多個二分類危害結局數據,不僅能夠同時呈現發生各不良事件的患者具體數量及其占比,還能展示其嚴重程度的信息。以圖3為例,該圖按照干預組別和危害的最大嚴重程度,同時呈現多個不良事件的患者數量及其占比。需要注意的是,根據最大嚴重程度分類是指當某個受試者多次發生同一不良事件時,只對其中最嚴重的不良事件計數。Stata軟件的“graph hbar”命令、R軟件的“barplot”函數或“ggplot2”包以及SAS軟件的“proc gchart”程序均能繪制堆積條形圖。

2.3 條形圖
該共識推薦使用條形圖呈現計數危害結局數據(例如,頭痛的發生次數),能夠展示發生的不良事件的具體數量。以圖4為例,圖4a展示了雙臂研究中各組不良事件的具體數量及對應的患者占比,圖4b展示了三臂研究中各組不良事件的具體數量及對應的患者占比。可使用繪制堆積條形圖的軟件包實現條形圖的繪制。
2.4 KM生存曲線
該共識推薦使用KM生存曲線呈現單個無復發情況的時間-事件危害結局數據(例如,在治療過程中隨時間推移未發生感染的受試者占比信息),能夠展示不同干預組中未發生該不良事件的受試者隨時間推移一直保持無事件的累積比例,同時風險計數表展示了不同時間點未發生該事件、發生該事件及刪失受試者的數量,見圖5。可利用Stata軟件的“kmunicate_stata”程序和R軟件的“KMunicate”包繪制KM生存曲線。

2.5 平均累積函數圖
該共識推薦使用平均累積函數圖呈現單個具有復發情況的時間-事件危害結局數據,能夠展示不同干預組中每個受試者隨時間推移發生的不良事件的平均累計數量,見圖6。推薦使用SAS軟件的可靠性評價過程和“mcfplot”命令來實現平均累積函數圖的繪制。

2.6 生存比率圖
該共識同樣推薦使用生存比率圖呈現單個無復發情況的時間-事件危害結局數據,能夠展示隨時間推移兩個干預組中未發生不良事件概率的非參數估計值的比率及其95%置信區間,見圖7。可使用R軟件“survRatio”包的“drsurv”函數和“ggplot2”包的“ggsurv”函數繪制生存比率圖。

2.7 線圖
該共識推薦使用線圖展示不同干預組中隨時間推移發生變化的連續性危害結局數據(例如,嗜酸性細胞計數的改變),但應具有正態分布的特點,如圖8;此外,風險計數表還能夠展示每個離散時間點具有危害事件風險的受試者的數量。可使用Stata軟件的“twoway connected”和“twoway rspike”命令、R軟件“ggplot2”包的“geom_line”和“geom_errorbar”函數繪制線圖。

2.8 小提琴圖
該共識同樣推薦使用小提琴圖展示不同干預組中隨時間推移發生變化的連續性危害結局數據,如圖9。此圖可作為線圖的替代方案,更重要的是,它還能用于呈現非正態分布的連續性危害結局數據和探索數據分布特點。Stata軟件的“vioplot”命令、R軟件“ggplot2”包的“geom_violin”函數以及SAS的“proc sgpanel”程序均可繪制小提琴圖。

2.9 核密度圖
該共識推薦使用核密度圖展示在某個時間點不同干預組中的連續性危害結局數據,如圖10,可用以探索特定時間點某個連續性危害結局數據或改變量的特點。可使用Stata軟件的“twoway kdensity”命令、R軟件“ggplot2”的“geom_density”函數及SAS軟件的“densityplot”程序繪制核密度圖。

2.10 散點圖矩陣
該共識推薦使用散點圖矩陣展示多個連續性危害結局數據在兩個不同時間點間的關系,如圖11,可用以探索和識別多個連續性危害結局數據中的異常值或者分布模式。可使用Stata軟件的“twoway scatter”命令分別產生每個結局的散點圖,再利用“combine”或“grc1leg”命令組合各圖得到散點圖矩陣。

3 討論
正如“一圖勝千言”所代表的含義,即與單純文本內容相比,科學、美觀的可視化圖形可以直觀、準確地展示數據結構,幫助人們洞察數據背后蘊含的真正規律,從而能夠幫助我們更快地理解和解釋復雜的研究內容[1,23-24]。可視化的圖形還能夠增加人們對某個現象/事物的關注度,使得人們對其認識和理解更加聚焦[24]。“認知負荷”理論認為理解和解釋信息需要消耗精神能量,即認知負荷。認知負荷包括內在負荷(即主題固有的復雜性)、外部負荷(即影響學習的外部因素)和關聯負荷(即組織和理解內容所花費的精神能量)組成部分,而美觀的視覺效果可以減少內在負荷,優化關聯負荷,并消除外部負荷[24]。例如,一種叫做“視覺摘要”(visual abstract)的新型摘要形式,可以使科研論文在推特上的推送信息及其本身的閱讀量均顯著增加[25]。
清晰、直觀地報告隨機對照試驗中干預措施的危害結局信息有助于臨床醫生綜合判斷干預措施的獲益-風險[17-18],以便做出是否選擇該干預措施進行臨床治療的決策。考慮到現有隨機對照試驗報告中使用可視化圖形呈現干預危害結局信息的現狀不佳,同時缺少統一的可操作性強的實踐規范,Phillips Rachel團隊開展了相關系列研究[18-20,22],最終形成了在隨機對照試驗報告中如何選用恰當的統計圖形呈現干預措施危害結局數據的共識推薦[21]。本文對該共識的制訂過程、推薦圖形的特點、適用性及統計軟件作了概述,以期能夠為改進國內隨機對照試驗研究論文中干預措施危害結局信息的報告產生幫助。盡管作者聲明該共識主要基于藥物臨床試驗研究制訂,但我們認為這些圖形也可用于或在改良后用于非藥物干預隨機對照試驗中報告危害結局信息,還可用于非隨機臨床干預研究。作者在原文中提供了對推薦圖形進行改良調整的可能情況,研究者在使用時可在利用決策樹初步確定圖形后,再根據自己的需求對圖形進行改良調整后使用。建議研究者在實際應用時應參照COSORT-Harms指南撰寫研究報告,同時選擇該共識推薦的圖形恰當地呈現醫療干預危害結局數據。此外,學術界在未來還應加強開發能夠同時展示多個時間-事件危害結局數據的統計圖形的力度。
聲明 對該共識的解讀已經通過電子郵件征得原文第一作者Phillips Rachel的同意。所在作者均聲明不存在任何利益沖突。
統計圖形是現代科研論文中必不可少的組成部分,通過規范、美觀的可視化圖形直觀、準確地呈現研究結果有利于促進科研成果的交流、傳播與應用[1-4]。可視化是人們認識數據,洞察數據背后規律的重要手段,可以使原本枯燥的內容變得生動、直觀[4-5]。數據可視化先驅Edward Tufte認為學術圖表主要有三方面的作用,包括真實、準確、全面地展示數據,以較少的空間展示較多的信息和揭示數據的本質、關系和規律[1]。隨著計算機技術和統計方法的飛速發展,尤其進入大數據、大健康時代后,各式各樣可視化圖形常被用于探索數據結構和展示研究結果[5-8]。
一項醫遼干預的評價主要包括其有效性、安全性和經濟學方面。隨機對照試驗被認為是確定干預措施有效性和安全性的重要研究設計,是進行因果推斷的金標準[9]。因此,藥物與醫療器械的上市審批基本都需嚴謹設計和實施的隨機對照試驗提供證據支持。然而,研究發現醫學領域中不同學科的隨機對照試驗研究論文都存在著關鍵信息報告不清晰、不完整的問題[10-12];為了提高隨機對照試驗研究論文的報告質量,相關學者已經制訂了CONSORT及其擴展版指南指導研究人員規范地報告和撰寫研究論文[13-15]。一般來說,一項干預措施的安全性是其有效性和經濟性的基本前提,同時臨床試驗中收集的危害結局數據通常是比較復雜的,因此,清晰、準確地報告安全性信息對于學術交流和決策者權衡利弊后做出決策至關重要[13,16-17]。臨床試驗中關于干預措施安全性的表述主要有“危害”、“不良事件”、“不良反應”、“并發癥”和“毒副作用”等[13,17]。CONSORT中的“危害”指干預措施任何的可能不良后果的總和[13,18]。盡管CONSORT-Harms規范被制訂用于促進隨機對照試驗中干預危害信息的報告[13],但多項研究表明已發表的隨機對照試驗中使用可視化圖形呈現干預措施的危害信息并不理想[19-21]。例如,一項方法學研究調查了來自4本頂級綜合醫學期刊的184篇隨機對照試驗研究報告,發現僅有22篇(12%)使用圖形展示了不良事件結局的信息[19]。為了幫助研究人員更好地使用可視化統計圖形清晰、準確地報告干預措施的危害結局信息,從而促進隨機對照試驗中危害結局數據的交流,Phillips等[21]近期在BMJ發表了在隨機對照試驗中使用統計圖形可視化干預危害結局信息的共識研究。為了便于國內學者更好地應用該共識,本文對該共識和其中的推薦意見進行了解讀,以期提高國內隨機對照試驗論文中干預措施危害結局數據可視化的質量。
1 制訂過程簡介
研究團隊由20位學術統計師,1位企業統計師,1位學術衛生經濟學家,1位數據圖形設計師和2位臨床醫生,共計25位研究人員組成[21]。團隊所有成員均參與過臨床試驗或對數據可視化感興趣,或二者兼有。共識文件由23位方法學家通過多次共識會議,并在采納2位臨床醫生建議的基礎上形成。研究人員首先利用概況性評價調查了2018年3月—2019年10月發表的用于分析藥物臨床試驗不良事件的新方法[22],并考慮了其他可改編后用于分析不良事件的圖形;再由23位非臨床醫生研究者使用由12個條目組成的評估框架在共識會議上對初步擬定的28種用于呈現藥物臨床試驗中干預危害信息的統計圖形進行了全面評估,并在必要時對圖形進行改進調整。此外,還對2位臨床醫生獨立進行了半結構式訪談以獲得其反饋意見。研究團隊最終確定了10種推薦用于隨機對照試驗報告中呈現危害結局信息的統計圖形,并基于已有的臨床試驗數據繪制了案例圖形[21]。為了與隨機對照試驗的主要目的(即因果推斷)保持一致[21],這些圖形主要適用于進行組間比較的危害結局數據。研究人員根據使用目的(即呈現總體危害情況還是單個危害事件;前者指所有或多個危害結局的匯總,而后者既指任何單個的不良事件,也包括由多個不良事件構成單個危害分類)和結局指標類型(即二分類、計數、連續性和時間-事件結局)對10個統計圖形的適用情況進行了分類,并提供了圖形選擇決策樹(圖1)以幫助研究人員選擇適合的圖形。

2 推薦圖形解讀
2.1 點圖
該共識推薦點圖用于同時呈現多個二分類危害結局數據,能夠同時展示多個二分類不良事件(例如,是否發生惡心、頭痛)的絕對風險和相對風險。以圖2為例,圖中左側部分展示了兩個干預組中發生的多個不良事件的比例,右側部分展示了兩組中多個不良事件的具體數量及組間的相對風險。可使用Stata軟件的“aedot”或“aedots”命令繪制點圖,也可使用R和SAS軟件繪制。

2.2 堆積條形圖
該共識同樣推薦使用堆積條形圖同時呈現多個二分類危害結局數據,不僅能夠同時呈現發生各不良事件的患者具體數量及其占比,還能展示其嚴重程度的信息。以圖3為例,該圖按照干預組別和危害的最大嚴重程度,同時呈現多個不良事件的患者數量及其占比。需要注意的是,根據最大嚴重程度分類是指當某個受試者多次發生同一不良事件時,只對其中最嚴重的不良事件計數。Stata軟件的“graph hbar”命令、R軟件的“barplot”函數或“ggplot2”包以及SAS軟件的“proc gchart”程序均能繪制堆積條形圖。

2.3 條形圖
該共識推薦使用條形圖呈現計數危害結局數據(例如,頭痛的發生次數),能夠展示發生的不良事件的具體數量。以圖4為例,圖4a展示了雙臂研究中各組不良事件的具體數量及對應的患者占比,圖4b展示了三臂研究中各組不良事件的具體數量及對應的患者占比。可使用繪制堆積條形圖的軟件包實現條形圖的繪制。
2.4 KM生存曲線
該共識推薦使用KM生存曲線呈現單個無復發情況的時間-事件危害結局數據(例如,在治療過程中隨時間推移未發生感染的受試者占比信息),能夠展示不同干預組中未發生該不良事件的受試者隨時間推移一直保持無事件的累積比例,同時風險計數表展示了不同時間點未發生該事件、發生該事件及刪失受試者的數量,見圖5。可利用Stata軟件的“kmunicate_stata”程序和R軟件的“KMunicate”包繪制KM生存曲線。

2.5 平均累積函數圖
該共識推薦使用平均累積函數圖呈現單個具有復發情況的時間-事件危害結局數據,能夠展示不同干預組中每個受試者隨時間推移發生的不良事件的平均累計數量,見圖6。推薦使用SAS軟件的可靠性評價過程和“mcfplot”命令來實現平均累積函數圖的繪制。

2.6 生存比率圖
該共識同樣推薦使用生存比率圖呈現單個無復發情況的時間-事件危害結局數據,能夠展示隨時間推移兩個干預組中未發生不良事件概率的非參數估計值的比率及其95%置信區間,見圖7。可使用R軟件“survRatio”包的“drsurv”函數和“ggplot2”包的“ggsurv”函數繪制生存比率圖。

2.7 線圖
該共識推薦使用線圖展示不同干預組中隨時間推移發生變化的連續性危害結局數據(例如,嗜酸性細胞計數的改變),但應具有正態分布的特點,如圖8;此外,風險計數表還能夠展示每個離散時間點具有危害事件風險的受試者的數量。可使用Stata軟件的“twoway connected”和“twoway rspike”命令、R軟件“ggplot2”包的“geom_line”和“geom_errorbar”函數繪制線圖。

2.8 小提琴圖
該共識同樣推薦使用小提琴圖展示不同干預組中隨時間推移發生變化的連續性危害結局數據,如圖9。此圖可作為線圖的替代方案,更重要的是,它還能用于呈現非正態分布的連續性危害結局數據和探索數據分布特點。Stata軟件的“vioplot”命令、R軟件“ggplot2”包的“geom_violin”函數以及SAS的“proc sgpanel”程序均可繪制小提琴圖。

2.9 核密度圖
該共識推薦使用核密度圖展示在某個時間點不同干預組中的連續性危害結局數據,如圖10,可用以探索特定時間點某個連續性危害結局數據或改變量的特點。可使用Stata軟件的“twoway kdensity”命令、R軟件“ggplot2”的“geom_density”函數及SAS軟件的“densityplot”程序繪制核密度圖。

2.10 散點圖矩陣
該共識推薦使用散點圖矩陣展示多個連續性危害結局數據在兩個不同時間點間的關系,如圖11,可用以探索和識別多個連續性危害結局數據中的異常值或者分布模式。可使用Stata軟件的“twoway scatter”命令分別產生每個結局的散點圖,再利用“combine”或“grc1leg”命令組合各圖得到散點圖矩陣。

3 討論
正如“一圖勝千言”所代表的含義,即與單純文本內容相比,科學、美觀的可視化圖形可以直觀、準確地展示數據結構,幫助人們洞察數據背后蘊含的真正規律,從而能夠幫助我們更快地理解和解釋復雜的研究內容[1,23-24]。可視化的圖形還能夠增加人們對某個現象/事物的關注度,使得人們對其認識和理解更加聚焦[24]。“認知負荷”理論認為理解和解釋信息需要消耗精神能量,即認知負荷。認知負荷包括內在負荷(即主題固有的復雜性)、外部負荷(即影響學習的外部因素)和關聯負荷(即組織和理解內容所花費的精神能量)組成部分,而美觀的視覺效果可以減少內在負荷,優化關聯負荷,并消除外部負荷[24]。例如,一種叫做“視覺摘要”(visual abstract)的新型摘要形式,可以使科研論文在推特上的推送信息及其本身的閱讀量均顯著增加[25]。
清晰、直觀地報告隨機對照試驗中干預措施的危害結局信息有助于臨床醫生綜合判斷干預措施的獲益-風險[17-18],以便做出是否選擇該干預措施進行臨床治療的決策。考慮到現有隨機對照試驗報告中使用可視化圖形呈現干預危害結局信息的現狀不佳,同時缺少統一的可操作性強的實踐規范,Phillips Rachel團隊開展了相關系列研究[18-20,22],最終形成了在隨機對照試驗報告中如何選用恰當的統計圖形呈現干預措施危害結局數據的共識推薦[21]。本文對該共識的制訂過程、推薦圖形的特點、適用性及統計軟件作了概述,以期能夠為改進國內隨機對照試驗研究論文中干預措施危害結局信息的報告產生幫助。盡管作者聲明該共識主要基于藥物臨床試驗研究制訂,但我們認為這些圖形也可用于或在改良后用于非藥物干預隨機對照試驗中報告危害結局信息,還可用于非隨機臨床干預研究。作者在原文中提供了對推薦圖形進行改良調整的可能情況,研究者在使用時可在利用決策樹初步確定圖形后,再根據自己的需求對圖形進行改良調整后使用。建議研究者在實際應用時應參照COSORT-Harms指南撰寫研究報告,同時選擇該共識推薦的圖形恰當地呈現醫療干預危害結局數據。此外,學術界在未來還應加強開發能夠同時展示多個時間-事件危害結局數據的統計圖形的力度。
聲明 對該共識的解讀已經通過電子郵件征得原文第一作者Phillips Rachel的同意。所在作者均聲明不存在任何利益沖突。