利用基因變異作為工具變量來推斷暴露與結局關聯性的研究稱為孟德爾隨機化(MR)研究。孟德爾隨機化研究報告規范(STROBE-MR)旨在提高MR研究的透明度和報告質量。為更好地理解、傳播和應用STROBE-MR報告規范,本文對其進行解讀。
引用本文: 劉明, 高亞, 楊珂璐, 許建國, 鄭卿勇, 趙亮, 葛龍, 李倫, 張俊華, 田金徽. 孟德爾隨機化研究的報告規范(STROBE-MR)解讀. 中國循證醫學雜志, 2022, 22(8): 978-987. doi: 10.7507/1672-2531.202112103 復制
基因遺傳學的快速發展,促使孟德爾隨機化(Mendelian randomization,MR)在醫學研究和實踐中的興起與發展[1]。MR一詞最早出現在1991的一個骨髓移植治療兒童惡性腫瘤的研究中,通過基因匹配檢測發現有人類白細胞抗原匹配患兒的骨髓移植接受度優于無匹配患兒[2-3]。可見,通過檢測特定關聯基因的分布可預測治療效果(或暴露結局)。MR利用基因型工具變量,基于工具變量與暴露因素強關聯、工具變量與混雜因素無關聯及工具變量僅通過暴露與結局關聯的三大假設,來推斷暴露與結局的關系[4]。因MR可規避剩余混雜因素對關聯結果準確性的影響,使得關聯結果論證強度比觀察性研究甚至隨機對照試驗還可靠。2021年,Xu等[5]對Web of Science數據中收錄的MR研究分析后發現近年發文數量正快速增長,表明MR研究已成為流行病學的研究熱點。
MR研究與Meta分析、指南等一樣[6-8],也存在質量問題。2015年,Anna等[9]評估99個MR研究的質量后發現方法學質量和報告存在不足。有研究還發現,MR方法學報告不全面會影響關聯結果的準確性[10-11]。因此,2018年Skrivankova等[12]啟動了制定MR研究報告規范的項目,2019年在線發表報告規范的預印本。2021年在JAMA上發表了完整版的STROBE-MR(strengthening the reporting of observational studies in epidemiology using Mendelian randomization)報告規范[13],并在BMJ上發布了英文版解讀[14]。本文結合實例解讀STROBE-MR,以幫助國內研究者更好地理解、傳播和應用STROBE-MR報告規范,從而提高MR研究質量,為人類衛生健康帶來益處。
1 STROBE-MR報告規范概述
STROBE-MR報告規范由標題與摘要、前言、方法、結果、討論和其他信息6個部分組成,共20個條目(表1)。

2 STROBE-MR報告規范條目解讀
本文以多篇已發表的MR研究[15-24]為例對STROBE-MR報告規范條目逐條進行解讀,以促進報告規范在國內的理解、傳播與應用。
2.1 標題與摘要
條目1:在標題和/或摘要中描述研究為MR。
解讀:當MR是主要研究方法時,應在標題中進行描述。若MR僅是研究方法的一部分,標題中可不描述,但需要在摘要中描述。
實例:“心臟代謝、生活方式和營養因素與靜脈曲張的關系:一個孟德爾隨機化研究”一文在標題和摘要中均描述該研究為MR[15]。
2.2 前言
條目2:描述已知的科學背景與理論知識,包括暴露與結局及二者間的潛在關聯。解釋為什么MR是解決問題的潛在方式。
解讀:MR旨在推斷以往研究尚未明確的關聯假設,所以應基于以往研究報告關聯假設的科學背景和理論基礎,并說明MR擬解決的具體問題。如果目前尚無相關理論基礎,作者也應描述MR的暴露因素、結局和擬解決的具體問題。
實例:例文的暴露包括肥胖、生活方式和營養因素,結局指標為靜脈曲張。某些研究已證實這些因素會對血管健康產生影響,而目前缺乏上述暴露因素與靜脈曲張存在關聯的證據。因此利用MR來研究上述暴露因素與靜脈曲張是否有關聯,最終達到預防或延緩疾病進展的目的[15]。
條目3:闡明研究目的,包括預先確定的任何假設。
解讀:MR研究的主要目的是推斷特定的因果關聯,成功的描述會詳細說明人群、暴露和結局及參數等信息,建議以具體假說或問題的形式出現。
實例:例文中描述利用雙樣本MR來探索心臟代謝、生活方式和營養因素是否是靜脈曲張發生的危險因素[15]。
2.3 方法
條目4:描述MR的設計要素,建議用表格呈現MR各階段數據來源的信息。另外,還應描述4a~4e中的內容。
解讀:描述MR研究使用的是個體水平數據還是匯總后的數據,是單樣本還是兩樣本MR。建議用表格來呈現相關信息,以使讀者更容易獲取研究的關鍵數據。如果數據來自原始研究,描述數據的提取過程。若是公開數據,需提供獲取數據的超鏈接和數據庫。若數據來自匯總分析,描述匯總分析過程和評估異質性的過程,以確保能重復匯總分析結果。
實例:例文在數據來源中描述使用了英國生物樣本庫和FinnGen生物樣本庫中的全基因組關聯數據(genome-wide association studies,GWAS),未用表格呈現數據信息[15]。
條目4a:研究設計:如果可能,報告研究設計和研究對象信息。包括研究現場、具體場所和時間范圍,以及研究對象招募、暴露、隨訪和數據收集時間。
解讀:研究對象及其所處環境會隨時間而發生變化,且研究方法也在不斷改進。因此研究對象特征、研究場所和研究時間等暴露相關因素會對研究結果可靠性和推廣性產生影響。因此,在描述研究設計時報告上述信息顯得非常重要。
實例:例文在數據來源中描述英國生物樣本庫和FinnGen生物樣本庫的相關信息,包括樣本收集時間(2006—2010年)、研究場所(英國和芬蘭)和研究對象(歐洲血統)等[15]。
條目4b:研究對象:描述研究對象的招募方式、合格標準和源人群,報告樣本量及是否進行過樣本統計效力和樣本量的估算。
解讀:研究對象相關信息的描述對MR結果的解釋與推廣很重要,研究中要描述研究對象的招募方式、合格標準和源人群。如果直接使用公開發表的研究結果,需標明出處。如果使用的是多個研究的匯總結果,需要報告詳細信息,以便評估不同人群間的異質性。樣本量大小與效果估計的準確度有關,故還應描述是否進行過樣本統計效力的估算。
實例:例文報告了英國生物樣本庫和FinnGen生物樣本庫中研究對象的樣本量,分別是500 000例和218 792例。其還描述了未選擇人群的特征,如非歐洲血統、性別模糊、過度雜合個體等。例文未報告計算樣本量的方法[15]。
條目4c:描述工具變量的檢測方法及其質控標準,以及工具變量篩選標準與方法。
解讀:基因變異工具變量是MR的關鍵成分,如隨機對照試驗的干預措施對RCT很重要一樣。如果使用自定義的工具變量來發表研究,需提供出處。如果通過實驗獲得,需詳細報告實驗獲取的過程。還需描述去除連鎖不平衡的方法和篩選工具變量的閾值,如單核苷酸多態性(single nucleotide polymorphism,SNP)的篩選標準是r2<0.01,clump distance >10 000 kb和P<5×10?8。如使用軟件(如R語言)進行工具變量的篩選,也要報告。
實例:例文中的工具變量來自英國生物樣本庫和FinnGen生物樣本庫,例文中也報告了基因變異工具變量的篩選過程與標準,并在附件表1中提供了更詳細信息[15]。
條目4d:報告暴露、結局和其他變量的定義。如果可能,提供診斷標準。
解讀:明確定義暴露、結局和其他變量,盡可能依據診療指南給出診斷標準。如果需要定義的變量很多,建議對每個變量列一個細節清單,以表格的形式呈現在文中或附件中。
實例:例文在方法學的基因工具變量選擇中描述了每個暴露因素的定義,并提供了定義所依據的參考文獻。比如吸煙參考了Leffondré等的定義,同時結合了吸煙時間和狀態。靜脈曲張的定義分別參考了國際疾病分類第8版、9版和10版的定義[15]。
條目4e:如果相關,提供倫理委員會批準文件和參與者知情同意書。
解讀:為確保研究符合《赫爾辛基宣言》并保證研究對象的利益,需提供倫理委員會批準和參與者知情同意的文件。如果數據來自公開數據或已發表研究,同樣需要提供上述信息。
實例:例文在倫理批準部分明確描述已獲得倫理批準和患者的知情同意,且當前MR也通過了瑞典倫理審查委員會的批準,批號:2019-02793[15]。
條目5:描述MR的三大核心假設:相關性、獨立性和排除限定。如果可能,描述任何附加或敏感性分析的假設。
解讀:描述MR的三大核心假設,以幫助讀者理解MR的研究方法。相關性假設指工具變量與暴露因素強相關;獨立性假設指工具變量與所有混雜因素不相關;排除限定假設指工具變量不直接與結局關聯,僅通過暴露因素與結局產生關聯。其中,工具變量扮演了非常重要的角色。比如,工具變量的多效性會導致偏倚發生,而可通過敏感性分析和MR-Egger回歸分析來檢測和校正多效性所致偏倚。
實例:例文未對三大核心假設進行詳細描述,但分析方法中體現出了核心假設。此外,還描述了3種敏感性分析和水平多效性檢測的方法:加權中位數法、MR-Egger和MR-PRESSO,并報告使用F-統計來計算統計效力和Q-統計量來檢測異質性,同時計算了錯誤發現率(false discovery rate,FDR)[15]。
條目6a:描述定量數據的統計方法(包括尺度、單位和統計模型)。
解讀:統計方法和效應量會對結果解讀產生影響,也會影響與類似研究的比較或影響證據的二次應用。如果轉換了暴露、結局和相關協變量的統計效應量或測量單位,都應該報告。此外,統計模型對最終結果的解釋也有影響,也屬于需要報告的統計方法的范疇。
實例:例文中報告當基因變異工具變量大于3個時使用隨機效應模型進行分析,否則采用固定效應模型;有關暴露、結局和相關協變量的統計效應量或測量單位并沒有發生轉換,因此未報告[15]。
條目6b:描述篩選工具變量的統計方法。如果可能,描述工具變量權重的統計方法。
解讀:多基因評分又稱等位基因評分,可用來評估結果發生風險的高低。與兩階段最小乘法算法相比,多基因評分的統計方法能夠降低偏倚風險和提高覆蓋概率。首先,需要報告多基因評分中選擇變異的標準及其來源,以及是否進行加權分析。其次,需要報告在計算暴露遺傳變異和結局遺傳變異關聯時使用的遺傳模型。同上,MR研究者需要描述篩選工具變量的統計方法,必要時報告統計每個工具變量權重的方法。
實例:例文基于GIANT生物樣本數據庫中的一個GWAS的Meta分析發現的97個與BMI關聯的基因變異進行等位基因評分,并在文中描述了具體的篩選基因工具變量的方法[16]。
條目6c:描述MR統計方法(如二階最小平方法、瓦爾德比法)及其他統計方法。描述相關協變量,如果是兩樣本MR,描述是否在兩個樣本中使用相同的協變量進行校正。
解讀:描述MR的統計分析細節及相關標準誤差的計算方法,如正態近似法或自舉法。還應描述計算暴露遺傳變異和結局遺傳變異的協變量是否存在差異,以降低偏倚風險。
實例:例文中報告暴露相關的基因工具來自一個GWAS的Meta分析的結果,研究人群是108 557位歐洲血統的無糖尿病的成年人,平均為50.6歲,男性占53%,未使用遺傳模型對年齡、性別和研究地點等進行調整分析[17]。此外,文中詳細地描述了具體的MR統計方法及所使用的軟件。
條目6d:描述缺失值的處理方法。
解讀:在估算因果關聯時若有數據缺失會影響結果的準確度,因此需報告暴露、結局和相關協變量缺失數據的比例及具體的處理方法,如缺失值的處理方法和所采取的假設。
實例:例文中報告了4種處理缺失數據的方法,結果發現2.1%的人群C-反應蛋白缺失、2.4%的人群纖維蛋白原缺失、10.8%缺失rs1205、1.9%缺失rs1130864和2.6%缺失rs1800947[18]。
條目6e:如果可能,描述如何處理多變量MR。
解讀:如果某個MR研究了多個暴露因素與結局因素的關聯度,要報告是否處理及如何處理多個關聯度間的關系,并報告處理的依據。
實例:例文中報告癌癥風險和死亡關聯的有意義閾值是0.004,考慮到有6種癌癥,研究中設定的有意義閾值為0.004/36=0.000 1[19]。
條目7:描述先驗知識和評估統計效能的方法。
解讀:暴露和結局關聯的先驗知識是該假設能合理解釋的基礎,在背景部分也已描述,此處可簡單描述。一般來說,模型的統計效能與模型中工具變量所解釋的暴露變異的比例相關。當樣本一定時,工具變量對暴露變異的解釋比例越高,模型統計效能越高。因此,需描述評估模型統計效能的方法,以及統計效能低時的處理方式。常用的評估模型統計效能的方法有F統計、MR-Egger或亞組分析等。
實例:例文中報告使用F統計來估算統計效力,未使用其他方法[15]。
條目8:描述敏感性分析和任何其他分析方法(如處理多種統計方法所得結果、多效性偏倚的校正、分層分析、工具變量強度檢測)。
解讀:敏感性分析可評估效應值的穩健性與偏倚的來源與方向,檢驗分析結果是否在其他分析策略或假設條件下一致,以便對最終結果做出合理解釋。
實例:例文描述了3種檢測敏感性和水平多效性的方法:加權中位數法、MR-Egger和MR-PRESSO,使用F-統計來評估統計效力,使用Q-統計量來檢測異質性,并計算FDR[15]。
條目9a:描述統計所用軟件及軟件包(包括軟件版本及其它相關設置)。
解讀:詳細報告統計分析中所使用的軟件和軟件包,以使具有一定知識水平的讀者能結合原始數據來重現結果或使用同種方法進行類似研究。
實例:例文中報告使用了R軟件(4.0.2),使用的R軟件包有TwoSampleMR、MR-PRESSO、Coloc和MendelianRandomization,均可在R軟件官網免費獲取[15]。
條目9b:報告研究方案的注冊時間與地址。
解讀:報告MR注冊網址、注冊號和鏈接等信息,有利于讀者辨別預先計劃與最終報告間的差異,并評估差異是否會引起偏倚。如果未注冊也應說明,避免讀者花時間查找。
實例:例文在OSF數據庫(https://osf.io/)中注冊了該研究方案,并沒有報告計劃書和研究全文間的差異[15]。
2.4 結果
條目10a:報告各階段納入研究人群的數量,以及各階段排除研究對象的原因,建議使用流程圖。
解讀:提供研究人群的數量及相關信息有助于讀者評估MR結果的有效性與外推性,有利于讀者重復該研究及評估研究是否存在沖撞分層偏倚。報告研究對象被排除的原因,比如失訪、缺乏數據和質量控制等,可幫助讀者判斷樣本人群是否具有代表性,依此判斷是否會產生偏倚。建議用流程圖。
實例:例文在方法學部分提供了樣本人群的數量,在結果中未提供人群的信息。未提供排除人群信息與排除原因,也未使用流程圖[15]。
條目10b:報告暴露、結局和其他相關變量的匯總統計(如均數、標準差和比例)。
解讀:暴露因素、結局和其他協變量的特征和信息有助于讀者判斷研究結果的可比性和結果的外推性。對于連續性變量,采用均數和標準差描述;非連續型變量,可用中位數、百分位數間距和百分比等。建議以表格或圖形的方式呈現統計結果。
實例:例文在附件表1中提供了相關信息,該表格中詳細呈現了研究對象的特征、暴露和潛在混雜因素的信息[15]。
條目10c:如果數據來源是包含原始研究的Meta分析,報告原始研究異質性的評估結果。
解讀:報告暴露和結局相關遺傳變異工具變量異質性的評估結果,有助于讀者判斷異質性對最終結果的影響度。尤其當數據來自Meta分析時,建議用I2值和95%CI評估原始研究間的異質性。
實例:例文表2報告了詳細信息,比如報告了每個SNP所在基因位點、大小、來源樣本數和異質性大小(I2 值)等[20]。
條目10d:適用于兩樣本MR:① 報告暴露樣本-工具變量相關性和結局樣本-工具變量相關性間相似性的檢測結果;② 報告暴露樣本和結局樣本間重疊對象信息。
解讀:單樣本MR中暴露和結局的工具變量來自同一人群,所以容易受到潛在因素的影響,而且MR結果準確度偏低。兩樣本MR中暴露和結局的工具變量來自不同的人群,因此樣本量更大且MR結果更可靠。但是兩樣本MR也要求兩個樣本的人群具有相似的年齡、性別和種族等特征,從而最大限度地控制異質性并降低偏倚。此外,雙樣本中重疊人群信息對結果穩定性也有影響,也在應報告范圍之內。
實例:例文屬于兩樣本MR,在附件表1中列出所有的樣本人群均來自歐洲,因此在人種上異質性很小,并對年齡、性別等因素進行了調整[15]。例文未報告重疊人群信息,也無重疊對象,所以未報告。
條目11a:報告暴露-工具變量間的關聯度和結局-工具變量間的關聯度。
解讀:此處報告的工具變量和暴露的關聯度是工具變量強度檢測的結果(條目8),通過比較暴露的基因型分布也能反映遺傳效應的單一性和線性。報告工具變量和結局間的關聯能初步表明暴露和結局間是否可能存在因果關系。
實例:例文在附件表1和表2中報告了該條目內容,包括工具變量SNP的數量、樣本數量、調整的混雜因素、暴露-工具變量間的關聯度及統計效力等。如在英國生物樣本庫中,BMI與工具變量間的相關度OR為0.89~1.11;在FinnGen生物樣本庫中,BMI與工具變量間的相關度OR為0.91~1.09[15]。
條目11b:報告暴露和結局關聯度的效應值(如OR、RR和SD)及精確度(如95%CI)。
解讀:如果MR分析結果有意義且符合常規,或敏感性分析表明結果很穩定,可直接報告MR分析結果(如RR、RD值)。但是,當同質性假設和單一性假設不成立時,最好不報告MR分析結果。反之,可用非零效應測試代替MR分析結果。
實例:例文在結果中的多數篇幅是對該條目內容的報告,如在英國生物樣本庫中,BMI與靜脈曲張關聯度的OR為1.34,95%CI(1.25,1.43);在FinnGen生物樣本庫中,BMI與靜脈曲張關聯度的OR為1.39,95%CI(1.27,1.52)[15]。
條目11c:如果可能,可將有意義時期內的相對危險度轉換成絕對危險度。
解讀:一般來說,暴露因素的絕對危險度比相對危險度更易被接受。歸因危險度或人群歸因危險度還有助于估計消除/降低暴露后避免不良結局的比例,也就是絕對益處。
實例:例文在結果中多處報告了絕對風險,例如研究發現收縮壓是靜脈曲張的危險因素,血壓每升高10mmHg,發生靜脈曲張的風險升高13%[15]。
條目11d:建議用森林圖和散點圖等呈現結果。
解讀:圖形可更直觀呈現分析結果或判斷結果是否違背相關假設,散點圖、森林圖和漏斗圖是MR研究常用圖形。散點圖中有每個工具變量與暴露、結局的關聯度值及置信區間,以直線斜率表示估計的暴露和結局的關聯。森林圖中展示了每個工具變量對因果關聯的估計值和置信區間,而且可目測異質性的來源。漏斗圖用于呈現水平多效性的檢測結果,根據因果關聯的估計值和置信區間繪制,通過目測是否對稱來判斷結果是否存在偏倚風險。
實例:在Vimaleswaran等[21]評估維生素D和肥胖關系的一文中使用森林圖呈現了分析結果。在Mountjoy等[22]評估受教育程度和近視間關系的一文中使用散點圖呈現了二者間的關聯度。
條目12a:報告對模型統計效能的評估結果。
解讀:目前來說,模型統計效能的評估有相關性假設評估、獨立性假設評估、排除限定假設評估和同質性評估等。當然,隨著MR方法學的發展,不排除以其他方式來評估模型的統計效能。
實例:例文在全文及附件中多處報告了相關假設有效性的評估結果,如附件表2和附件表4[15]。例如在附件表2中,報告了每個關聯中工具變量的統計效力,結果以F統計值表示。附件表4中以Q統計量檢測了統計模型的異質性,以評估其穩定性。
條目12b:報告任何其它的統計結果(如工具變量的異質性檢驗:I2、Q統計量和E值)。
解讀:Q統計量和I2用于評估各工具變量估計的因果關系的異質性大小。E值用來解釋未關注的混雜因素對工具變量估計的因果關系的影響程度,較大的E值也可用來解釋很難詮釋的非零效應。
實例:例文在附件表4中報告了Q統計量的結果,如報告了BMI與靜脈曲張關聯時使用了311個SNP作為工具變量,Q統計量為466[15]。
條目13a:報告敏感度分析結果以評估可能違反假設的結果的穩健性。
解讀:通過比較不同統計方法獲得的結果,來評估可能違反假設的結果的穩健性。如果多種方法的結果一致,說明分析所得的暴露和結局之間的因果關系更為可靠。
實例:例文在附件表4中呈現了三種分析方法得到的MR分析結果,包括加權中位數法、MR-Egger和MR-PRESSO。例如評估BMI與靜脈曲張的關系,加權中位數法計算的OR值為1.34,MR-Egger計算的OR值為1.54,MR-PRESSO計算的OR值為1.24[15]。
條目13b:報告其他敏感性分析及其他分析結果。
解讀:與方法學部分對應,如果進行了其他分析也應該在結果部分進行報告,比如留一法、FDR。
實例:例文在附件表4和附件表5中對其他分析結果進行了報告,如留一法、FDR[15]。
條目13c:報告任何因果關聯方向的評估(如雙向MR)。
解讀:雙向MR可用來評估暴露和結局間是否存在反向因果關系,因此需要兩組獨立的工具變量分別進行2次MR分析來評估暴露和結局間的因果關系。
實例:“維生素D與肥胖:多隊列的雙向孟德爾隨機化研究”一文在結果中報告了雙向MR結果的評估,它發現血液中維生素D濃度與BMI相關,而BMI與維生素D濃度的高低無關[21]。
條目13d:如果可能,報告并比較非MR分析的結果。
解讀:每種不同研究方法具有其自身的優缺點,統計效力也各不相同。通過與非MR分析結果的比較,相當于將MR分析結果置于整個證據池中,有助于讀者理解MR分析的優缺點并區別不同研究結果間的差異。
實例:“教育與近視:利用孟德爾隨機化評估因果關聯的方向”一文在結果部分報告了MR結果與非MR結果的比較:通過內生性檢驗發現MR結果與非MR研究結果不一致[22]。
條目13e:建議用圖可視化呈現分析結果(如留一法)。
解讀:盡量在全文或附件中用圖形來呈現分析結果,以幫助讀者對分析結果的理解。
實例:見例文圖4和附件2[23]。
2.5 討論
條目14:概括與研究假設有關的重要結果。
解讀:建議結合研究目的簡短地總結主要的研究結果,并說明其重要性。這有助于幫助讀者理解研究目的和研究結果,也便于作者在討論中進一步解釋和說明。
實例:例文在討論的第一段報告了所有關鍵結果:身高、BMI、吸煙和血清鐵是靜脈曲張發生的危險因素,它們之間呈正比關系。收縮壓、血清鈣和鋅是靜脈曲張的保護因素,它們之間呈反比關系[15]。
條目15:結合工具變量的有效性、潛在偏倚和不精確性的來源討論研究的局限性,并討論潛在偏倚的方向和大小,以及解決上述問題所采取的辦法。
解讀:討論MR分析過程中可避免或不可避免的局限性,尤其是討論三大假設的合理性非常重要(有些假設不能通過研究結果來驗證),這都是正規報告的必要部分。
實例:例文中通過很大的篇幅從數據來源、三大假設和分析過程對研究的局限性進行了討論,內容詳實[15]。
條目16a:意義:結合局限性和類似研究結果,謹慎給出全面的結果解釋。
解讀:通過將MR結果與相似證據進行關聯,在已有證據的基礎上進行討論,并分析存在不同研究結果的原因。如此有助于讀者理解研究結果,從而提升結果實際意義。
實例:例文中用最大的篇幅討論了該條目內容,通過與多個已發表研究進行比較來對MR結果進行了合理解釋[15]。
條目16b:機制:討論暴露和結局關聯的潛在生物學機制和基因-表型的等效假設是否合理。謹慎解釋,在某些假設成立的基礎上,基于工具變量的暴露和結局的因果關系可能才存在。
解讀:盡管基因變異作為工具變量的生物學機制往往是未知的,但討論時應考慮各種潛在的可能。如此才能幫助讀者在潛在的生物學機制的基礎上理解MR分析所得的暴露和結局間的因果關系,也能使這種因果關系顯得合理。
實例:例文中描述了生物學機制,如吸煙能引起全身內皮損傷從而導致靜脈曲張[15]。
條目16c:臨床相關性:討論結果是否具有臨床或公共決策相關性,并討論相關性的大小。
解讀:如果存在,作者應描述MR分析出的因果關系對臨床實踐和公共決策的影響。當研究暴露因素與結局的關聯時,有時受限于試驗條件或倫理道德,并不能進行隨機對照試驗,此時,利用遺傳變異作為工具變量的MR會得出比觀察性研究或回顧性研究更為可靠且類似隨機對照試驗的結果。但是,也正是因為使用的工具變量是遺傳變異,當把結果置于臨床實踐或公共決策中時,可能會受其他因素的影響,因此應謹慎解釋MR結果的外推性。
實例:例文報告了162個SNP的多效性程度具有不確定性,因此MR結果也具有不確定性,但仍然可得出結論[24]。
條目17:討論結果在其他人群、其他暴露時間和其他暴露因素水平的普適性。
解讀:此處是指討論研究結果的可推廣性,即外推有效性。主要指MR結果在其他情形下的可被利用程度,一般要依據研究地點、研究對象、暴露和結局的特點來判斷。因此,應盡可能的體現研究場所與條件、研究對象特征、暴露定義及其測量標準、結局及其測量標準和隨訪時間等信息。
實例:例文在討論中報告“此外,本研究局限于歐洲血統的人群雖然能減少人口結構帶來的潛在偏倚,但限制了MR結果適用于其他人口的可推廣性”[15]。
2.6 其他信息
條目18:報告當前研究的資助來源和資助者及在當前研究中的角色。如果可能,報告原始研究的資助情況。
解讀:研究受資助情況與研究結論間存在一定聯系,資助者在研究的哪部分起什么作用都應該被報告,如研究設計、數據收集、數據分析、論文撰寫或發表。因此,如實陳述有助于讀者判斷研究是否受到資助者的影響。
實例:例文受到了來自瑞典的多項資助,編號2018-00123和2019-00977;也得到了美國退伍軍人事務部的資助(IK2-CX001780)。但作者已表明最終研究結果不代表上述機構的觀點[15]。
條目19:提供當前研究的數據來源地和獲取方式,并引用數據來源。提供重現研究所需代碼,若代碼可公開獲取,提供獲取地址和方式。
解讀:分享數據和分析代碼有利于重現研究結果、發現錯誤和掌握分析方法,數據和分析代碼可置于正文、附件或開放的公共數據庫中。
實例:例文在方法學開始部分提供了所有資料的獲取地址:Open Science Framework data respiratory(https://osf.io/9s3hd/)[15]。
條目20:聲明全部作者潛在的利益沖突。
解讀:與研究結果存在利益沖突的組織或團體的加入,可能會對MR結果的真實性和可信度產生不利影響。報告所有作者的任何利益沖突,有利于讀者評估所有的利益沖突是否會對研究過程和結果產生影響。
實例:例文報告了作者利益沖突信息,也報告了可能存在利益沖突的作者的受資助情況[15]。
3 總結
STROBE-MR報告規范是MR研究的報告指南,也是一個最低報告標準,對提高MR研究質量、改善透明度和重現分析結果至關重要。隨著基因遺傳學的發展及越來越多的研究者將掌握該研究方法,越發凸顯出STROBE-MR報告規范的重要性。本文通過對其進行解讀,以期推動STROBE-MR報告規范在國內的理解、傳播與應用。
本文發現與STROBE報告規范相比,STROBE-MR報告規范的延伸之處有:① 前言:STROBE-MR報告規范更重視對已有科學背景和理論知識的描述,因為暴露和結局的關聯必須建立在病理生理基礎之上。脫離了理論基礎,統計出的暴露和結局關聯再強,也將失去實際意義。② 方法:除選擇研究對象之外,如何選擇恰當的工具變量在MR中非常關鍵。因此,STROBE-MR報告規范中要求詳細報告工具變量相關信息。另外,統計方法也是MR與其他流行病學研究的主要不同之處。因此STROBE-MR報告規范要求詳細報告所使用的統計方法及其軟件。最后,統計方法中對統計效能的估計也非常重要,需要使用多種不同的方法進行評估,也是STROBE-MR報告規范的主要延伸之處。③ 結果:與方法部分對應。④ 討論:與背景部分對應,STROBE-MR報告規范要求結合病理生理機制進行相應討論。⑤ 其他信息:因為數據化時代的來臨,STROBE-MR報告規范對數據共享也提出了要求。
通過對STROBE-MR報告規范的解讀,我們認為該規范可能的作用如下:① 初學者通過理解該規范,可實現對MR研究的入門學習;② 指導正進行MR的研究者生產出高質量的MR研究;③ 編輯和審稿人可依照規范對MR研究報告質量進行評估,并篩選出高質量MR研究進行發表,以促進醫學的發展;④ 利用報告規范對已有的MR研究質量進行評估,從而發現問題以為未來MR研究提供參考。因此,國內外期刊應盡快將STROBE-MR報告規范納入其稿約中,并要求作者在投稿時提供STROBE-MR清單檢查表。
本文還發現了STROBE-MR報告規范可能存在不足:① 可參照PRISMA-DTA摘要清單對MR的摘要報告提出更為具體的要求,如結構式摘要[25];② STROBE-MR報告規范并沒有要求對注冊內容或計劃書中修改內容進行解釋;③ STROBE-MR報告規范并沒有要求討論研究結果對未來研究的意義。可見,隨著MR方法學的發展和時代的進步,STROBE-MR報告規范也需要及時更新和完善。
總之,STROBE-MR報告規范將為提高MR研究質量提供不可估量的價值,也將提高MR研究的學術價值與臨床意義。
基因遺傳學的快速發展,促使孟德爾隨機化(Mendelian randomization,MR)在醫學研究和實踐中的興起與發展[1]。MR一詞最早出現在1991的一個骨髓移植治療兒童惡性腫瘤的研究中,通過基因匹配檢測發現有人類白細胞抗原匹配患兒的骨髓移植接受度優于無匹配患兒[2-3]。可見,通過檢測特定關聯基因的分布可預測治療效果(或暴露結局)。MR利用基因型工具變量,基于工具變量與暴露因素強關聯、工具變量與混雜因素無關聯及工具變量僅通過暴露與結局關聯的三大假設,來推斷暴露與結局的關系[4]。因MR可規避剩余混雜因素對關聯結果準確性的影響,使得關聯結果論證強度比觀察性研究甚至隨機對照試驗還可靠。2021年,Xu等[5]對Web of Science數據中收錄的MR研究分析后發現近年發文數量正快速增長,表明MR研究已成為流行病學的研究熱點。
MR研究與Meta分析、指南等一樣[6-8],也存在質量問題。2015年,Anna等[9]評估99個MR研究的質量后發現方法學質量和報告存在不足。有研究還發現,MR方法學報告不全面會影響關聯結果的準確性[10-11]。因此,2018年Skrivankova等[12]啟動了制定MR研究報告規范的項目,2019年在線發表報告規范的預印本。2021年在JAMA上發表了完整版的STROBE-MR(strengthening the reporting of observational studies in epidemiology using Mendelian randomization)報告規范[13],并在BMJ上發布了英文版解讀[14]。本文結合實例解讀STROBE-MR,以幫助國內研究者更好地理解、傳播和應用STROBE-MR報告規范,從而提高MR研究質量,為人類衛生健康帶來益處。
1 STROBE-MR報告規范概述
STROBE-MR報告規范由標題與摘要、前言、方法、結果、討論和其他信息6個部分組成,共20個條目(表1)。

2 STROBE-MR報告規范條目解讀
本文以多篇已發表的MR研究[15-24]為例對STROBE-MR報告規范條目逐條進行解讀,以促進報告規范在國內的理解、傳播與應用。
2.1 標題與摘要
條目1:在標題和/或摘要中描述研究為MR。
解讀:當MR是主要研究方法時,應在標題中進行描述。若MR僅是研究方法的一部分,標題中可不描述,但需要在摘要中描述。
實例:“心臟代謝、生活方式和營養因素與靜脈曲張的關系:一個孟德爾隨機化研究”一文在標題和摘要中均描述該研究為MR[15]。
2.2 前言
條目2:描述已知的科學背景與理論知識,包括暴露與結局及二者間的潛在關聯。解釋為什么MR是解決問題的潛在方式。
解讀:MR旨在推斷以往研究尚未明確的關聯假設,所以應基于以往研究報告關聯假設的科學背景和理論基礎,并說明MR擬解決的具體問題。如果目前尚無相關理論基礎,作者也應描述MR的暴露因素、結局和擬解決的具體問題。
實例:例文的暴露包括肥胖、生活方式和營養因素,結局指標為靜脈曲張。某些研究已證實這些因素會對血管健康產生影響,而目前缺乏上述暴露因素與靜脈曲張存在關聯的證據。因此利用MR來研究上述暴露因素與靜脈曲張是否有關聯,最終達到預防或延緩疾病進展的目的[15]。
條目3:闡明研究目的,包括預先確定的任何假設。
解讀:MR研究的主要目的是推斷特定的因果關聯,成功的描述會詳細說明人群、暴露和結局及參數等信息,建議以具體假說或問題的形式出現。
實例:例文中描述利用雙樣本MR來探索心臟代謝、生活方式和營養因素是否是靜脈曲張發生的危險因素[15]。
2.3 方法
條目4:描述MR的設計要素,建議用表格呈現MR各階段數據來源的信息。另外,還應描述4a~4e中的內容。
解讀:描述MR研究使用的是個體水平數據還是匯總后的數據,是單樣本還是兩樣本MR。建議用表格來呈現相關信息,以使讀者更容易獲取研究的關鍵數據。如果數據來自原始研究,描述數據的提取過程。若是公開數據,需提供獲取數據的超鏈接和數據庫。若數據來自匯總分析,描述匯總分析過程和評估異質性的過程,以確保能重復匯總分析結果。
實例:例文在數據來源中描述使用了英國生物樣本庫和FinnGen生物樣本庫中的全基因組關聯數據(genome-wide association studies,GWAS),未用表格呈現數據信息[15]。
條目4a:研究設計:如果可能,報告研究設計和研究對象信息。包括研究現場、具體場所和時間范圍,以及研究對象招募、暴露、隨訪和數據收集時間。
解讀:研究對象及其所處環境會隨時間而發生變化,且研究方法也在不斷改進。因此研究對象特征、研究場所和研究時間等暴露相關因素會對研究結果可靠性和推廣性產生影響。因此,在描述研究設計時報告上述信息顯得非常重要。
實例:例文在數據來源中描述英國生物樣本庫和FinnGen生物樣本庫的相關信息,包括樣本收集時間(2006—2010年)、研究場所(英國和芬蘭)和研究對象(歐洲血統)等[15]。
條目4b:研究對象:描述研究對象的招募方式、合格標準和源人群,報告樣本量及是否進行過樣本統計效力和樣本量的估算。
解讀:研究對象相關信息的描述對MR結果的解釋與推廣很重要,研究中要描述研究對象的招募方式、合格標準和源人群。如果直接使用公開發表的研究結果,需標明出處。如果使用的是多個研究的匯總結果,需要報告詳細信息,以便評估不同人群間的異質性。樣本量大小與效果估計的準確度有關,故還應描述是否進行過樣本統計效力的估算。
實例:例文報告了英國生物樣本庫和FinnGen生物樣本庫中研究對象的樣本量,分別是500 000例和218 792例。其還描述了未選擇人群的特征,如非歐洲血統、性別模糊、過度雜合個體等。例文未報告計算樣本量的方法[15]。
條目4c:描述工具變量的檢測方法及其質控標準,以及工具變量篩選標準與方法。
解讀:基因變異工具變量是MR的關鍵成分,如隨機對照試驗的干預措施對RCT很重要一樣。如果使用自定義的工具變量來發表研究,需提供出處。如果通過實驗獲得,需詳細報告實驗獲取的過程。還需描述去除連鎖不平衡的方法和篩選工具變量的閾值,如單核苷酸多態性(single nucleotide polymorphism,SNP)的篩選標準是r2<0.01,clump distance >10 000 kb和P<5×10?8。如使用軟件(如R語言)進行工具變量的篩選,也要報告。
實例:例文中的工具變量來自英國生物樣本庫和FinnGen生物樣本庫,例文中也報告了基因變異工具變量的篩選過程與標準,并在附件表1中提供了更詳細信息[15]。
條目4d:報告暴露、結局和其他變量的定義。如果可能,提供診斷標準。
解讀:明確定義暴露、結局和其他變量,盡可能依據診療指南給出診斷標準。如果需要定義的變量很多,建議對每個變量列一個細節清單,以表格的形式呈現在文中或附件中。
實例:例文在方法學的基因工具變量選擇中描述了每個暴露因素的定義,并提供了定義所依據的參考文獻。比如吸煙參考了Leffondré等的定義,同時結合了吸煙時間和狀態。靜脈曲張的定義分別參考了國際疾病分類第8版、9版和10版的定義[15]。
條目4e:如果相關,提供倫理委員會批準文件和參與者知情同意書。
解讀:為確保研究符合《赫爾辛基宣言》并保證研究對象的利益,需提供倫理委員會批準和參與者知情同意的文件。如果數據來自公開數據或已發表研究,同樣需要提供上述信息。
實例:例文在倫理批準部分明確描述已獲得倫理批準和患者的知情同意,且當前MR也通過了瑞典倫理審查委員會的批準,批號:2019-02793[15]。
條目5:描述MR的三大核心假設:相關性、獨立性和排除限定。如果可能,描述任何附加或敏感性分析的假設。
解讀:描述MR的三大核心假設,以幫助讀者理解MR的研究方法。相關性假設指工具變量與暴露因素強相關;獨立性假設指工具變量與所有混雜因素不相關;排除限定假設指工具變量不直接與結局關聯,僅通過暴露因素與結局產生關聯。其中,工具變量扮演了非常重要的角色。比如,工具變量的多效性會導致偏倚發生,而可通過敏感性分析和MR-Egger回歸分析來檢測和校正多效性所致偏倚。
實例:例文未對三大核心假設進行詳細描述,但分析方法中體現出了核心假設。此外,還描述了3種敏感性分析和水平多效性檢測的方法:加權中位數法、MR-Egger和MR-PRESSO,并報告使用F-統計來計算統計效力和Q-統計量來檢測異質性,同時計算了錯誤發現率(false discovery rate,FDR)[15]。
條目6a:描述定量數據的統計方法(包括尺度、單位和統計模型)。
解讀:統計方法和效應量會對結果解讀產生影響,也會影響與類似研究的比較或影響證據的二次應用。如果轉換了暴露、結局和相關協變量的統計效應量或測量單位,都應該報告。此外,統計模型對最終結果的解釋也有影響,也屬于需要報告的統計方法的范疇。
實例:例文中報告當基因變異工具變量大于3個時使用隨機效應模型進行分析,否則采用固定效應模型;有關暴露、結局和相關協變量的統計效應量或測量單位并沒有發生轉換,因此未報告[15]。
條目6b:描述篩選工具變量的統計方法。如果可能,描述工具變量權重的統計方法。
解讀:多基因評分又稱等位基因評分,可用來評估結果發生風險的高低。與兩階段最小乘法算法相比,多基因評分的統計方法能夠降低偏倚風險和提高覆蓋概率。首先,需要報告多基因評分中選擇變異的標準及其來源,以及是否進行加權分析。其次,需要報告在計算暴露遺傳變異和結局遺傳變異關聯時使用的遺傳模型。同上,MR研究者需要描述篩選工具變量的統計方法,必要時報告統計每個工具變量權重的方法。
實例:例文基于GIANT生物樣本數據庫中的一個GWAS的Meta分析發現的97個與BMI關聯的基因變異進行等位基因評分,并在文中描述了具體的篩選基因工具變量的方法[16]。
條目6c:描述MR統計方法(如二階最小平方法、瓦爾德比法)及其他統計方法。描述相關協變量,如果是兩樣本MR,描述是否在兩個樣本中使用相同的協變量進行校正。
解讀:描述MR的統計分析細節及相關標準誤差的計算方法,如正態近似法或自舉法。還應描述計算暴露遺傳變異和結局遺傳變異的協變量是否存在差異,以降低偏倚風險。
實例:例文中報告暴露相關的基因工具來自一個GWAS的Meta分析的結果,研究人群是108 557位歐洲血統的無糖尿病的成年人,平均為50.6歲,男性占53%,未使用遺傳模型對年齡、性別和研究地點等進行調整分析[17]。此外,文中詳細地描述了具體的MR統計方法及所使用的軟件。
條目6d:描述缺失值的處理方法。
解讀:在估算因果關聯時若有數據缺失會影響結果的準確度,因此需報告暴露、結局和相關協變量缺失數據的比例及具體的處理方法,如缺失值的處理方法和所采取的假設。
實例:例文中報告了4種處理缺失數據的方法,結果發現2.1%的人群C-反應蛋白缺失、2.4%的人群纖維蛋白原缺失、10.8%缺失rs1205、1.9%缺失rs1130864和2.6%缺失rs1800947[18]。
條目6e:如果可能,描述如何處理多變量MR。
解讀:如果某個MR研究了多個暴露因素與結局因素的關聯度,要報告是否處理及如何處理多個關聯度間的關系,并報告處理的依據。
實例:例文中報告癌癥風險和死亡關聯的有意義閾值是0.004,考慮到有6種癌癥,研究中設定的有意義閾值為0.004/36=0.000 1[19]。
條目7:描述先驗知識和評估統計效能的方法。
解讀:暴露和結局關聯的先驗知識是該假設能合理解釋的基礎,在背景部分也已描述,此處可簡單描述。一般來說,模型的統計效能與模型中工具變量所解釋的暴露變異的比例相關。當樣本一定時,工具變量對暴露變異的解釋比例越高,模型統計效能越高。因此,需描述評估模型統計效能的方法,以及統計效能低時的處理方式。常用的評估模型統計效能的方法有F統計、MR-Egger或亞組分析等。
實例:例文中報告使用F統計來估算統計效力,未使用其他方法[15]。
條目8:描述敏感性分析和任何其他分析方法(如處理多種統計方法所得結果、多效性偏倚的校正、分層分析、工具變量強度檢測)。
解讀:敏感性分析可評估效應值的穩健性與偏倚的來源與方向,檢驗分析結果是否在其他分析策略或假設條件下一致,以便對最終結果做出合理解釋。
實例:例文描述了3種檢測敏感性和水平多效性的方法:加權中位數法、MR-Egger和MR-PRESSO,使用F-統計來評估統計效力,使用Q-統計量來檢測異質性,并計算FDR[15]。
條目9a:描述統計所用軟件及軟件包(包括軟件版本及其它相關設置)。
解讀:詳細報告統計分析中所使用的軟件和軟件包,以使具有一定知識水平的讀者能結合原始數據來重現結果或使用同種方法進行類似研究。
實例:例文中報告使用了R軟件(4.0.2),使用的R軟件包有TwoSampleMR、MR-PRESSO、Coloc和MendelianRandomization,均可在R軟件官網免費獲取[15]。
條目9b:報告研究方案的注冊時間與地址。
解讀:報告MR注冊網址、注冊號和鏈接等信息,有利于讀者辨別預先計劃與最終報告間的差異,并評估差異是否會引起偏倚。如果未注冊也應說明,避免讀者花時間查找。
實例:例文在OSF數據庫(https://osf.io/)中注冊了該研究方案,并沒有報告計劃書和研究全文間的差異[15]。
2.4 結果
條目10a:報告各階段納入研究人群的數量,以及各階段排除研究對象的原因,建議使用流程圖。
解讀:提供研究人群的數量及相關信息有助于讀者評估MR結果的有效性與外推性,有利于讀者重復該研究及評估研究是否存在沖撞分層偏倚。報告研究對象被排除的原因,比如失訪、缺乏數據和質量控制等,可幫助讀者判斷樣本人群是否具有代表性,依此判斷是否會產生偏倚。建議用流程圖。
實例:例文在方法學部分提供了樣本人群的數量,在結果中未提供人群的信息。未提供排除人群信息與排除原因,也未使用流程圖[15]。
條目10b:報告暴露、結局和其他相關變量的匯總統計(如均數、標準差和比例)。
解讀:暴露因素、結局和其他協變量的特征和信息有助于讀者判斷研究結果的可比性和結果的外推性。對于連續性變量,采用均數和標準差描述;非連續型變量,可用中位數、百分位數間距和百分比等。建議以表格或圖形的方式呈現統計結果。
實例:例文在附件表1中提供了相關信息,該表格中詳細呈現了研究對象的特征、暴露和潛在混雜因素的信息[15]。
條目10c:如果數據來源是包含原始研究的Meta分析,報告原始研究異質性的評估結果。
解讀:報告暴露和結局相關遺傳變異工具變量異質性的評估結果,有助于讀者判斷異質性對最終結果的影響度。尤其當數據來自Meta分析時,建議用I2值和95%CI評估原始研究間的異質性。
實例:例文表2報告了詳細信息,比如報告了每個SNP所在基因位點、大小、來源樣本數和異質性大小(I2 值)等[20]。
條目10d:適用于兩樣本MR:① 報告暴露樣本-工具變量相關性和結局樣本-工具變量相關性間相似性的檢測結果;② 報告暴露樣本和結局樣本間重疊對象信息。
解讀:單樣本MR中暴露和結局的工具變量來自同一人群,所以容易受到潛在因素的影響,而且MR結果準確度偏低。兩樣本MR中暴露和結局的工具變量來自不同的人群,因此樣本量更大且MR結果更可靠。但是兩樣本MR也要求兩個樣本的人群具有相似的年齡、性別和種族等特征,從而最大限度地控制異質性并降低偏倚。此外,雙樣本中重疊人群信息對結果穩定性也有影響,也在應報告范圍之內。
實例:例文屬于兩樣本MR,在附件表1中列出所有的樣本人群均來自歐洲,因此在人種上異質性很小,并對年齡、性別等因素進行了調整[15]。例文未報告重疊人群信息,也無重疊對象,所以未報告。
條目11a:報告暴露-工具變量間的關聯度和結局-工具變量間的關聯度。
解讀:此處報告的工具變量和暴露的關聯度是工具變量強度檢測的結果(條目8),通過比較暴露的基因型分布也能反映遺傳效應的單一性和線性。報告工具變量和結局間的關聯能初步表明暴露和結局間是否可能存在因果關系。
實例:例文在附件表1和表2中報告了該條目內容,包括工具變量SNP的數量、樣本數量、調整的混雜因素、暴露-工具變量間的關聯度及統計效力等。如在英國生物樣本庫中,BMI與工具變量間的相關度OR為0.89~1.11;在FinnGen生物樣本庫中,BMI與工具變量間的相關度OR為0.91~1.09[15]。
條目11b:報告暴露和結局關聯度的效應值(如OR、RR和SD)及精確度(如95%CI)。
解讀:如果MR分析結果有意義且符合常規,或敏感性分析表明結果很穩定,可直接報告MR分析結果(如RR、RD值)。但是,當同質性假設和單一性假設不成立時,最好不報告MR分析結果。反之,可用非零效應測試代替MR分析結果。
實例:例文在結果中的多數篇幅是對該條目內容的報告,如在英國生物樣本庫中,BMI與靜脈曲張關聯度的OR為1.34,95%CI(1.25,1.43);在FinnGen生物樣本庫中,BMI與靜脈曲張關聯度的OR為1.39,95%CI(1.27,1.52)[15]。
條目11c:如果可能,可將有意義時期內的相對危險度轉換成絕對危險度。
解讀:一般來說,暴露因素的絕對危險度比相對危險度更易被接受。歸因危險度或人群歸因危險度還有助于估計消除/降低暴露后避免不良結局的比例,也就是絕對益處。
實例:例文在結果中多處報告了絕對風險,例如研究發現收縮壓是靜脈曲張的危險因素,血壓每升高10mmHg,發生靜脈曲張的風險升高13%[15]。
條目11d:建議用森林圖和散點圖等呈現結果。
解讀:圖形可更直觀呈現分析結果或判斷結果是否違背相關假設,散點圖、森林圖和漏斗圖是MR研究常用圖形。散點圖中有每個工具變量與暴露、結局的關聯度值及置信區間,以直線斜率表示估計的暴露和結局的關聯。森林圖中展示了每個工具變量對因果關聯的估計值和置信區間,而且可目測異質性的來源。漏斗圖用于呈現水平多效性的檢測結果,根據因果關聯的估計值和置信區間繪制,通過目測是否對稱來判斷結果是否存在偏倚風險。
實例:在Vimaleswaran等[21]評估維生素D和肥胖關系的一文中使用森林圖呈現了分析結果。在Mountjoy等[22]評估受教育程度和近視間關系的一文中使用散點圖呈現了二者間的關聯度。
條目12a:報告對模型統計效能的評估結果。
解讀:目前來說,模型統計效能的評估有相關性假設評估、獨立性假設評估、排除限定假設評估和同質性評估等。當然,隨著MR方法學的發展,不排除以其他方式來評估模型的統計效能。
實例:例文在全文及附件中多處報告了相關假設有效性的評估結果,如附件表2和附件表4[15]。例如在附件表2中,報告了每個關聯中工具變量的統計效力,結果以F統計值表示。附件表4中以Q統計量檢測了統計模型的異質性,以評估其穩定性。
條目12b:報告任何其它的統計結果(如工具變量的異質性檢驗:I2、Q統計量和E值)。
解讀:Q統計量和I2用于評估各工具變量估計的因果關系的異質性大小。E值用來解釋未關注的混雜因素對工具變量估計的因果關系的影響程度,較大的E值也可用來解釋很難詮釋的非零效應。
實例:例文在附件表4中報告了Q統計量的結果,如報告了BMI與靜脈曲張關聯時使用了311個SNP作為工具變量,Q統計量為466[15]。
條目13a:報告敏感度分析結果以評估可能違反假設的結果的穩健性。
解讀:通過比較不同統計方法獲得的結果,來評估可能違反假設的結果的穩健性。如果多種方法的結果一致,說明分析所得的暴露和結局之間的因果關系更為可靠。
實例:例文在附件表4中呈現了三種分析方法得到的MR分析結果,包括加權中位數法、MR-Egger和MR-PRESSO。例如評估BMI與靜脈曲張的關系,加權中位數法計算的OR值為1.34,MR-Egger計算的OR值為1.54,MR-PRESSO計算的OR值為1.24[15]。
條目13b:報告其他敏感性分析及其他分析結果。
解讀:與方法學部分對應,如果進行了其他分析也應該在結果部分進行報告,比如留一法、FDR。
實例:例文在附件表4和附件表5中對其他分析結果進行了報告,如留一法、FDR[15]。
條目13c:報告任何因果關聯方向的評估(如雙向MR)。
解讀:雙向MR可用來評估暴露和結局間是否存在反向因果關系,因此需要兩組獨立的工具變量分別進行2次MR分析來評估暴露和結局間的因果關系。
實例:“維生素D與肥胖:多隊列的雙向孟德爾隨機化研究”一文在結果中報告了雙向MR結果的評估,它發現血液中維生素D濃度與BMI相關,而BMI與維生素D濃度的高低無關[21]。
條目13d:如果可能,報告并比較非MR分析的結果。
解讀:每種不同研究方法具有其自身的優缺點,統計效力也各不相同。通過與非MR分析結果的比較,相當于將MR分析結果置于整個證據池中,有助于讀者理解MR分析的優缺點并區別不同研究結果間的差異。
實例:“教育與近視:利用孟德爾隨機化評估因果關聯的方向”一文在結果部分報告了MR結果與非MR結果的比較:通過內生性檢驗發現MR結果與非MR研究結果不一致[22]。
條目13e:建議用圖可視化呈現分析結果(如留一法)。
解讀:盡量在全文或附件中用圖形來呈現分析結果,以幫助讀者對分析結果的理解。
實例:見例文圖4和附件2[23]。
2.5 討論
條目14:概括與研究假設有關的重要結果。
解讀:建議結合研究目的簡短地總結主要的研究結果,并說明其重要性。這有助于幫助讀者理解研究目的和研究結果,也便于作者在討論中進一步解釋和說明。
實例:例文在討論的第一段報告了所有關鍵結果:身高、BMI、吸煙和血清鐵是靜脈曲張發生的危險因素,它們之間呈正比關系。收縮壓、血清鈣和鋅是靜脈曲張的保護因素,它們之間呈反比關系[15]。
條目15:結合工具變量的有效性、潛在偏倚和不精確性的來源討論研究的局限性,并討論潛在偏倚的方向和大小,以及解決上述問題所采取的辦法。
解讀:討論MR分析過程中可避免或不可避免的局限性,尤其是討論三大假設的合理性非常重要(有些假設不能通過研究結果來驗證),這都是正規報告的必要部分。
實例:例文中通過很大的篇幅從數據來源、三大假設和分析過程對研究的局限性進行了討論,內容詳實[15]。
條目16a:意義:結合局限性和類似研究結果,謹慎給出全面的結果解釋。
解讀:通過將MR結果與相似證據進行關聯,在已有證據的基礎上進行討論,并分析存在不同研究結果的原因。如此有助于讀者理解研究結果,從而提升結果實際意義。
實例:例文中用最大的篇幅討論了該條目內容,通過與多個已發表研究進行比較來對MR結果進行了合理解釋[15]。
條目16b:機制:討論暴露和結局關聯的潛在生物學機制和基因-表型的等效假設是否合理。謹慎解釋,在某些假設成立的基礎上,基于工具變量的暴露和結局的因果關系可能才存在。
解讀:盡管基因變異作為工具變量的生物學機制往往是未知的,但討論時應考慮各種潛在的可能。如此才能幫助讀者在潛在的生物學機制的基礎上理解MR分析所得的暴露和結局間的因果關系,也能使這種因果關系顯得合理。
實例:例文中描述了生物學機制,如吸煙能引起全身內皮損傷從而導致靜脈曲張[15]。
條目16c:臨床相關性:討論結果是否具有臨床或公共決策相關性,并討論相關性的大小。
解讀:如果存在,作者應描述MR分析出的因果關系對臨床實踐和公共決策的影響。當研究暴露因素與結局的關聯時,有時受限于試驗條件或倫理道德,并不能進行隨機對照試驗,此時,利用遺傳變異作為工具變量的MR會得出比觀察性研究或回顧性研究更為可靠且類似隨機對照試驗的結果。但是,也正是因為使用的工具變量是遺傳變異,當把結果置于臨床實踐或公共決策中時,可能會受其他因素的影響,因此應謹慎解釋MR結果的外推性。
實例:例文報告了162個SNP的多效性程度具有不確定性,因此MR結果也具有不確定性,但仍然可得出結論[24]。
條目17:討論結果在其他人群、其他暴露時間和其他暴露因素水平的普適性。
解讀:此處是指討論研究結果的可推廣性,即外推有效性。主要指MR結果在其他情形下的可被利用程度,一般要依據研究地點、研究對象、暴露和結局的特點來判斷。因此,應盡可能的體現研究場所與條件、研究對象特征、暴露定義及其測量標準、結局及其測量標準和隨訪時間等信息。
實例:例文在討論中報告“此外,本研究局限于歐洲血統的人群雖然能減少人口結構帶來的潛在偏倚,但限制了MR結果適用于其他人口的可推廣性”[15]。
2.6 其他信息
條目18:報告當前研究的資助來源和資助者及在當前研究中的角色。如果可能,報告原始研究的資助情況。
解讀:研究受資助情況與研究結論間存在一定聯系,資助者在研究的哪部分起什么作用都應該被報告,如研究設計、數據收集、數據分析、論文撰寫或發表。因此,如實陳述有助于讀者判斷研究是否受到資助者的影響。
實例:例文受到了來自瑞典的多項資助,編號2018-00123和2019-00977;也得到了美國退伍軍人事務部的資助(IK2-CX001780)。但作者已表明最終研究結果不代表上述機構的觀點[15]。
條目19:提供當前研究的數據來源地和獲取方式,并引用數據來源。提供重現研究所需代碼,若代碼可公開獲取,提供獲取地址和方式。
解讀:分享數據和分析代碼有利于重現研究結果、發現錯誤和掌握分析方法,數據和分析代碼可置于正文、附件或開放的公共數據庫中。
實例:例文在方法學開始部分提供了所有資料的獲取地址:Open Science Framework data respiratory(https://osf.io/9s3hd/)[15]。
條目20:聲明全部作者潛在的利益沖突。
解讀:與研究結果存在利益沖突的組織或團體的加入,可能會對MR結果的真實性和可信度產生不利影響。報告所有作者的任何利益沖突,有利于讀者評估所有的利益沖突是否會對研究過程和結果產生影響。
實例:例文報告了作者利益沖突信息,也報告了可能存在利益沖突的作者的受資助情況[15]。
3 總結
STROBE-MR報告規范是MR研究的報告指南,也是一個最低報告標準,對提高MR研究質量、改善透明度和重現分析結果至關重要。隨著基因遺傳學的發展及越來越多的研究者將掌握該研究方法,越發凸顯出STROBE-MR報告規范的重要性。本文通過對其進行解讀,以期推動STROBE-MR報告規范在國內的理解、傳播與應用。
本文發現與STROBE報告規范相比,STROBE-MR報告規范的延伸之處有:① 前言:STROBE-MR報告規范更重視對已有科學背景和理論知識的描述,因為暴露和結局的關聯必須建立在病理生理基礎之上。脫離了理論基礎,統計出的暴露和結局關聯再強,也將失去實際意義。② 方法:除選擇研究對象之外,如何選擇恰當的工具變量在MR中非常關鍵。因此,STROBE-MR報告規范中要求詳細報告工具變量相關信息。另外,統計方法也是MR與其他流行病學研究的主要不同之處。因此STROBE-MR報告規范要求詳細報告所使用的統計方法及其軟件。最后,統計方法中對統計效能的估計也非常重要,需要使用多種不同的方法進行評估,也是STROBE-MR報告規范的主要延伸之處。③ 結果:與方法部分對應。④ 討論:與背景部分對應,STROBE-MR報告規范要求結合病理生理機制進行相應討論。⑤ 其他信息:因為數據化時代的來臨,STROBE-MR報告規范對數據共享也提出了要求。
通過對STROBE-MR報告規范的解讀,我們認為該規范可能的作用如下:① 初學者通過理解該規范,可實現對MR研究的入門學習;② 指導正進行MR的研究者生產出高質量的MR研究;③ 編輯和審稿人可依照規范對MR研究報告質量進行評估,并篩選出高質量MR研究進行發表,以促進醫學的發展;④ 利用報告規范對已有的MR研究質量進行評估,從而發現問題以為未來MR研究提供參考。因此,國內外期刊應盡快將STROBE-MR報告規范納入其稿約中,并要求作者在投稿時提供STROBE-MR清單檢查表。
本文還發現了STROBE-MR報告規范可能存在不足:① 可參照PRISMA-DTA摘要清單對MR的摘要報告提出更為具體的要求,如結構式摘要[25];② STROBE-MR報告規范并沒有要求對注冊內容或計劃書中修改內容進行解釋;③ STROBE-MR報告規范并沒有要求討論研究結果對未來研究的意義。可見,隨著MR方法學的發展和時代的進步,STROBE-MR報告規范也需要及時更新和完善。
總之,STROBE-MR報告規范將為提高MR研究質量提供不可估量的價值,也將提高MR研究的學術價值與臨床意義。