開展單核苷酸多態性 Meta 分析需先計算基因頻數。本文以等位基因模型為例,介紹如何計算基因頻數,并展示如何使用 RevMan 5.3 軟件實現單核苷酸多態性數據的 Meta 分析。
引用本文: 王朝陽, 翁鴻, 靳英輝, 李柄輝, 任學群, 曾憲濤. 如何采用 RevMan 5.3 軟件實現單核苷酸多態性數據的 Meta 分析. 中國循證醫學雜志, 2018, 18(2): 244-248. doi: 10.7507/1672-2531.201707072 復制
單核苷酸多態性(single nucleotide polymorphism,SNP)主要是指在基因組水平上由單個核苷酸的變異所引起的 DNA 序列多態性。它是人類可遺傳的變異中最常見的一種,占所有已知基因多態性的 90% 以上[1]。隨著基因檢測技術的發展,SNP 的篩查和檢測更加快速和便捷,加之 SNP 研究對病因探索具有重要意義,每年有大量關于 SNP 的原始研究發表[2]。Meta 分析作為一種定量分析方法,可綜合評價 SNP 相關原始研究,得出更具說服力的病因證據[3]。但鑒于 SNP 數據與傳統的二分類數據不同,在使用 RevMan 軟件進行 Meta 分析時,需先將 SNP 數據轉換為傳統二分類數據,故本文結合實例介紹如何使用 RevMan 軟件實現 SNP 數據的 Meta 分析。
1 資料與方法
1.1 示例數據
本文以《白細胞介素-1β(Interleukin-1b,IL-1β)C511T 多態性與慢性牙周病發病風險的 Meta 分析》[4]一文的數據為例,見表 1。本文根據實際需要,僅提取了納入研究、種族、樣本量、各基因表型頻數。表 1 中,CC 代表野生純合型、TT 代表突變純合型、CT 代表雜合型、Total 代表總樣本量。

1.2 數據轉換
因提取的原始數據均為基因表型的頻數,在進行 Meta 分析前需轉換為等位基因頻數。將病例組的基因表型表示為 CC1、CT1、TT1;對照組為 CC0、CT0、TT0。則病例組 C 基因頻數:C1=2×CC1+CT1;T 基因頻數:T1=2×TT1+CT1。總基因頻數 Total1=C1+T1[5]。以表 1 中 Gore 1998 的數據為例,C1=2×13+15=41,T1=2×4+15=23,Total1=C1+T1=41+23=64。對照組的基因頻數算法相同,計算結果見表 2。

2 軟件操作
2.1 RevMan 軟件合并效應量
2.1.1 新建系統評價及選擇統計方法
本部分內容在既往相關文獻[6-8]中也有介紹,本文不再贅述。
2.1.2 添加數據及行 Meta 分析
在圖 1 界面應要求輸入 events 和 total,分別輸入“T1、total1”和“T0、total0”中的數據。數據可從表 2 中復制,但研究名稱輸入后順序可能變化,要注意原始數據與研究名稱一一對應。點擊圖 1 中森林圖“
”鍵及漏斗圖“
”鍵即可繪制森林圖和漏斗圖(圖 2)。因異質性較大(I2=80%,P<0.000 01),采用隨機效應模型[9]進行合并分析;結果顯示:該等位基因突變有增加慢性牙周病發病率的趨勢,但兩者的相關性無統計學意義[OR=1.03,95%CI(0.85,1.25),P=0.77];漏斗圖基本對稱,提示未見明顯發表偏倚。



2.2 亞組分析
根據“種族”進行亞組分析,點擊左側菜單欄“Data and analysis”下的“T vs. C”,與 3.1.1 相同,右鍵“Add outcome”。命名為“亞組分析”,點擊“亞組分析”,右鍵“Add subgroup”,建立 3 個亞組,分別命名為“高加索人”、“巴西人”和“亞洲人”。將表 2 中的數據分別輸入各亞組的數據輸入框中(圖 3)。亞組分析結果顯示:高加索人組異質性檢驗結果為 I2=64%,P=0.02,總效應量:[OR=0.91,95%CI(0.67,1.23),P=0.53];巴西人組異質性檢驗結果為 I2=58%,P=0.12,總效應量:[OR=1.01,95%CI(0.57,1.81),P=0.97];亞洲人組異質性檢驗結果為 I2=84%,P<0.000 01,總效應量:[OR=1.08,95%CI(0.84,1.41),P=0.55]。這提示在這三種不同的人群中,該等位基因突變不會增加慢性牙周病發病風險,且異質性可能并不來源于種族差異。

2.3 敏感性分析
行敏感性分析時,在數據輸入窗口,每次分別勾選掉 1 個研究,觀察總效應量 OR 及 95%CI 和異質性檢驗結果(I2 和 P 值),如圖 4。將上述結果匯總,如表 3。結果顯示每剔除 1 個納入研究,其效應值、可信區間及異質性結果并未發生明顯改變,提示此 Meta 分析結果較為穩健。

3 小結
RevMan 是免費的非編程軟件,由 Cochrane 協作網為系統評價/Meta 分析工作者提供,是 Cochrane 系統評價的標準化軟件。該軟件的主要特點是操作簡單,可對錄入的二分類變量、連續變量、生存資料、倒方差等不同類型數據進行 Meta 分析,并以森林圖的形式顯示[10]。本文以單核苷酸等位基因模型“T vs. C”為例,演示如何采用 RevMan 軟件進行 Meta 分析的過程。但在具體應用時,需注意:① 輸入數據是“events”及“total”,因此病例數轉換為基因頻數后,還需計算總的基因頻數;② 在添加研究名稱時需逐個添加,過程較為繁瑣;③ 數據輸入可直接從數據表中導出,但需逐條核對,如同年有多個研究需納入時,易出現次序混亂,從而干擾對亞組分析和敏感性分析中異質性來源的判斷;④ 發表偏倚只能根據漏斗圖的對稱性來定性判斷,其結果不夠精確;⑤ 行敏感性分析時,需每次剔除 1 個研究,過程較為繁瑣。雖然目前 RevMan 還存在一些缺點,但作為一款非編程軟件,其操作簡單,易于掌握,可作為初學者進行 SNP 數據 Meta 分析的首選軟件。
單核苷酸多態性(single nucleotide polymorphism,SNP)主要是指在基因組水平上由單個核苷酸的變異所引起的 DNA 序列多態性。它是人類可遺傳的變異中最常見的一種,占所有已知基因多態性的 90% 以上[1]。隨著基因檢測技術的發展,SNP 的篩查和檢測更加快速和便捷,加之 SNP 研究對病因探索具有重要意義,每年有大量關于 SNP 的原始研究發表[2]。Meta 分析作為一種定量分析方法,可綜合評價 SNP 相關原始研究,得出更具說服力的病因證據[3]。但鑒于 SNP 數據與傳統的二分類數據不同,在使用 RevMan 軟件進行 Meta 分析時,需先將 SNP 數據轉換為傳統二分類數據,故本文結合實例介紹如何使用 RevMan 軟件實現 SNP 數據的 Meta 分析。
1 資料與方法
1.1 示例數據
本文以《白細胞介素-1β(Interleukin-1b,IL-1β)C511T 多態性與慢性牙周病發病風險的 Meta 分析》[4]一文的數據為例,見表 1。本文根據實際需要,僅提取了納入研究、種族、樣本量、各基因表型頻數。表 1 中,CC 代表野生純合型、TT 代表突變純合型、CT 代表雜合型、Total 代表總樣本量。

1.2 數據轉換
因提取的原始數據均為基因表型的頻數,在進行 Meta 分析前需轉換為等位基因頻數。將病例組的基因表型表示為 CC1、CT1、TT1;對照組為 CC0、CT0、TT0。則病例組 C 基因頻數:C1=2×CC1+CT1;T 基因頻數:T1=2×TT1+CT1。總基因頻數 Total1=C1+T1[5]。以表 1 中 Gore 1998 的數據為例,C1=2×13+15=41,T1=2×4+15=23,Total1=C1+T1=41+23=64。對照組的基因頻數算法相同,計算結果見表 2。

2 軟件操作
2.1 RevMan 軟件合并效應量
2.1.1 新建系統評價及選擇統計方法
本部分內容在既往相關文獻[6-8]中也有介紹,本文不再贅述。
2.1.2 添加數據及行 Meta 分析
在圖 1 界面應要求輸入 events 和 total,分別輸入“T1、total1”和“T0、total0”中的數據。數據可從表 2 中復制,但研究名稱輸入后順序可能變化,要注意原始數據與研究名稱一一對應。點擊圖 1 中森林圖“
”鍵及漏斗圖“
”鍵即可繪制森林圖和漏斗圖(圖 2)。因異質性較大(I2=80%,P<0.000 01),采用隨機效應模型[9]進行合并分析;結果顯示:該等位基因突變有增加慢性牙周病發病率的趨勢,但兩者的相關性無統計學意義[OR=1.03,95%CI(0.85,1.25),P=0.77];漏斗圖基本對稱,提示未見明顯發表偏倚。



2.2 亞組分析
根據“種族”進行亞組分析,點擊左側菜單欄“Data and analysis”下的“T vs. C”,與 3.1.1 相同,右鍵“Add outcome”。命名為“亞組分析”,點擊“亞組分析”,右鍵“Add subgroup”,建立 3 個亞組,分別命名為“高加索人”、“巴西人”和“亞洲人”。將表 2 中的數據分別輸入各亞組的數據輸入框中(圖 3)。亞組分析結果顯示:高加索人組異質性檢驗結果為 I2=64%,P=0.02,總效應量:[OR=0.91,95%CI(0.67,1.23),P=0.53];巴西人組異質性檢驗結果為 I2=58%,P=0.12,總效應量:[OR=1.01,95%CI(0.57,1.81),P=0.97];亞洲人組異質性檢驗結果為 I2=84%,P<0.000 01,總效應量:[OR=1.08,95%CI(0.84,1.41),P=0.55]。這提示在這三種不同的人群中,該等位基因突變不會增加慢性牙周病發病風險,且異質性可能并不來源于種族差異。

2.3 敏感性分析
行敏感性分析時,在數據輸入窗口,每次分別勾選掉 1 個研究,觀察總效應量 OR 及 95%CI 和異質性檢驗結果(I2 和 P 值),如圖 4。將上述結果匯總,如表 3。結果顯示每剔除 1 個納入研究,其效應值、可信區間及異質性結果并未發生明顯改變,提示此 Meta 分析結果較為穩健。

3 小結
RevMan 是免費的非編程軟件,由 Cochrane 協作網為系統評價/Meta 分析工作者提供,是 Cochrane 系統評價的標準化軟件。該軟件的主要特點是操作簡單,可對錄入的二分類變量、連續變量、生存資料、倒方差等不同類型數據進行 Meta 分析,并以森林圖的形式顯示[10]。本文以單核苷酸等位基因模型“T vs. C”為例,演示如何采用 RevMan 軟件進行 Meta 分析的過程。但在具體應用時,需注意:① 輸入數據是“events”及“total”,因此病例數轉換為基因頻數后,還需計算總的基因頻數;② 在添加研究名稱時需逐個添加,過程較為繁瑣;③ 數據輸入可直接從數據表中導出,但需逐條核對,如同年有多個研究需納入時,易出現次序混亂,從而干擾對亞組分析和敏感性分析中異質性來源的判斷;④ 發表偏倚只能根據漏斗圖的對稱性來定性判斷,其結果不夠精確;⑤ 行敏感性分析時,需每次剔除 1 個研究,過程較為繁瑣。雖然目前 RevMan 還存在一些缺點,但作為一款非編程軟件,其操作簡單,易于掌握,可作為初學者進行 SNP 數據 Meta 分析的首選軟件。