肺癌(lung cancer)發病率高、死亡率高,是癌癥相關的死亡的主要原因[1]。根據全球癌癥統計數據,每年全球的肺癌新增患者約為200萬人,一半的新增病例發生在亞洲[2-4]。肺癌可以分為非小細胞肺癌(non-small-cell lung cancer,NSCLC)和小細胞肺癌(small-cell lung cancer,SCLC),分別占總診斷的85%和15%[1,5]。其中NSCLC中最常見的組織亞型是腺癌,其次是鱗癌[6]。咳嗽是最常見的癥狀,其次是咯血,胸痛和呼吸困難,少見的癥狀包括副腫瘤綜合征[7-8]。肺癌的危險因素包括吸煙、家族史、輻射暴露和慢性肺部疾病史[9]等,還有更多的病因不明,無法從源頭預防其發生。現在肺癌的治療方法雖多,包括手術、放療、化療、中醫藥、靶向治療、免疫治療、抗體藥物結合物和雙特異性抗體等[9],但是針對肺癌病因的干預方式還是很少,及時針對病因進行干預降低肺癌的發生率,開發合適的藥物減少因肺癌導致的死亡是有必要的。
腸道菌群(gut microbiota,GM)是人類胃腸道中各種細菌的總稱,是一群分布廣泛,復雜多樣的微生物群落,可以維持宿主腸道的正常生理和免疫功能[10-11]。由于呼吸道和胃腸道有相同的胚胎起源,呈現高度相似的結構,兩者之間構建了一種新的、明確的串擾,稱之為腸肺軸(gut-lung axis,GLA)[12]。有研究發現腸道菌群可以影響肺癌的發生發展[13]。例如移位的海氏腸球菌 (Enterococcus hirae)在小細胞肺癌中可通過toll樣受體(toll-like receptor,TLR) 或誘導記憶反應來增強腫瘤特異反應[14]。腸道菌群與肺癌的關系緊密相關。因此,腸道微生物組是精確治療癌癥的重要因素,可以作為診斷和治療目的的生物標志物[15]。比如通過分析肺癌患者的腸道菌群系譜,建立特定的腸道菌群特征,用于早期肺癌預測[16]。目前研究腸道菌群和肺癌有關,但是兩者的因果關系仍不確定。
孟德爾隨機化(mendelian randomization,MR)是一種統計學方法,目的是從觀察到的關聯結果中推斷潛在的因果關系[17],使用受孕時隨機分配的遺傳變異作為工具變量來估計暴露對結局的因果影響,并且可以減少混雜因素或反向因果關系造成的偏差[18]。最近,MR分析已經應用于評估腸道菌群和多種癌癥之間潛在的因果連系[19-21]。
在本研究中,為了探究腸道菌群和肺癌之間潛在的因果關系,并確定具體的病原菌群,基于GWAS研究的總結數據進行MR研究。
1 材料和方法
1.1 數據來源
肺癌的遺傳數據來自于McKay JD等[22]關于肺癌及其亞型的GWAS數據,總樣本量85 716,其中29 266例為肺癌患者(11 273例為肺腺癌;7 426例肺鱗癌;2 664例小細胞肺癌),56 450例對照,共有7876477個 單核苷酸多樣性(Single nucleotide polymorphisms,SNPs);見表1。本研究使用的人類腸道微生物組的匯總統計數據來自最新的GWAS meta分析[23],總樣本量為18 340例,來自24個隊列,共有5 747 754個SNPs。由于本研究是基于公開數據,不需要額外的倫理批準或同意。

1.2 工具變量的篩選
首先排除15個無具體名稱的腸道菌群,隨后的MR分析包含196個細菌類群。包括9門16綱20目32科119屬。隨后進行一系列質量控制步驟來選擇合適的工具變量(instrumental variable,IV)。
MR研究有三個核心工具變量假設;見圖1。(1)選擇作為工具變量的遺傳變異與暴露因素腸道菌群相關。為了找到與暴露因素相關的單核苷酸多樣性(single nucleotide polymorphisms,SNPs),確保關于腸道菌群和肺癌風險之間因果聯系結論的真實性和準確性,使用以下步驟來選擇最佳SNPs。首先,針對腸道微生物組只有少量SNP達到全基因組統計意義閾值結果(P<5 × 10?8),在參考相關文獻后將閾值調整為 (P<1 × 10?5)來獲得完整可靠的結果。其次,MR方法的原則之一是所選的SNPs之間不存在連鎖不平衡,設置距離 10 000 kb ,連鎖不平衡 r 2<0.001 為標準來減少遺傳變異殘留的連鎖不平衡所造成的偏差[20,24]。選擇與腸道菌群相關P值最低的SNPs。(2)遺傳變異與混雜因素無關。(3)遺傳變異與結局變量無關。

使用PhenoScaner[25](http://www.phenoscanner.medschl.cam.ac.uk/)搜索所有符合條件的SNPs,排除與肺癌相關的混雜因素(如吸煙、氡暴露、職業暴露、癌癥史、一級親屬肺癌史、慢性肺部疾病、肺功能等)[26-27]和與肺癌相關的SNPs。
用F統計量來評估SNP和暴露之間相關性的統計強度,F統計量的公式為(,其中N為腸道菌群數據庫的樣本量,K為SNPs的數量,R2代表腸道菌群由SNPs解釋的變異占比,計算公式
.其中EAF是每個SNP的效 應 等 位 基 因 頻 率 ( edffect allele frequency,EAF) , β 為等位基因的效應值 ( Beta, β)[25,28]。F<10認為SNPs和暴露之間存在弱相關。在分析過程中,具有回文結構的SNP被自動排除。
1.3 MR分析
對暴露(腸道微生物)與結局(肺癌)之間的因果關系進行孟德爾隨機化分析。以逆 方 差 加 權 分 析 方 法( inverse variance weighting,IVW)為主要的分析方法[29-31],加 權 中位數(weighted median,WM)和 MR- Egger 回 歸 法為輔助方法。IVW將每個SNPs的Wald估計值合并從而獲得總體估計值[32]。
1.4 敏感性分析
敏感性包括水平多效性檢驗、異質性檢驗、逐個剔除檢驗。水平多效性檢驗通過MR-egger回歸檢驗進行檢驗,如果MR-Egger分析中存在顯著的截距項,則表明研究具有水平多效性。Cochran's Q檢 驗判斷SNPs的異質性,如果Cochran's Q 統計量檢驗具有統計學意義(P<0.05),證明分析結果具有顯著的異質性。使用MR多效性殘差和及離群值檢驗(MR pleiotropy residual sum and outlier test, MR-PRESSO)檢測了異常值,如果檢測到異常值,則將其移除并將剩余的IVs進行重新分析。采用留一法分析來評估顯著結果是否由單個SNP決定。人體腸道菌群與肺癌的風險關系以優勢比(odds radio,OR)及其95%置信區間(confidence interval,CI)表示,如果P<0.05,這為其可能存在因果關系提供證據。
1.5 統計軟件版本及名稱
所有MR分析通過使用R(4.3.1版)及TwoSampleMR包和MR-PRESSO包實現。
2 結果
2.1 與肺癌風險相關的腸道菌群的主要結果
對196種腸道菌群進行聚類,共有2 699個獨立的SNPs(P<1×10-5)與其相關,包括門、綱、目、科和屬5個分類水平。最終篩選出57個SNPs,其中副擬桿菌屬(Genus Parabacteroides)10個SNPs,擬桿菌門(Phylum Bacteroidetes)13個,雙歧桿菌科(Family Bifidobacteriaceae)和雙歧桿菌目(Order Bifidobacteriales)都是17個,統計量F均>10(見表3)。

我們通過MR分析中的IVW方法從196種人腸道菌群中得到6種與肺癌有關系的菌群。我們計算了各個菌群中F的中位數,20.429(雙歧桿菌科)、21.222(副擬桿菌屬)、20.429(雙歧桿菌目)、21.792(擬桿菌門)、20.717(赭色嗜酸內腸菌屬,Genus.Erysipelatoclostridium),20.406(普雷沃氏菌屬-9,Genus.Prevotella9),F均>10,說明可以有效減少避免弱工具變量的偏倚。赭色嗜酸內腸菌屬(Genus Erysipelatoclostridium)與肺癌的風險成正相關[ OR=1.168,95%CI (1.025,1.331),P=0.020,β= 0.155],在MR Egger方法中[ OR=0.713,95% CI (0.413, 1.229),P=0.247,β=?0.340],雖然在MR-Egger回歸中證明其水平多效性(截距P=0.093),但是由于可能存在潛在的離群值,使得MR-Egger和IVW的結果方向不一致,所以赭色嗜酸內腸菌屬與肺癌之間的關系還需要更多的研究進行驗證。
2.2 兩樣本孟德爾隨機化分析
我們發現在IVW方法中,副擬桿菌屬與肺癌的風險成正相關優勢比[ OR=1.258,95%CI(1.034,1.531),P= 0.0220],在MR-Egger回歸中證明其無水平多效性(截距P值= 0.6389)。普雷沃氏菌屬-9與肺癌的風險成正相關[OR=1.139,95%CI(1.000, 1.298),P=0.0493],在MR-Egger回歸中證明其無水平多效性(截距P=0.772)。擬桿菌門與肺癌的風險成正相關OR=1.185,95% CI(1.002,1.402),P=0.047],在MR-Egger回歸中證明其無水平多效性(截距P=0.127)。在MR Egger方法[OR=1.583,95% CI(1.082,2.316),P=0.039)和Weighted median[OR=1.583,95% CI(1.006,1.549),P=0.0440]中擬桿菌門與肺癌的相關性保持穩定;見表4和圖2。


正相反,雙歧桿菌科與肺癌的風險呈負相關[OR=0.865,95% CI(0.750,0.997),P=0.0451],在MR-Egger回歸中證明其無水平多效性(截距P=0.681)。雙歧桿菌目與肺癌的風險成負相關[OR=0.865,95% CI(0.750,0.997),P=0.045],在MR-Egger回歸中證明其無水平多效性(截距P值= 0.681)。
為了進一步評估潛在性的水平多效性對因果關系的影響,通過phenoscanner網站查詢與這5個細菌相關的SNPs,發現有兩個SNP跟混雜因素相關;見表2。在排除這些SNPs后重新運用MR分析方法計算,在IVW方法中,副擬桿菌屬[OR=1.258,95% CI(1.034,1.531),P=0.0220]、擬桿菌門[OR=1.192,95% CI(1.001,1.419),P=0.0484]、雙歧桿菌科[OR=0.845,95% CI(0.721,0.990),P=0.037]、雙歧桿菌目[OR=0.845,95% CI(0.721,0.990),P=0.037]與肺癌之間的關系穩定;見圖2和表4。其中在IVW方法中,擬桿菌門與肺癌之間的關系成正相關[OR=1.192,95% CI(1.001,1.419),P=0.047],在MR Egger方法[OR=1.589,95% CI(1.084,2.328),P=0.040],擬桿菌門與肺癌之間的關系不變。普雷沃氏菌屬-9與肺癌關系不穩定,IVW方法[OR=1.139,95% CI(0.989,1.318),P=0.070]。

2.3 敏感性分析
SNPs和結果之間的水平多效性通過MR-Egger回歸進行評估,副擬桿菌屬(截距P=0.639)、擬桿菌門(截距P=0.132)、雙歧桿菌科(截距P=0.955)和雙歧桿菌目(截距P=0.955)MR-Egger回歸截距P均>0.05,結果顯示沒有證據表明水平多效性;見表4。
通過Cochran’s Q 檢驗驗證選出的SNPs是否存在異質性,表4中可見副擬桿菌屬、擬桿菌門、雙歧桿菌科和雙歧桿菌目的IVW和MR Egger的Q_pval均>0.05,可以看出不存在異質性。用MR-PRESSO方法未檢出有異常值,P值>0.05);見表4。
各種方法的散點圖在圖3中展示,可以直觀的看到副擬桿菌屬和擬桿菌門與肺癌的風險成正相關性,而雙歧桿菌科和雙歧桿菌目則顯示了其保護作用(圖3a~d)。留一法方法表明,沒有一個單一的SNP對總體評估有主導作用(圖3?e~h)。上述結果表明,副擬桿菌屬、擬桿菌門、雙歧桿菌科和雙歧桿菌目豐度增加與肺癌之間存在因果關系。

a~d:散點圖;e~h:留一法敏感性分析;SNP :單核苷酸多樣性;MR:孟德爾隨機化分析,逆 方 差 加 權 分 析 方 法(IVW,淺藍色);MR egger回歸(深藍色線);加權中位數法(weighted median,綠色)
3 討論
兩樣本孟德爾隨機化研究共鑒定出6種腸道菌群跟肺癌相關,包括擬桿菌門、副擬桿菌屬、普雷沃氏菌屬-9、赭色嗜酸內腸菌屬、雙歧桿菌科、雙歧桿菌目。我們對SNPs進行嚴格質量控制,避免混雜因素和逆因果關系的影響,顯示有4種人腸道菌群跟肺癌的患病風險存在因果關系,包括擬桿菌門、擬副桿菌屬、雙歧桿菌目和雙歧桿菌科。
擬桿菌門是人腸道菌群中最常見的菌群之一[33],主要是厭氧類桿菌[34],降解多種復雜碳水化合物為我們所知[35]。而在臨床研究中,擬桿菌門豐度增加與疾病息息相關,比如擬桿菌門在肝纖維化、結腸炎、腫瘤免疫和心血管疾病可能起著保護作用[36],在另外一項MR研究中擬桿菌門可以降低肝癌的風險[20],相反而在結腸癌中可能起著致病作用[36],這時提示我們擬桿菌門在肺癌中可能也起著不為人知的作用。在其他肺癌和擬桿菌門相關性研究中,非吸煙者口腔內微生物菌群中的擬桿菌豐度越大,患肺癌的風險越低[37]。雖然提示肺癌和擬桿菌門有關系,但是關系不明,要明確因果關系則需要更大的規模的研究才能證實這一點,而在我們的研究中證明腸道菌群中的擬桿菌對罹患肺癌起著促進的作用,這可以為我們以后對肺癌的發病機制及治療提供一條新的思路,并且由此可以進一步研究擬桿菌門的致病機制。
副擬桿菌屬是一種厭氧的、不形成孢子、不能運動的革蘭氏陰性桿菌[38]。可在良性疾病中促進疾病,比如克羅恩病樣回腸炎小鼠模型中的副擬桿菌豐度增加可以誘導抑郁樣行為[39],非酒精性脂肪性肝炎患者中較高的副擬桿菌屬豐度,通過調節肝臟毒性作用導致促炎活性和免疫失衡[40]。然而在一些疾病中是有益因素,比如副擬桿菌屬是胃袖狀切除加迷走神經干切斷術這種減肥手術術后減肥的潛在有益因素。在癌癥研究中,副擬桿菌屬可能是宮頸癌的一個潛在的生物標志物。而副擬桿菌屬尚未有明確的報道與肺癌有關,本研究中副擬桿菌屬可以增加肺癌的風險這一結論尚是第一次報道,目前專門探究擬副桿菌的研究較少,未來可以進一步探究副擬桿菌屬增加肺癌風險的機制,可進一步從源頭控制肺癌的發生。
雙歧桿菌科和雙歧桿菌目同屬雙歧桿菌門,包含大量細菌種類,是人類胃腸道菌群的重要組成部分[41-42], 研究[36]發現其有健康促進作用和抗腫瘤作用。還有研究[43]發現雙歧桿菌通過使參與結腸癌致癌物產生的微生物酶失活來抗腫瘤。動物實驗中,大量的雙歧桿菌可以增強無菌小鼠的抗腫瘤免疫和促進抗PD-L1活性[44];雙歧桿菌和PD-L1抑制劑聯合口服可激活T細胞并阻斷小鼠黑色素瘤的生長[44]。雙歧桿菌能夠在大腸中結合鐵,從而限制鐵存在下合成的自由基形成,從而降低結直腸癌的風險[45]。以上研究都表明在不同的腫瘤中雙歧桿菌都通過不同方式進行抗腫瘤或降低患病的風險,但是沒有研究探究雙歧桿菌科和雙歧桿菌目在肺癌中是否可以起到一個保護或者降低肺癌患病的風險。MR方法作為一種可以驗證暴露和結局之間是否存在因果關系的方法,通過MR由此確定雙歧桿菌科和雙歧桿菌目與肺癌之間的因果關系,證明雙歧桿菌科和雙歧桿菌目可以降低肺癌的風險,是一個潛在的保護因素。根據本研究我們可以開展進一步的研究探究其降低肺癌的保護機制,從而開發富含雙歧桿菌科或雙歧桿菌目的食物或者飲品等來進行預防肺癌,這為我們肺癌的藥物研究提示了一個新的方向。
不過我們研究還是有一些局限性。首先我們在分析腸道菌群的時候只在屬的層面上分析而不是更近一步比如在物種或具體菌株層面。第二患者和對照都是歐洲人,將我們的研究推廣到其他人種中可能有限制。第三為了獲得足夠的腸道微生物區系,我們選擇了高于傳統全基因組顯著水平(P<5×10?8)的腸道微生物區系中的IVs(P<1×10?5)。最后我們沒有進行腸道菌群與肺癌具體亞型的分析,這有必要進一步的研究。
綜上所述,本研究評估了腸道菌群對肺癌的潛在因果作用,發現擬桿菌門、擬副桿菌屬、雙歧桿菌科和雙歧桿菌目與肺癌存在潛在因果關系,這為肺癌可能存在的治療方法提供新的思路,為肺癌的發病機制提供線索。
作者貢獻:任清林主要負責論文設計、論文初稿撰寫、論文審閱與修改;何文博主要負責論文審閱和論文修改工作;岳佳瑞負責論文審閱與修改;肖洪壁負責論文審閱;束余聲主要負責論文設計、論文審閱。
肺癌(lung cancer)發病率高、死亡率高,是癌癥相關的死亡的主要原因[1]。根據全球癌癥統計數據,每年全球的肺癌新增患者約為200萬人,一半的新增病例發生在亞洲[2-4]。肺癌可以分為非小細胞肺癌(non-small-cell lung cancer,NSCLC)和小細胞肺癌(small-cell lung cancer,SCLC),分別占總診斷的85%和15%[1,5]。其中NSCLC中最常見的組織亞型是腺癌,其次是鱗癌[6]。咳嗽是最常見的癥狀,其次是咯血,胸痛和呼吸困難,少見的癥狀包括副腫瘤綜合征[7-8]。肺癌的危險因素包括吸煙、家族史、輻射暴露和慢性肺部疾病史[9]等,還有更多的病因不明,無法從源頭預防其發生。現在肺癌的治療方法雖多,包括手術、放療、化療、中醫藥、靶向治療、免疫治療、抗體藥物結合物和雙特異性抗體等[9],但是針對肺癌病因的干預方式還是很少,及時針對病因進行干預降低肺癌的發生率,開發合適的藥物減少因肺癌導致的死亡是有必要的。
腸道菌群(gut microbiota,GM)是人類胃腸道中各種細菌的總稱,是一群分布廣泛,復雜多樣的微生物群落,可以維持宿主腸道的正常生理和免疫功能[10-11]。由于呼吸道和胃腸道有相同的胚胎起源,呈現高度相似的結構,兩者之間構建了一種新的、明確的串擾,稱之為腸肺軸(gut-lung axis,GLA)[12]。有研究發現腸道菌群可以影響肺癌的發生發展[13]。例如移位的海氏腸球菌 (Enterococcus hirae)在小細胞肺癌中可通過toll樣受體(toll-like receptor,TLR) 或誘導記憶反應來增強腫瘤特異反應[14]。腸道菌群與肺癌的關系緊密相關。因此,腸道微生物組是精確治療癌癥的重要因素,可以作為診斷和治療目的的生物標志物[15]。比如通過分析肺癌患者的腸道菌群系譜,建立特定的腸道菌群特征,用于早期肺癌預測[16]。目前研究腸道菌群和肺癌有關,但是兩者的因果關系仍不確定。
孟德爾隨機化(mendelian randomization,MR)是一種統計學方法,目的是從觀察到的關聯結果中推斷潛在的因果關系[17],使用受孕時隨機分配的遺傳變異作為工具變量來估計暴露對結局的因果影響,并且可以減少混雜因素或反向因果關系造成的偏差[18]。最近,MR分析已經應用于評估腸道菌群和多種癌癥之間潛在的因果連系[19-21]。
在本研究中,為了探究腸道菌群和肺癌之間潛在的因果關系,并確定具體的病原菌群,基于GWAS研究的總結數據進行MR研究。
1 材料和方法
1.1 數據來源
肺癌的遺傳數據來自于McKay JD等[22]關于肺癌及其亞型的GWAS數據,總樣本量85 716,其中29 266例為肺癌患者(11 273例為肺腺癌;7 426例肺鱗癌;2 664例小細胞肺癌),56 450例對照,共有7876477個 單核苷酸多樣性(Single nucleotide polymorphisms,SNPs);見表1。本研究使用的人類腸道微生物組的匯總統計數據來自最新的GWAS meta分析[23],總樣本量為18 340例,來自24個隊列,共有5 747 754個SNPs。由于本研究是基于公開數據,不需要額外的倫理批準或同意。

1.2 工具變量的篩選
首先排除15個無具體名稱的腸道菌群,隨后的MR分析包含196個細菌類群。包括9門16綱20目32科119屬。隨后進行一系列質量控制步驟來選擇合適的工具變量(instrumental variable,IV)。
MR研究有三個核心工具變量假設;見圖1。(1)選擇作為工具變量的遺傳變異與暴露因素腸道菌群相關。為了找到與暴露因素相關的單核苷酸多樣性(single nucleotide polymorphisms,SNPs),確保關于腸道菌群和肺癌風險之間因果聯系結論的真實性和準確性,使用以下步驟來選擇最佳SNPs。首先,針對腸道微生物組只有少量SNP達到全基因組統計意義閾值結果(P<5 × 10?8),在參考相關文獻后將閾值調整為 (P<1 × 10?5)來獲得完整可靠的結果。其次,MR方法的原則之一是所選的SNPs之間不存在連鎖不平衡,設置距離 10 000 kb ,連鎖不平衡 r 2<0.001 為標準來減少遺傳變異殘留的連鎖不平衡所造成的偏差[20,24]。選擇與腸道菌群相關P值最低的SNPs。(2)遺傳變異與混雜因素無關。(3)遺傳變異與結局變量無關。

使用PhenoScaner[25](http://www.phenoscanner.medschl.cam.ac.uk/)搜索所有符合條件的SNPs,排除與肺癌相關的混雜因素(如吸煙、氡暴露、職業暴露、癌癥史、一級親屬肺癌史、慢性肺部疾病、肺功能等)[26-27]和與肺癌相關的SNPs。
用F統計量來評估SNP和暴露之間相關性的統計強度,F統計量的公式為(,其中N為腸道菌群數據庫的樣本量,K為SNPs的數量,R2代表腸道菌群由SNPs解釋的變異占比,計算公式
.其中EAF是每個SNP的效 應 等 位 基 因 頻 率 ( edffect allele frequency,EAF) , β 為等位基因的效應值 ( Beta, β)[25,28]。F<10認為SNPs和暴露之間存在弱相關。在分析過程中,具有回文結構的SNP被自動排除。
1.3 MR分析
對暴露(腸道微生物)與結局(肺癌)之間的因果關系進行孟德爾隨機化分析。以逆 方 差 加 權 分 析 方 法( inverse variance weighting,IVW)為主要的分析方法[29-31],加 權 中位數(weighted median,WM)和 MR- Egger 回 歸 法為輔助方法。IVW將每個SNPs的Wald估計值合并從而獲得總體估計值[32]。
1.4 敏感性分析
敏感性包括水平多效性檢驗、異質性檢驗、逐個剔除檢驗。水平多效性檢驗通過MR-egger回歸檢驗進行檢驗,如果MR-Egger分析中存在顯著的截距項,則表明研究具有水平多效性。Cochran's Q檢 驗判斷SNPs的異質性,如果Cochran's Q 統計量檢驗具有統計學意義(P<0.05),證明分析結果具有顯著的異質性。使用MR多效性殘差和及離群值檢驗(MR pleiotropy residual sum and outlier test, MR-PRESSO)檢測了異常值,如果檢測到異常值,則將其移除并將剩余的IVs進行重新分析。采用留一法分析來評估顯著結果是否由單個SNP決定。人體腸道菌群與肺癌的風險關系以優勢比(odds radio,OR)及其95%置信區間(confidence interval,CI)表示,如果P<0.05,這為其可能存在因果關系提供證據。
1.5 統計軟件版本及名稱
所有MR分析通過使用R(4.3.1版)及TwoSampleMR包和MR-PRESSO包實現。
2 結果
2.1 與肺癌風險相關的腸道菌群的主要結果
對196種腸道菌群進行聚類,共有2 699個獨立的SNPs(P<1×10-5)與其相關,包括門、綱、目、科和屬5個分類水平。最終篩選出57個SNPs,其中副擬桿菌屬(Genus Parabacteroides)10個SNPs,擬桿菌門(Phylum Bacteroidetes)13個,雙歧桿菌科(Family Bifidobacteriaceae)和雙歧桿菌目(Order Bifidobacteriales)都是17個,統計量F均>10(見表3)。

我們通過MR分析中的IVW方法從196種人腸道菌群中得到6種與肺癌有關系的菌群。我們計算了各個菌群中F的中位數,20.429(雙歧桿菌科)、21.222(副擬桿菌屬)、20.429(雙歧桿菌目)、21.792(擬桿菌門)、20.717(赭色嗜酸內腸菌屬,Genus.Erysipelatoclostridium),20.406(普雷沃氏菌屬-9,Genus.Prevotella9),F均>10,說明可以有效減少避免弱工具變量的偏倚。赭色嗜酸內腸菌屬(Genus Erysipelatoclostridium)與肺癌的風險成正相關[ OR=1.168,95%CI (1.025,1.331),P=0.020,β= 0.155],在MR Egger方法中[ OR=0.713,95% CI (0.413, 1.229),P=0.247,β=?0.340],雖然在MR-Egger回歸中證明其水平多效性(截距P=0.093),但是由于可能存在潛在的離群值,使得MR-Egger和IVW的結果方向不一致,所以赭色嗜酸內腸菌屬與肺癌之間的關系還需要更多的研究進行驗證。
2.2 兩樣本孟德爾隨機化分析
我們發現在IVW方法中,副擬桿菌屬與肺癌的風險成正相關優勢比[ OR=1.258,95%CI(1.034,1.531),P= 0.0220],在MR-Egger回歸中證明其無水平多效性(截距P值= 0.6389)。普雷沃氏菌屬-9與肺癌的風險成正相關[OR=1.139,95%CI(1.000, 1.298),P=0.0493],在MR-Egger回歸中證明其無水平多效性(截距P=0.772)。擬桿菌門與肺癌的風險成正相關OR=1.185,95% CI(1.002,1.402),P=0.047],在MR-Egger回歸中證明其無水平多效性(截距P=0.127)。在MR Egger方法[OR=1.583,95% CI(1.082,2.316),P=0.039)和Weighted median[OR=1.583,95% CI(1.006,1.549),P=0.0440]中擬桿菌門與肺癌的相關性保持穩定;見表4和圖2。


正相反,雙歧桿菌科與肺癌的風險呈負相關[OR=0.865,95% CI(0.750,0.997),P=0.0451],在MR-Egger回歸中證明其無水平多效性(截距P=0.681)。雙歧桿菌目與肺癌的風險成負相關[OR=0.865,95% CI(0.750,0.997),P=0.045],在MR-Egger回歸中證明其無水平多效性(截距P值= 0.681)。
為了進一步評估潛在性的水平多效性對因果關系的影響,通過phenoscanner網站查詢與這5個細菌相關的SNPs,發現有兩個SNP跟混雜因素相關;見表2。在排除這些SNPs后重新運用MR分析方法計算,在IVW方法中,副擬桿菌屬[OR=1.258,95% CI(1.034,1.531),P=0.0220]、擬桿菌門[OR=1.192,95% CI(1.001,1.419),P=0.0484]、雙歧桿菌科[OR=0.845,95% CI(0.721,0.990),P=0.037]、雙歧桿菌目[OR=0.845,95% CI(0.721,0.990),P=0.037]與肺癌之間的關系穩定;見圖2和表4。其中在IVW方法中,擬桿菌門與肺癌之間的關系成正相關[OR=1.192,95% CI(1.001,1.419),P=0.047],在MR Egger方法[OR=1.589,95% CI(1.084,2.328),P=0.040],擬桿菌門與肺癌之間的關系不變。普雷沃氏菌屬-9與肺癌關系不穩定,IVW方法[OR=1.139,95% CI(0.989,1.318),P=0.070]。

2.3 敏感性分析
SNPs和結果之間的水平多效性通過MR-Egger回歸進行評估,副擬桿菌屬(截距P=0.639)、擬桿菌門(截距P=0.132)、雙歧桿菌科(截距P=0.955)和雙歧桿菌目(截距P=0.955)MR-Egger回歸截距P均>0.05,結果顯示沒有證據表明水平多效性;見表4。
通過Cochran’s Q 檢驗驗證選出的SNPs是否存在異質性,表4中可見副擬桿菌屬、擬桿菌門、雙歧桿菌科和雙歧桿菌目的IVW和MR Egger的Q_pval均>0.05,可以看出不存在異質性。用MR-PRESSO方法未檢出有異常值,P值>0.05);見表4。
各種方法的散點圖在圖3中展示,可以直觀的看到副擬桿菌屬和擬桿菌門與肺癌的風險成正相關性,而雙歧桿菌科和雙歧桿菌目則顯示了其保護作用(圖3a~d)。留一法方法表明,沒有一個單一的SNP對總體評估有主導作用(圖3?e~h)。上述結果表明,副擬桿菌屬、擬桿菌門、雙歧桿菌科和雙歧桿菌目豐度增加與肺癌之間存在因果關系。

a~d:散點圖;e~h:留一法敏感性分析;SNP :單核苷酸多樣性;MR:孟德爾隨機化分析,逆 方 差 加 權 分 析 方 法(IVW,淺藍色);MR egger回歸(深藍色線);加權中位數法(weighted median,綠色)
3 討論
兩樣本孟德爾隨機化研究共鑒定出6種腸道菌群跟肺癌相關,包括擬桿菌門、副擬桿菌屬、普雷沃氏菌屬-9、赭色嗜酸內腸菌屬、雙歧桿菌科、雙歧桿菌目。我們對SNPs進行嚴格質量控制,避免混雜因素和逆因果關系的影響,顯示有4種人腸道菌群跟肺癌的患病風險存在因果關系,包括擬桿菌門、擬副桿菌屬、雙歧桿菌目和雙歧桿菌科。
擬桿菌門是人腸道菌群中最常見的菌群之一[33],主要是厭氧類桿菌[34],降解多種復雜碳水化合物為我們所知[35]。而在臨床研究中,擬桿菌門豐度增加與疾病息息相關,比如擬桿菌門在肝纖維化、結腸炎、腫瘤免疫和心血管疾病可能起著保護作用[36],在另外一項MR研究中擬桿菌門可以降低肝癌的風險[20],相反而在結腸癌中可能起著致病作用[36],這時提示我們擬桿菌門在肺癌中可能也起著不為人知的作用。在其他肺癌和擬桿菌門相關性研究中,非吸煙者口腔內微生物菌群中的擬桿菌豐度越大,患肺癌的風險越低[37]。雖然提示肺癌和擬桿菌門有關系,但是關系不明,要明確因果關系則需要更大的規模的研究才能證實這一點,而在我們的研究中證明腸道菌群中的擬桿菌對罹患肺癌起著促進的作用,這可以為我們以后對肺癌的發病機制及治療提供一條新的思路,并且由此可以進一步研究擬桿菌門的致病機制。
副擬桿菌屬是一種厭氧的、不形成孢子、不能運動的革蘭氏陰性桿菌[38]。可在良性疾病中促進疾病,比如克羅恩病樣回腸炎小鼠模型中的副擬桿菌豐度增加可以誘導抑郁樣行為[39],非酒精性脂肪性肝炎患者中較高的副擬桿菌屬豐度,通過調節肝臟毒性作用導致促炎活性和免疫失衡[40]。然而在一些疾病中是有益因素,比如副擬桿菌屬是胃袖狀切除加迷走神經干切斷術這種減肥手術術后減肥的潛在有益因素。在癌癥研究中,副擬桿菌屬可能是宮頸癌的一個潛在的生物標志物。而副擬桿菌屬尚未有明確的報道與肺癌有關,本研究中副擬桿菌屬可以增加肺癌的風險這一結論尚是第一次報道,目前專門探究擬副桿菌的研究較少,未來可以進一步探究副擬桿菌屬增加肺癌風險的機制,可進一步從源頭控制肺癌的發生。
雙歧桿菌科和雙歧桿菌目同屬雙歧桿菌門,包含大量細菌種類,是人類胃腸道菌群的重要組成部分[41-42], 研究[36]發現其有健康促進作用和抗腫瘤作用。還有研究[43]發現雙歧桿菌通過使參與結腸癌致癌物產生的微生物酶失活來抗腫瘤。動物實驗中,大量的雙歧桿菌可以增強無菌小鼠的抗腫瘤免疫和促進抗PD-L1活性[44];雙歧桿菌和PD-L1抑制劑聯合口服可激活T細胞并阻斷小鼠黑色素瘤的生長[44]。雙歧桿菌能夠在大腸中結合鐵,從而限制鐵存在下合成的自由基形成,從而降低結直腸癌的風險[45]。以上研究都表明在不同的腫瘤中雙歧桿菌都通過不同方式進行抗腫瘤或降低患病的風險,但是沒有研究探究雙歧桿菌科和雙歧桿菌目在肺癌中是否可以起到一個保護或者降低肺癌患病的風險。MR方法作為一種可以驗證暴露和結局之間是否存在因果關系的方法,通過MR由此確定雙歧桿菌科和雙歧桿菌目與肺癌之間的因果關系,證明雙歧桿菌科和雙歧桿菌目可以降低肺癌的風險,是一個潛在的保護因素。根據本研究我們可以開展進一步的研究探究其降低肺癌的保護機制,從而開發富含雙歧桿菌科或雙歧桿菌目的食物或者飲品等來進行預防肺癌,這為我們肺癌的藥物研究提示了一個新的方向。
不過我們研究還是有一些局限性。首先我們在分析腸道菌群的時候只在屬的層面上分析而不是更近一步比如在物種或具體菌株層面。第二患者和對照都是歐洲人,將我們的研究推廣到其他人種中可能有限制。第三為了獲得足夠的腸道微生物區系,我們選擇了高于傳統全基因組顯著水平(P<5×10?8)的腸道微生物區系中的IVs(P<1×10?5)。最后我們沒有進行腸道菌群與肺癌具體亞型的分析,這有必要進一步的研究。
綜上所述,本研究評估了腸道菌群對肺癌的潛在因果作用,發現擬桿菌門、擬副桿菌屬、雙歧桿菌科和雙歧桿菌目與肺癌存在潛在因果關系,這為肺癌可能存在的治療方法提供新的思路,為肺癌的發病機制提供線索。
作者貢獻:任清林主要負責論文設計、論文初稿撰寫、論文審閱與修改;何文博主要負責論文審閱和論文修改工作;岳佳瑞負責論文審閱與修改;肖洪壁負責論文審閱;束余聲主要負責論文設計、論文審閱。