引用本文: 胡玲莉, 郭萬華, 陳德柱, 李穎, 杜世正. 人附睪蛋白4和糖類抗原125對子宮內膜癌早期診斷價值的系統評價. 中國循證醫學雜志, 2015, 15(9): 1049-1058. doi: 10.7507/1672-2531.20150175 復制
根據世界衛生組織(WHO)2012年公布的數據,發達國家女性子宮內膜癌發病率為5.9%,居女性生殖道惡性腫瘤發病率首位;發展中國家女性子宮內膜癌發病率為4.0%,居女性生殖道惡性腫瘤發病率第二位 [1]。隨著人類平均壽命的延長、肥胖率的增加以及生活方式的改變,子宮內膜癌發病率不斷增高并趨于年輕化 [2]。目前公認,早期診斷子宮內膜癌有利于改善患者預后。已有報道表明,ⅠA期子宮內膜癌患者5年總生存率為88.9%,5年疾病特異生存率為97.3% [3]。因此,早期診斷子宮內膜癌對提高患者總體生存率和生存質量至關重要,選擇靈敏度且特異度高的血清標志物是提高早期診斷率的重要手段。糖類抗原125(carbohydrate antigen 125,CA125)是臨床上常用的血清標志物,其水平在乳腺癌、肺癌、結腸癌、卵巢癌和子宮內膜癌等惡性腫瘤患者血清中均可見升高,但在某些良性疾病患者中,如炎癥、肝硬化、子宮內膜炎和良性卵巢囊腫患者,以及孕婦群體中,血清CA125水平也可見升高,故其診斷子宮內膜癌的特異度不高 [4]。因此有必要尋找更有效的子宮內膜癌血清標志物。
人附睪蛋白4(Human epididymis protein 4,HE4)由Kirchhoff等 [5]于1991年在遠端附睪上皮細胞中發現,學界認為HE4對包括卵巢癌 [6, 7-9]、肺癌 [10]和子宮內膜癌 [11, 12]等惡性腫瘤具有較高的臨床診斷價值。但目前對其在子宮內膜癌的診斷價值,不同研究間存在較大差異。目前可以檢索到的關于血清HE4對子宮內膜癌診斷價值的系統評價有2篇 [11, 12],均聚焦于HE4本身對子宮內膜癌的診斷價值,并未比較其與臨床廣泛應用的CA125的診斷價值。因此,我們采用Meta分析方法,對HE4和CA125在子宮內膜癌中的診斷價值進綜合評價,以期為HE4在子宮內膜癌診斷中的臨床應用提供參考依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
HE4與CA125比較診斷子宮內膜癌的診斷性試驗。
1.1.2 研究對象
以金標準(病理診斷)確診的子宮內膜癌患者為病例組,以子宮良性病變患者或健康女性為對照組。研究對象均為≥ 18歲的成年人,其中子宮內膜癌患者的診斷標準采用國際婦科協會(International Federation of Gynecology and Obstetrics,FIGO)的修訂標準。
1.1.3 診斷方法
金標準為病理診斷,待評價診斷方法為血清HE4與CA125。
1.1.4 結局指標
敏感度(Sen)、特異度(Spe)、陽性似然比(+LR)、陰性似然比(-LR)、診斷比值比(DOR)、綜合受試者工作特征曲線(SROC)下面積(AUC)及Q*指數。
1.1.5 排除標準
① 不能獲得完整的診斷四格表數據的文獻;② 重復發表的文獻;③ 非中、英文文獻。
1.2 檢索策略
計算機檢索PubMed、The Cochrane Library、Web of Science、ScienceDirect、EBSCO、CNKI和VIP數據庫,搜集血清HE4和CA125比較診斷子宮內膜癌的診斷性試驗,檢索時限均為從建庫至2014年8月。英文檢索詞包括:endometrial cancer、endometrial neoplasms、carcinoma、endometrioid、carcinoma,、endometrial、endometrium carcinoma、human epididymis protein E4、HE4、WAP four-disulfide core domain 2 protein、WFDC2;中文檢索詞包括:人附睪免疫蛋白4、HE4、糖類抗原125、CA125和子宮內膜癌。以PubMed為例,其具體檢索策略見框1。
框 1 PubMed檢索策略
#1 “human epididymis protein E4”[Title/Abstract] OR “HE4”[Title/Abstract] OR “WAP four-disulfide core domain 2 protein ,human”[Title/Abstract] OR “WFDC2”[Title/Abstract] #2 “endometrial cancer”[Title/Abstract] OR “endometrial neoplasms”[Title/Abstract] OR “carcinoma,endometrioid”[Title/Abstract] OR “carcinoma,endometrial”[Title/Abstract] OR “endometrium carcinoma”[Title/Abstract] #3 #1 AND #2
1.3 文獻篩選及資料提取
由2位評價員獨立篩選文獻和提取資料,并交叉核對,如遇分歧,則咨詢第三方協助判斷。文獻篩選時首先閱讀文題和摘要進行初篩,在排除明顯不相關的文獻后,進一步閱讀全文進行復篩,以決定最終是否納入。此外,追溯納入研究的參考文獻,以補充獲取相關文獻。文獻管理采用Endnote X3和Note Express軟件。采用自制的資料提取表提取資料,提取內容主要包括:① 納入研究的基本信息,包括研究題目、第一作者、發表年限、國籍、研究設計、研究對象(包括子宮內膜癌患者組、良性子宮疾病組和正常對照組)等;② 樣本量、檢測方法、試劑來源、金標準、臨界值、真陽性(TP)例數、假陽性(FP)例數、假陰性(FN)例數和真陰性(TN)例數。
1.4 納入研究的偏倚風險評價
由2名評價員采用QUADAS-2(Quality Assessment of Diagnostic Accuracy Studies-2)工具 [13]獨立評價納入研究的偏倚風險,并交叉核對,如遇分歧,則咨詢第三方協助判斷。
1.5 統計分析
采用Meta-Disc 1.4、RevMan 5.3和Stata 11.0軟件進行統計分析。首先通過計算靈敏度對數與(1-特異度)對數的Spearman相關系數檢驗是否存在閾值效應(threshold effect)。若不存在閾值效應,則通過計算Cochrane-Q值和I2值檢驗非閾值效應引起的異質性 [14],并計算P值。若異質性檢驗結果為P>0.10,可認為各研究具有同質性;若P≤ 0.1,則認為各研究結果間存在異質性。同時,結合I2對異質性進行定量分析。I2<25%,表明異質性較小;25≤ I2<50%為中度異質性,I2≥ 50%為高度異質性。若各研究間無統計學異質性,采用固定效應模型進行Meta分析;若各研究間有統計學異質性,則采用隨機效應模型進行Meta分析。
本研究參考Devillé等 [15]關于診斷性試驗系統評價的實施指南完成。就HE4和CA125對子宮內膜癌的診斷價值,我們分別計算其合并的敏感度(SEN)、特異度(SPE)、陽性似然比(positive likelihood ratio,PLR)、陰性似然比(negative likelihood ratio,NLR)、診斷比值比(diagnostic odds ratio,DOR)及其相應的95%CI。參考Zhen等 [16]的方法對兩腫瘤標志物各合并指標的大小進行比較,以判斷其診斷價值的高低。其中,PLR愈大,表明該診斷性試驗誤診率越小;NLR愈小,表明該診斷性試驗漏診率愈低。根據Pepe等 [17]的建議,當PLR>10或NLR<0.1時,表明驗前概率到驗后概率發生決定性變化,基本可以確定或者排除診斷;當5<PLR<10或者0.1<NLR<0.2,表明驗前概率到驗后概率發生中度變化;當2<PLR<5或0.2<NLR<0.5時,驗前概率到驗后概率發生較小程度變化;1<PLR<2或者0.5<NLR<1之間,驗前概率到驗后概率基本上不發生變化。DOR越大(>1),表明該診斷性試驗的判別效果越好。此外,本研究亦繪制SROC曲線,分別計算其AUC和Q*指數。Meta分析的檢驗水準為α=0.05。同時采用Meta回歸方法分析可能的異質性來源。根據對照組納入人群的不同進行亞組分析。
采用Begg’s漏斗圖和Egger’s圖分析潛在的發表偏倚。
2 結果
2.1 文獻檢索結果
初檢出相關文獻152篇,經逐層篩選后,最終納入20個研究 [18-37]。文獻篩選流程及結果見圖 1。

2.2 納入研究的基本特征與偏倚風險評價
納入研究的基本特征見表 1,方法學質量評價結果見圖 2。納入的20個研究共包括4 351例研究對象,其中2 136例研究對象被確診為子宮內膜癌,1 291名研究對象被確診為良性子宮內膜疾病,924例研究對象為健康女性。就研究設計而言,19個研究為前瞻性研究,1個研究 [25]采用回顧性設計。在患者的招募過程中,僅2個研究 [29, 30]明確指出采用連續性招募(consecutive enrollment),其余18個研究未提及。就對照組而言,6個研究 [22, 23, 27, 31, 33, 37]的對照組同時包括良性子宮內膜疾病和健康女性,6個研究 [26, 28-30, 32, 35]的對照組為良性子宮內膜疾病,7個研究 [18, 19, 21, 24, 25, 34, 36]對照組為健康女性。另外,叢培珊等 [20]的研究中,病例組(n=47)分別與正常對照組(n=30)和良性病變對照組(n=30)進行了比較。


2.3 Meta分析結果
異質性檢驗結果顯示,HE4和CA125四格表數據均不存在閾值效應引起的異質性(HE4 Spearman相關系數=0.307,P=0.144;CA125 Spearman相關系數= -0.006,P=0.979)。制作SROC 曲線平面圖,其不呈“肩臂狀”分布,提示不存在閾值效應引起的異質性。在DOR森林圖中,每個研究的診斷比數比與合并診斷比數比并不沿同一直線分布,表明存在非閾值效應引起的異質性。就HE4而言,合并的Sen、Spe、+LR、-LR和DOR的Cochrane-Q值分別為181.57、225.38、130.93、126.59和81.75(P值均<0.001),其對應的I2值分別為87.3%、89.8%、82.4%、81.8%和71.9%;就CA125而言,合并的Sen、Spe、+LR、-LR和DOR的Cochrane-Q值分別為232.10、351.91、165.71、139.69和163.88,其對應的I2值分別為90.5%、93.7%、86.7%、84.3%和86.6%。結果雖然顯示各研究間存在明顯統計學異質性,但研究間臨床同質性較好,故采用隨機效應模型進行Meta分析。
Meta分析結果見圖 3、圖 4。血清HE4診斷子宮內膜癌的合并Sen、Spe、+LR、-LR和DOR分別為0.56[95%CI(0.54,0.58)]、0.89[95%CI(0.88,0.90)]、6.19[95%CI(4.31,8.88)]、0.49[95%CI(0.44,0.56)]和14.27[95%CI(9.50,21.42)]。CA125診斷子宮內膜癌的合并Sen、Spe、+LR、-LR和DOR分別為0.33[95%CI(0.31,0.34)]、0.80[95%CI(0.78,0.82)]、2.07[95%CI(1.45,2.95)]、0.83[95%CI(0.76,0.91)]和2.65[95%CI(1.63,4.32)]。HE4和CA125的SROC曲線下面積(AUC)分別為0.855 9和0.657 5,其對應的Q*指數分別為0.790 7和0.619 5。

A:HE4合并敏感度;B:CA125合并敏感度;C:HE4合并特異度;D:CA125合并特異度;E:HE4合并診斷比值比;F:CA125合并診斷比值比

2.4 Meta回歸分析結果
對研究設計(前瞻性或回顧性)、病例數、種族、是否連續納入和對照組的設置等5個要素進行Meta回歸分析,結果顯示,上述指標均非研究間異質性來源。
2.5 亞組分析結果
將納入研究按對照組不同分為良性子宮疾病對照、健康女性對照和混合對照(良性疾病+健康女性)三組進行亞組分析。亞組結果表明:三組間血清HE4對子宮內膜癌的各合并診斷指標均優于CA125,結果見表 2。

2.6 發表偏倚
就HE4而言,Begg’s和Egger’s檢驗結果均表明,存在明顯的發表偏倚(P值分別為0.022和0.043)。Begg’s漏斗圖顯示存在明顯的不對稱性,Egger’s圖亦表明存在發表偏倚(圖 5)。

3 討論
子宮內膜癌已成為國內外婦科衛生領域關注的焦點之一,早期診斷對改善此類疾病患者的預后、提高其總體生存率和生存質量至關重要。血清學標志物檢測是早期惡性腫瘤的重要診斷手段 [38]。目前HE4在子宮內膜癌中的診斷價值日益受到重視。為比較HE4和CA125對子宮內膜癌的診斷價值,本研究納入在同一人群中比較HE4和CA125對子宮內膜癌診斷價值的診斷性試驗,Meta分析結果表明,血清HE4和CA125對子宮內膜癌的合并Sen分別為0.56和0.33,合并Spe分別為0.89和0.80。HE4和CA125對子宮內膜癌的合并DOR分別為14.27和2.65,表明HE4對子宮內膜癌的判別效果優于CA125。HE4和CA125對子宮內膜癌的合并+LR分別為6.19和2.07,表明當出現陽性結果時,HE4對子宮內膜癌的診斷正確率為中等,高于CA125。HE4和CA125對子宮內膜癌的合并-LR分別為0.49和0.83,表明當出現陰性結果時,HE4和CA125對子宮內膜癌的排除能力均較低,漏診率均較高。HE4和CA125的SROC曲線下面積AUC分別為0.855 9和0.657 5,其對應的Q*指數分別為0.790 7和0.619 5。上述研究結果表明,HE4對子宮內膜癌的診斷效能可能優于CA125,具有更高的診斷價值。
異質性檢驗結果表明,本研究不存在閾值效應。在此基礎之上,采用Meta回歸分析方法尋找可能的異質性來源,結果顯示研究設計、病例數、種族、是否連續納入和對照組的設置均不是異質性的主要來源,對異質性來源有待于進一步探析。
亞組分析表明,就不同的對照組設置,血清HE4對子宮內膜癌的各診斷指標均優于CA125,均說明血清HE4對子宮內膜癌的診斷價值可能更高。
目前為止,可以檢索到的HE4對子宮內膜癌的診斷價值系統評價有2篇 [11, 12]。其中,Bie等 [11]的Meta分析共納入6個研究,其結果表明,HE4對子宮內膜癌診斷的合并Sen、Spe、DOR和AUC分別為0.59[95%CI(0.56,0.62)]、0.92[95%CI(0.90,0.94)]、20.82[95%CI(11.43,37.90)]和0.832 1,其結論認為HE4對子宮內膜癌具有一定的診斷價值,其診斷特異度較高。張晶等 [12]的系統評價共納入16個研究,HE4對子宮內膜癌的合并Sen、Spe、DOR和AUC分別為0.57[95%CI(0.54,0.60)]、0.92[95%CI(0.91,0.94)]、18.38[95%CI(12.21,27.69)]和0.881 7,結果同樣表明血清HE4對子宮內膜癌的總體診斷敏感度較低,但特異度較高。上述2項研究均單純聚焦于HE4對子宮內膜癌的診斷價值,但本系統評價研究重點比較了血清HE4和CA125在同一人群中對子宮內膜癌的診斷價值,由于血清CA125是臨床上常用的子宮內膜癌標志物,因此比較兩者對子宮內膜癌的診斷效能將更具有臨床實踐價值。
就HE4和CA125對子宮內膜癌的診斷價值比較,本研究直接對兩血清標志物各診斷指標的Meta分析合并值進行比較,以得出結論。Zhen等 [16]亦采用同樣的方法進行研究。然而,這一方法在統計學上是否具有進一步完善的可能,目前本課題組尚未發現確切文獻,有待于進一步明確。此外,本研究亦存在一定的局限性:① 本次系統評價納入研究質量多為中等,整體質量不高,這在一定程度上影響了研究結論的可靠性。② 就對照組的設置,6個研究中對照組同時包括良性子宮內膜疾病和健康女性,7個研究中對照組為健康女性,這在一定程度上可能造成合并特異度偏高。本研究采用亞組分析以探討不同對照組對診斷效果的影響,結果均表明HE4對子宮內膜癌的診斷效能優于CA125。③ 本系統評價的納入和排除標準中,未將其他可能影響血清HE4和CA125水平的生物學和生活方式特征納入,如抽煙、月經狀態、腎功能狀態和腎小球濾過率(glomerular filtration rate,GFR)[39]等,這可能對本研究結論造成一定偏倚。④ 本次Meta分析納入研究間異質性較大,其來源有待于進一步明確。⑤ 本次系統評價僅納入了中、英文文獻,不排除語言偏倚的可能。上述研究局限性使得本研究結果要慎重解釋和推廣。
綜上所述,當前證據顯示,相對于血清CA125,血清HE4對子宮內膜癌的診斷具有更高的靈敏度、特異度和SROC曲線下面積,診斷效能更高。受納入研究質量和數量限制,上述結論尚需開展更多高質量研究予以驗證。
根據世界衛生組織(WHO)2012年公布的數據,發達國家女性子宮內膜癌發病率為5.9%,居女性生殖道惡性腫瘤發病率首位;發展中國家女性子宮內膜癌發病率為4.0%,居女性生殖道惡性腫瘤發病率第二位 [1]。隨著人類平均壽命的延長、肥胖率的增加以及生活方式的改變,子宮內膜癌發病率不斷增高并趨于年輕化 [2]。目前公認,早期診斷子宮內膜癌有利于改善患者預后。已有報道表明,ⅠA期子宮內膜癌患者5年總生存率為88.9%,5年疾病特異生存率為97.3% [3]。因此,早期診斷子宮內膜癌對提高患者總體生存率和生存質量至關重要,選擇靈敏度且特異度高的血清標志物是提高早期診斷率的重要手段。糖類抗原125(carbohydrate antigen 125,CA125)是臨床上常用的血清標志物,其水平在乳腺癌、肺癌、結腸癌、卵巢癌和子宮內膜癌等惡性腫瘤患者血清中均可見升高,但在某些良性疾病患者中,如炎癥、肝硬化、子宮內膜炎和良性卵巢囊腫患者,以及孕婦群體中,血清CA125水平也可見升高,故其診斷子宮內膜癌的特異度不高 [4]。因此有必要尋找更有效的子宮內膜癌血清標志物。
人附睪蛋白4(Human epididymis protein 4,HE4)由Kirchhoff等 [5]于1991年在遠端附睪上皮細胞中發現,學界認為HE4對包括卵巢癌 [6, 7-9]、肺癌 [10]和子宮內膜癌 [11, 12]等惡性腫瘤具有較高的臨床診斷價值。但目前對其在子宮內膜癌的診斷價值,不同研究間存在較大差異。目前可以檢索到的關于血清HE4對子宮內膜癌診斷價值的系統評價有2篇 [11, 12],均聚焦于HE4本身對子宮內膜癌的診斷價值,并未比較其與臨床廣泛應用的CA125的診斷價值。因此,我們采用Meta分析方法,對HE4和CA125在子宮內膜癌中的診斷價值進綜合評價,以期為HE4在子宮內膜癌診斷中的臨床應用提供參考依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
HE4與CA125比較診斷子宮內膜癌的診斷性試驗。
1.1.2 研究對象
以金標準(病理診斷)確診的子宮內膜癌患者為病例組,以子宮良性病變患者或健康女性為對照組。研究對象均為≥ 18歲的成年人,其中子宮內膜癌患者的診斷標準采用國際婦科協會(International Federation of Gynecology and Obstetrics,FIGO)的修訂標準。
1.1.3 診斷方法
金標準為病理診斷,待評價診斷方法為血清HE4與CA125。
1.1.4 結局指標
敏感度(Sen)、特異度(Spe)、陽性似然比(+LR)、陰性似然比(-LR)、診斷比值比(DOR)、綜合受試者工作特征曲線(SROC)下面積(AUC)及Q*指數。
1.1.5 排除標準
① 不能獲得完整的診斷四格表數據的文獻;② 重復發表的文獻;③ 非中、英文文獻。
1.2 檢索策略
計算機檢索PubMed、The Cochrane Library、Web of Science、ScienceDirect、EBSCO、CNKI和VIP數據庫,搜集血清HE4和CA125比較診斷子宮內膜癌的診斷性試驗,檢索時限均為從建庫至2014年8月。英文檢索詞包括:endometrial cancer、endometrial neoplasms、carcinoma、endometrioid、carcinoma,、endometrial、endometrium carcinoma、human epididymis protein E4、HE4、WAP four-disulfide core domain 2 protein、WFDC2;中文檢索詞包括:人附睪免疫蛋白4、HE4、糖類抗原125、CA125和子宮內膜癌。以PubMed為例,其具體檢索策略見框1。
框 1 PubMed檢索策略
#1 “human epididymis protein E4”[Title/Abstract] OR “HE4”[Title/Abstract] OR “WAP four-disulfide core domain 2 protein ,human”[Title/Abstract] OR “WFDC2”[Title/Abstract] #2 “endometrial cancer”[Title/Abstract] OR “endometrial neoplasms”[Title/Abstract] OR “carcinoma,endometrioid”[Title/Abstract] OR “carcinoma,endometrial”[Title/Abstract] OR “endometrium carcinoma”[Title/Abstract] #3 #1 AND #2
1.3 文獻篩選及資料提取
由2位評價員獨立篩選文獻和提取資料,并交叉核對,如遇分歧,則咨詢第三方協助判斷。文獻篩選時首先閱讀文題和摘要進行初篩,在排除明顯不相關的文獻后,進一步閱讀全文進行復篩,以決定最終是否納入。此外,追溯納入研究的參考文獻,以補充獲取相關文獻。文獻管理采用Endnote X3和Note Express軟件。采用自制的資料提取表提取資料,提取內容主要包括:① 納入研究的基本信息,包括研究題目、第一作者、發表年限、國籍、研究設計、研究對象(包括子宮內膜癌患者組、良性子宮疾病組和正常對照組)等;② 樣本量、檢測方法、試劑來源、金標準、臨界值、真陽性(TP)例數、假陽性(FP)例數、假陰性(FN)例數和真陰性(TN)例數。
1.4 納入研究的偏倚風險評價
由2名評價員采用QUADAS-2(Quality Assessment of Diagnostic Accuracy Studies-2)工具 [13]獨立評價納入研究的偏倚風險,并交叉核對,如遇分歧,則咨詢第三方協助判斷。
1.5 統計分析
采用Meta-Disc 1.4、RevMan 5.3和Stata 11.0軟件進行統計分析。首先通過計算靈敏度對數與(1-特異度)對數的Spearman相關系數檢驗是否存在閾值效應(threshold effect)。若不存在閾值效應,則通過計算Cochrane-Q值和I2值檢驗非閾值效應引起的異質性 [14],并計算P值。若異質性檢驗結果為P>0.10,可認為各研究具有同質性;若P≤ 0.1,則認為各研究結果間存在異質性。同時,結合I2對異質性進行定量分析。I2<25%,表明異質性較小;25≤ I2<50%為中度異質性,I2≥ 50%為高度異質性。若各研究間無統計學異質性,采用固定效應模型進行Meta分析;若各研究間有統計學異質性,則采用隨機效應模型進行Meta分析。
本研究參考Devillé等 [15]關于診斷性試驗系統評價的實施指南完成。就HE4和CA125對子宮內膜癌的診斷價值,我們分別計算其合并的敏感度(SEN)、特異度(SPE)、陽性似然比(positive likelihood ratio,PLR)、陰性似然比(negative likelihood ratio,NLR)、診斷比值比(diagnostic odds ratio,DOR)及其相應的95%CI。參考Zhen等 [16]的方法對兩腫瘤標志物各合并指標的大小進行比較,以判斷其診斷價值的高低。其中,PLR愈大,表明該診斷性試驗誤診率越小;NLR愈小,表明該診斷性試驗漏診率愈低。根據Pepe等 [17]的建議,當PLR>10或NLR<0.1時,表明驗前概率到驗后概率發生決定性變化,基本可以確定或者排除診斷;當5<PLR<10或者0.1<NLR<0.2,表明驗前概率到驗后概率發生中度變化;當2<PLR<5或0.2<NLR<0.5時,驗前概率到驗后概率發生較小程度變化;1<PLR<2或者0.5<NLR<1之間,驗前概率到驗后概率基本上不發生變化。DOR越大(>1),表明該診斷性試驗的判別效果越好。此外,本研究亦繪制SROC曲線,分別計算其AUC和Q*指數。Meta分析的檢驗水準為α=0.05。同時采用Meta回歸方法分析可能的異質性來源。根據對照組納入人群的不同進行亞組分析。
采用Begg’s漏斗圖和Egger’s圖分析潛在的發表偏倚。
2 結果
2.1 文獻檢索結果
初檢出相關文獻152篇,經逐層篩選后,最終納入20個研究 [18-37]。文獻篩選流程及結果見圖 1。

2.2 納入研究的基本特征與偏倚風險評價
納入研究的基本特征見表 1,方法學質量評價結果見圖 2。納入的20個研究共包括4 351例研究對象,其中2 136例研究對象被確診為子宮內膜癌,1 291名研究對象被確診為良性子宮內膜疾病,924例研究對象為健康女性。就研究設計而言,19個研究為前瞻性研究,1個研究 [25]采用回顧性設計。在患者的招募過程中,僅2個研究 [29, 30]明確指出采用連續性招募(consecutive enrollment),其余18個研究未提及。就對照組而言,6個研究 [22, 23, 27, 31, 33, 37]的對照組同時包括良性子宮內膜疾病和健康女性,6個研究 [26, 28-30, 32, 35]的對照組為良性子宮內膜疾病,7個研究 [18, 19, 21, 24, 25, 34, 36]對照組為健康女性。另外,叢培珊等 [20]的研究中,病例組(n=47)分別與正常對照組(n=30)和良性病變對照組(n=30)進行了比較。


2.3 Meta分析結果
異質性檢驗結果顯示,HE4和CA125四格表數據均不存在閾值效應引起的異質性(HE4 Spearman相關系數=0.307,P=0.144;CA125 Spearman相關系數= -0.006,P=0.979)。制作SROC 曲線平面圖,其不呈“肩臂狀”分布,提示不存在閾值效應引起的異質性。在DOR森林圖中,每個研究的診斷比數比與合并診斷比數比并不沿同一直線分布,表明存在非閾值效應引起的異質性。就HE4而言,合并的Sen、Spe、+LR、-LR和DOR的Cochrane-Q值分別為181.57、225.38、130.93、126.59和81.75(P值均<0.001),其對應的I2值分別為87.3%、89.8%、82.4%、81.8%和71.9%;就CA125而言,合并的Sen、Spe、+LR、-LR和DOR的Cochrane-Q值分別為232.10、351.91、165.71、139.69和163.88,其對應的I2值分別為90.5%、93.7%、86.7%、84.3%和86.6%。結果雖然顯示各研究間存在明顯統計學異質性,但研究間臨床同質性較好,故采用隨機效應模型進行Meta分析。
Meta分析結果見圖 3、圖 4。血清HE4診斷子宮內膜癌的合并Sen、Spe、+LR、-LR和DOR分別為0.56[95%CI(0.54,0.58)]、0.89[95%CI(0.88,0.90)]、6.19[95%CI(4.31,8.88)]、0.49[95%CI(0.44,0.56)]和14.27[95%CI(9.50,21.42)]。CA125診斷子宮內膜癌的合并Sen、Spe、+LR、-LR和DOR分別為0.33[95%CI(0.31,0.34)]、0.80[95%CI(0.78,0.82)]、2.07[95%CI(1.45,2.95)]、0.83[95%CI(0.76,0.91)]和2.65[95%CI(1.63,4.32)]。HE4和CA125的SROC曲線下面積(AUC)分別為0.855 9和0.657 5,其對應的Q*指數分別為0.790 7和0.619 5。

A:HE4合并敏感度;B:CA125合并敏感度;C:HE4合并特異度;D:CA125合并特異度;E:HE4合并診斷比值比;F:CA125合并診斷比值比

2.4 Meta回歸分析結果
對研究設計(前瞻性或回顧性)、病例數、種族、是否連續納入和對照組的設置等5個要素進行Meta回歸分析,結果顯示,上述指標均非研究間異質性來源。
2.5 亞組分析結果
將納入研究按對照組不同分為良性子宮疾病對照、健康女性對照和混合對照(良性疾病+健康女性)三組進行亞組分析。亞組結果表明:三組間血清HE4對子宮內膜癌的各合并診斷指標均優于CA125,結果見表 2。

2.6 發表偏倚
就HE4而言,Begg’s和Egger’s檢驗結果均表明,存在明顯的發表偏倚(P值分別為0.022和0.043)。Begg’s漏斗圖顯示存在明顯的不對稱性,Egger’s圖亦表明存在發表偏倚(圖 5)。

3 討論
子宮內膜癌已成為國內外婦科衛生領域關注的焦點之一,早期診斷對改善此類疾病患者的預后、提高其總體生存率和生存質量至關重要。血清學標志物檢測是早期惡性腫瘤的重要診斷手段 [38]。目前HE4在子宮內膜癌中的診斷價值日益受到重視。為比較HE4和CA125對子宮內膜癌的診斷價值,本研究納入在同一人群中比較HE4和CA125對子宮內膜癌診斷價值的診斷性試驗,Meta分析結果表明,血清HE4和CA125對子宮內膜癌的合并Sen分別為0.56和0.33,合并Spe分別為0.89和0.80。HE4和CA125對子宮內膜癌的合并DOR分別為14.27和2.65,表明HE4對子宮內膜癌的判別效果優于CA125。HE4和CA125對子宮內膜癌的合并+LR分別為6.19和2.07,表明當出現陽性結果時,HE4對子宮內膜癌的診斷正確率為中等,高于CA125。HE4和CA125對子宮內膜癌的合并-LR分別為0.49和0.83,表明當出現陰性結果時,HE4和CA125對子宮內膜癌的排除能力均較低,漏診率均較高。HE4和CA125的SROC曲線下面積AUC分別為0.855 9和0.657 5,其對應的Q*指數分別為0.790 7和0.619 5。上述研究結果表明,HE4對子宮內膜癌的診斷效能可能優于CA125,具有更高的診斷價值。
異質性檢驗結果表明,本研究不存在閾值效應。在此基礎之上,采用Meta回歸分析方法尋找可能的異質性來源,結果顯示研究設計、病例數、種族、是否連續納入和對照組的設置均不是異質性的主要來源,對異質性來源有待于進一步探析。
亞組分析表明,就不同的對照組設置,血清HE4對子宮內膜癌的各診斷指標均優于CA125,均說明血清HE4對子宮內膜癌的診斷價值可能更高。
目前為止,可以檢索到的HE4對子宮內膜癌的診斷價值系統評價有2篇 [11, 12]。其中,Bie等 [11]的Meta分析共納入6個研究,其結果表明,HE4對子宮內膜癌診斷的合并Sen、Spe、DOR和AUC分別為0.59[95%CI(0.56,0.62)]、0.92[95%CI(0.90,0.94)]、20.82[95%CI(11.43,37.90)]和0.832 1,其結論認為HE4對子宮內膜癌具有一定的診斷價值,其診斷特異度較高。張晶等 [12]的系統評價共納入16個研究,HE4對子宮內膜癌的合并Sen、Spe、DOR和AUC分別為0.57[95%CI(0.54,0.60)]、0.92[95%CI(0.91,0.94)]、18.38[95%CI(12.21,27.69)]和0.881 7,結果同樣表明血清HE4對子宮內膜癌的總體診斷敏感度較低,但特異度較高。上述2項研究均單純聚焦于HE4對子宮內膜癌的診斷價值,但本系統評價研究重點比較了血清HE4和CA125在同一人群中對子宮內膜癌的診斷價值,由于血清CA125是臨床上常用的子宮內膜癌標志物,因此比較兩者對子宮內膜癌的診斷效能將更具有臨床實踐價值。
就HE4和CA125對子宮內膜癌的診斷價值比較,本研究直接對兩血清標志物各診斷指標的Meta分析合并值進行比較,以得出結論。Zhen等 [16]亦采用同樣的方法進行研究。然而,這一方法在統計學上是否具有進一步完善的可能,目前本課題組尚未發現確切文獻,有待于進一步明確。此外,本研究亦存在一定的局限性:① 本次系統評價納入研究質量多為中等,整體質量不高,這在一定程度上影響了研究結論的可靠性。② 就對照組的設置,6個研究中對照組同時包括良性子宮內膜疾病和健康女性,7個研究中對照組為健康女性,這在一定程度上可能造成合并特異度偏高。本研究采用亞組分析以探討不同對照組對診斷效果的影響,結果均表明HE4對子宮內膜癌的診斷效能優于CA125。③ 本系統評價的納入和排除標準中,未將其他可能影響血清HE4和CA125水平的生物學和生活方式特征納入,如抽煙、月經狀態、腎功能狀態和腎小球濾過率(glomerular filtration rate,GFR)[39]等,這可能對本研究結論造成一定偏倚。④ 本次Meta分析納入研究間異質性較大,其來源有待于進一步明確。⑤ 本次系統評價僅納入了中、英文文獻,不排除語言偏倚的可能。上述研究局限性使得本研究結果要慎重解釋和推廣。
綜上所述,當前證據顯示,相對于血清CA125,血清HE4對子宮內膜癌的診斷具有更高的靈敏度、特異度和SROC曲線下面積,診斷效能更高。受納入研究質量和數量限制,上述結論尚需開展更多高質量研究予以驗證。