引用本文: 黎麗群, 謝勝, 陳明冰, 李建鋒, 譚金晶. GerdQ 量表對胃食管反流性疾病診斷價值的 Meta 分析. 中國循證醫學雜志, 2019, 19(8): 915-923. doi: 10.7507/1672-2531.201804030 復制
胃食管反流性疾病(gastro-oesophageal reflux disease,GERD)是指胃內容物反流至食管導致食管黏膜破裂、糜爛而引起不適癥狀和(或)并發癥的一種疾病[1]。目前 GERD 的發病率呈顯著上升趨勢,嚴重影響了患者的生活質量[2, 3]。臨床上主要推薦使用質子泵抑制劑(proton pump inhibitor,PPI)試驗、內鏡或食管 24 小時酸監測來診斷 GERD。然而 PPI 試驗的準確性中等;內鏡僅能發現食管粘膜受侵蝕的病例,特異性不高;食管 24 小時酸監測是有創方法,因此使用均具有局限性。為此,國內外學者致力于研究以癥狀為主要診斷依據的問卷,以期找到簡單易行的診斷方法。
Dent 等[4]研制胃食管反流性疾病問卷(GerdQ)已廣泛應用于 GERD 的診斷,盡管該量表的可靠性及有效性得到了臨床驗證,但診斷準確性結論不盡相同。有報道稱 GerdQ 評分為 8 時,與胃食管反流性疾病的相關性為 92%,可作為診斷 GERD 的主要工具。也有學者認為其診斷 GERD 的敏感性(57.7%)和特異性(48.9%)較低,診斷價值不高[5, 6]。鑒于目前相關研究樣本量小,研究人員、時間及地點等不同,結論缺乏說服力。且國內外尚未有 Meta 分析說明 GerdQ 量表診斷 GERD 的價值。為此,本研究將對 GerdQ 診斷 GERD 的研究進行 Meta 分析,以期為今后開展 GerdQ 診斷 GERD 提供決策依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
國內外公開發表的關于 GerdQ 診斷胃食管反流性疾病的診斷性研究,語種僅限中、英文,無研究時間、地點限制。
1.1.2 研究對象
胃食管反流性疾病疑似患者,無年齡、性別、民族、國籍限制。
1.1.3 診斷方法
待評價指標為 GerdQ 量表,“金標準”為電子胃鏡、食管 24 小時酸測定、PPI 試驗及 RDQ 量表中的一種或多種診斷措施證實。
1.1.4 結局指標
GerdQ 量表診斷胃食管反流性疾病的敏感度(Sen)、特異度(Spe)、陽性似然比(+LR)、陰性似然比(?LR)、診斷比值比(DOR)、受試者工作特征(SROC)曲線下面積(AUC)及 Q*指數。
1.1.5 排除標準
① 重復發表的研究;② 文獻綜述、病例報告分析、調查分析及論文摘要;③ 碩士博士學位論文;④ 數據有誤,不能夠獲取完整四格表數據,而不能與作者取得聯系確認的研究;⑤ 無明確閾值的研究。
1.2 文獻檢索策略
計算機檢索 PubMed、Wed of Science、EBMR、CNKI、CBM、VIP 和 WanFang Data,搜集關于 GerdQ 量表診斷胃食管反流性疾病的診斷性研究,檢索時限從建庫至 2018 年 1 月 1 日。同時追溯納入文獻的參考文獻,以補充獲取相關文獻。并手工檢索相關雜志查找相關文獻。檢索采用主題詞和自由詞相結合的方式進行檢索。中文檢索詞包括:胃食管反流性疾病、反流性食管炎、胃食管返流病、酸反流性疾病、GerdQ 量表、胃食管反流性疾病問卷、癥狀問卷、反流性疾病問卷;英文檢索詞包括:GERD、GerdQ、gastroesophageal reflux disease、gastroesophageal reflux disease questionnaire。以 CNKI 為例,其具體檢索策略見框 1。

1.3 文獻篩選、資料提取和偏倚風險評價
由 2 位評價員獨立篩選文獻、提取資料并交叉核對,如遇分歧,則通過討論解決,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:第一作者、研究時間、研究地點、研究對象性別、研究對象年齡、樣本量、GerdQ 量表評分最佳臨界值、診斷標準、真陽性(TP)、真陰性(TN)、假陰性(FN)和假陽性(FP)。納入研究偏倚風險評價采用 QUADAS-2 標準[7]進行。
1.4 統計分析
采用 Meta-Disc 1.4 軟件[8]進行 Meta 分析。由閾值效應引起的異質性采用 Spearman 相關分析檢驗,如果 P<0.05,提示異質性為閾值效應引起致;若 P>0.05,則進一步分析有無其他原因所引起的異質性。對 Sen、Spe 采用卡方檢驗,?LR、+LR 及 DOR 采用 Cochrane-Q 檢驗。若研究間存在異質性則采用隨機效應模型,反之則使用固定模型進行統計學分析。Meta 分析的檢驗水準為 α=0.05。采用 Stata 12.0 軟件繪制漏斗圖并評估試驗研究發表的偏倚性[9]。
1.5 診斷效能評價指標
評價合并的 Sen、Spe、+LR、?LR、DOR、SROC(AUC)及 Q*指數,AUC 越接近 1,Q*指數越大,表示 GerdQ 對胃食管反流性疾病的診斷價值越高;反之則越小。
2 結果
2.1 文獻檢索流程及結果
初檢出相關文獻 3 012 篇,經逐層篩選后,最終納入 20 個研究[10-29]。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入研究的基本特征
共納入 7 978 例病例,確診的 GERD 患者共 4 848 例,納入研究的基本特征見表 1。

2.3 納入研究的偏倚風險評價結果
納入研究的偏倚風險評價結果見表 2。

2.4 Meta 分析結果
2.4.1 異質性檢驗
Spearman 相關系數為?0.011 7,P=0.624,ROC 平面圖不呈“肩臂狀”分布,因此研究間不存在閾值效應,但經檢驗后發現各研究 Sen、Spe、+LR、?LR 和 DOR 均具有高異質性(表 3),故采用隨機效應模式進行 Meta 分析。

2.4.2 合并效應量
Sen、Spe、+LR、?LR、DOR 分別為 0.79[95%CI(0.78,0.81)]、0.66[95% CI(0.65,0.68)]、2.28[95%CI(1.77,2.94)]、0.37[95%CI(0.27,0.52)]、6.34[95%CI(3.59,11.19)];SROC(AUC)=0.789 3,Q*指數 0.726 6(圖 2~7)。






2.4.3 亞組分析
對納入研究進行亞組分析,結果提示臨界值為 7 分時,Sen、Spe、DOR 最高,SROC(AUC)最大,表明當臨界值為 7 分時,GerdQ 診斷 GERD 的準確性最高,GerdQ 評分為 9 分時次之。國內的研究結果與國外的研究結果相比,表明 GerdQ 量表用于診斷中國人胃食管反流性疾病人的準確性更高。使用內鏡、食管 24 小時酸測定及 PPI 試驗三者之一陽性者為金標準的研究表明 GerdQ 診斷 GERD 的價值最高(表 4)。

2.4.4 發表偏倚分析
Egger’s 檢驗結果顯示 t=?0.13,P=0.897,Begg’s 檢驗結果顯示,Kendall 評分(P?Q)=28,z=0.88(continuity corrected),Pr>|z|=0.381(continuity corrected),提示差異無統計學意義。納入研究發生發表偏倚可能性較小(圖 8)。

3 討論
胃食管反流性疾病是由胃內容物反流至食管導致不適癥狀和(或)并發癥的一種疾病。近年來本病在亞洲的發病率呈上升趨勢,并使患者的生活質量下降,加重患者家庭及社會的經濟負擔[30, 31]。目前,臨床上 GERD 的主要診斷方法有胃鏡、食管 24 小時酸監測、PPI 試驗、食管測壓等,然而尚無統一明確的金標準。盡管胃鏡為診斷食管粘膜損傷的金標準,但由于 50%~70% 的 GERD 患者并無食管粘膜腐蝕損傷,且在有反流癥狀的 GERD 患者中,1/2~2/3 有非侵蝕性疾病表現及內窺鏡檢查顯示正常,更有研究稱胃鏡檢查的敏感性約為 30%~50%,因此有學者提出胃鏡并非是診斷 GERD 的首選工具[32-34]。pH 監測為侵入性檢查,且在偏遠地區尚未普及,使用具有局限性。PPI 試驗的敏感性和特異性均一般,不適宜作為診斷 GERD 的試驗[35]。故國內外許多學者致力于研究以癥狀為主要診斷依據的問卷,以期找到簡單易行的診斷方法。GerdQ 量表自問世以來,已廣泛使用于 GERD 的臨床診斷,其診斷及使用價值已得到了驗證[36, 37]。GerdQ 的診斷價值與食管 24 小時酸測定的診斷價值相近,可作為 GERD 初級篩查的工具[38, 39]。GerdQ 評分簡單易行,可以降低患者的醫療費用,使 GERD 患者受益更多,為醫生提供一個簡單的有效的診斷方法[40]。近年來,盡管國內外越來越多學者對 GerdQ 量表診斷 GERD 的價值進行研究,但臨界值不一致,結論不盡相同。目前國內外尚無學者對該量表診斷 GERD 的診斷價值進行 Meta 分析,故本研究將對 GerdQ 診斷 GERD 的研究進行 Meta 分析,合并各個研究效應量,增大樣本量,使檢驗效能得到提高,為今后開展 GerdQ 診斷 GERD 提供有服力的循證證據。
本研究最終納入了 20 篇文獻,Meta 分析結果顯示問卷診斷 GERD 的合并 Sen、Spe、+LP、?LP 及 DOR 分別為:0.79[95%CI(0.78,0.81)]、0.66[95%CI(0.65,0.68)]、2.28[95%CI(1.77,2.94)]、0.37[95% CI(0.27,0.52)]、6.34 [95%CI(3.59,11.19)];SROC(AUC)為 0.778 93,Q*指數 0.726 6。從我們的結果看,GerdQ 診斷 GERD 的合并 Sen 及 Spe 均較高,SROC(AUC)約 0.79,表明 GerdQ 量表診斷 GERD 具有較高的診斷價值,結果與 Numans[41]報道的一項關于食管 24 小時酸測定診斷 GERD 的 Meta 分析結果(Sen 78%、Spe 54%)相近,且 GerdQ 的特異性更高。本 Meta 分析共納入 7 978 例病例,確診的 GERD 共 4 848 例,樣本量較大,因此結論具有較強代表性,但由于合并效應量具有較高異質性,上述結論仍需更多大樣本試驗來驗證。
此外,本研究所有納入研究在病例的選擇、待評價試驗、金標準及病例流程和進展情況部分均存在一定的偏倚風險,表明研究質量較低。納入合并的研究具有較高異質性,但 Spearman 檢驗結果提示 P>0.05 表明異質性為非閾值效應所致。從亞組分析結果得知,當臨界值為 7 分時,Sen、Spe、DOR 最高,SROC(ACU)最大,提示當臨界值為 7 分時,GerdQ 診斷 GERD 的準確性最高,因此 GerdQ 評分總分 7 分為最佳臨界值,總分為 9 分時次之。國內的研究結果與國外的研究結果相比,表明 GerdQ 量表用于診斷中國人群胃食管反流性疾病的準確性更高,表明 GerdQ 量表可能更適合中國人群使用。
本研究其它局限性:① 盡管本研究進行了廣泛檢索,但納入的研究數量較少,而且以中文文獻居多,可能存在發表偏倚;② 大部分納入研究受試對象使用多個的金標準,且病例選擇、待評價試驗、病例流程及進展情況描寫不清楚,表明納入研究質量較低;③ 合并的Sen、Spe、DOR、+LR及?LR的異質性均較高;④ 本研究未檢索到未發表的研究。因此,本研究結論仍需進一步研究結果驗證。
綜上所述,GerdQ 量表診斷 GERD 的準確性較高,可作為診斷胃食管反流性疾病的輔助工具,方法簡單易行,既可減少患者的經濟負擔,使 GERD 患者避免了做胃鏡、食管 24 小時 PH 監測的痛苦,又為消化內科臨床醫生提供了方便有效的診療手段,值得臨床推廣使用。
胃食管反流性疾病(gastro-oesophageal reflux disease,GERD)是指胃內容物反流至食管導致食管黏膜破裂、糜爛而引起不適癥狀和(或)并發癥的一種疾病[1]。目前 GERD 的發病率呈顯著上升趨勢,嚴重影響了患者的生活質量[2, 3]。臨床上主要推薦使用質子泵抑制劑(proton pump inhibitor,PPI)試驗、內鏡或食管 24 小時酸監測來診斷 GERD。然而 PPI 試驗的準確性中等;內鏡僅能發現食管粘膜受侵蝕的病例,特異性不高;食管 24 小時酸監測是有創方法,因此使用均具有局限性。為此,國內外學者致力于研究以癥狀為主要診斷依據的問卷,以期找到簡單易行的診斷方法。
Dent 等[4]研制胃食管反流性疾病問卷(GerdQ)已廣泛應用于 GERD 的診斷,盡管該量表的可靠性及有效性得到了臨床驗證,但診斷準確性結論不盡相同。有報道稱 GerdQ 評分為 8 時,與胃食管反流性疾病的相關性為 92%,可作為診斷 GERD 的主要工具。也有學者認為其診斷 GERD 的敏感性(57.7%)和特異性(48.9%)較低,診斷價值不高[5, 6]。鑒于目前相關研究樣本量小,研究人員、時間及地點等不同,結論缺乏說服力。且國內外尚未有 Meta 分析說明 GerdQ 量表診斷 GERD 的價值。為此,本研究將對 GerdQ 診斷 GERD 的研究進行 Meta 分析,以期為今后開展 GerdQ 診斷 GERD 提供決策依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
國內外公開發表的關于 GerdQ 診斷胃食管反流性疾病的診斷性研究,語種僅限中、英文,無研究時間、地點限制。
1.1.2 研究對象
胃食管反流性疾病疑似患者,無年齡、性別、民族、國籍限制。
1.1.3 診斷方法
待評價指標為 GerdQ 量表,“金標準”為電子胃鏡、食管 24 小時酸測定、PPI 試驗及 RDQ 量表中的一種或多種診斷措施證實。
1.1.4 結局指標
GerdQ 量表診斷胃食管反流性疾病的敏感度(Sen)、特異度(Spe)、陽性似然比(+LR)、陰性似然比(?LR)、診斷比值比(DOR)、受試者工作特征(SROC)曲線下面積(AUC)及 Q*指數。
1.1.5 排除標準
① 重復發表的研究;② 文獻綜述、病例報告分析、調查分析及論文摘要;③ 碩士博士學位論文;④ 數據有誤,不能夠獲取完整四格表數據,而不能與作者取得聯系確認的研究;⑤ 無明確閾值的研究。
1.2 文獻檢索策略
計算機檢索 PubMed、Wed of Science、EBMR、CNKI、CBM、VIP 和 WanFang Data,搜集關于 GerdQ 量表診斷胃食管反流性疾病的診斷性研究,檢索時限從建庫至 2018 年 1 月 1 日。同時追溯納入文獻的參考文獻,以補充獲取相關文獻。并手工檢索相關雜志查找相關文獻。檢索采用主題詞和自由詞相結合的方式進行檢索。中文檢索詞包括:胃食管反流性疾病、反流性食管炎、胃食管返流病、酸反流性疾病、GerdQ 量表、胃食管反流性疾病問卷、癥狀問卷、反流性疾病問卷;英文檢索詞包括:GERD、GerdQ、gastroesophageal reflux disease、gastroesophageal reflux disease questionnaire。以 CNKI 為例,其具體檢索策略見框 1。

1.3 文獻篩選、資料提取和偏倚風險評價
由 2 位評價員獨立篩選文獻、提取資料并交叉核對,如遇分歧,則通過討論解決,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:第一作者、研究時間、研究地點、研究對象性別、研究對象年齡、樣本量、GerdQ 量表評分最佳臨界值、診斷標準、真陽性(TP)、真陰性(TN)、假陰性(FN)和假陽性(FP)。納入研究偏倚風險評價采用 QUADAS-2 標準[7]進行。
1.4 統計分析
采用 Meta-Disc 1.4 軟件[8]進行 Meta 分析。由閾值效應引起的異質性采用 Spearman 相關分析檢驗,如果 P<0.05,提示異質性為閾值效應引起致;若 P>0.05,則進一步分析有無其他原因所引起的異質性。對 Sen、Spe 采用卡方檢驗,?LR、+LR 及 DOR 采用 Cochrane-Q 檢驗。若研究間存在異質性則采用隨機效應模型,反之則使用固定模型進行統計學分析。Meta 分析的檢驗水準為 α=0.05。采用 Stata 12.0 軟件繪制漏斗圖并評估試驗研究發表的偏倚性[9]。
1.5 診斷效能評價指標
評價合并的 Sen、Spe、+LR、?LR、DOR、SROC(AUC)及 Q*指數,AUC 越接近 1,Q*指數越大,表示 GerdQ 對胃食管反流性疾病的診斷價值越高;反之則越小。
2 結果
2.1 文獻檢索流程及結果
初檢出相關文獻 3 012 篇,經逐層篩選后,最終納入 20 個研究[10-29]。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入研究的基本特征
共納入 7 978 例病例,確診的 GERD 患者共 4 848 例,納入研究的基本特征見表 1。

2.3 納入研究的偏倚風險評價結果
納入研究的偏倚風險評價結果見表 2。

2.4 Meta 分析結果
2.4.1 異質性檢驗
Spearman 相關系數為?0.011 7,P=0.624,ROC 平面圖不呈“肩臂狀”分布,因此研究間不存在閾值效應,但經檢驗后發現各研究 Sen、Spe、+LR、?LR 和 DOR 均具有高異質性(表 3),故采用隨機效應模式進行 Meta 分析。

2.4.2 合并效應量
Sen、Spe、+LR、?LR、DOR 分別為 0.79[95%CI(0.78,0.81)]、0.66[95% CI(0.65,0.68)]、2.28[95%CI(1.77,2.94)]、0.37[95%CI(0.27,0.52)]、6.34[95%CI(3.59,11.19)];SROC(AUC)=0.789 3,Q*指數 0.726 6(圖 2~7)。






2.4.3 亞組分析
對納入研究進行亞組分析,結果提示臨界值為 7 分時,Sen、Spe、DOR 最高,SROC(AUC)最大,表明當臨界值為 7 分時,GerdQ 診斷 GERD 的準確性最高,GerdQ 評分為 9 分時次之。國內的研究結果與國外的研究結果相比,表明 GerdQ 量表用于診斷中國人胃食管反流性疾病人的準確性更高。使用內鏡、食管 24 小時酸測定及 PPI 試驗三者之一陽性者為金標準的研究表明 GerdQ 診斷 GERD 的價值最高(表 4)。

2.4.4 發表偏倚分析
Egger’s 檢驗結果顯示 t=?0.13,P=0.897,Begg’s 檢驗結果顯示,Kendall 評分(P?Q)=28,z=0.88(continuity corrected),Pr>|z|=0.381(continuity corrected),提示差異無統計學意義。納入研究發生發表偏倚可能性較小(圖 8)。

3 討論
胃食管反流性疾病是由胃內容物反流至食管導致不適癥狀和(或)并發癥的一種疾病。近年來本病在亞洲的發病率呈上升趨勢,并使患者的生活質量下降,加重患者家庭及社會的經濟負擔[30, 31]。目前,臨床上 GERD 的主要診斷方法有胃鏡、食管 24 小時酸監測、PPI 試驗、食管測壓等,然而尚無統一明確的金標準。盡管胃鏡為診斷食管粘膜損傷的金標準,但由于 50%~70% 的 GERD 患者并無食管粘膜腐蝕損傷,且在有反流癥狀的 GERD 患者中,1/2~2/3 有非侵蝕性疾病表現及內窺鏡檢查顯示正常,更有研究稱胃鏡檢查的敏感性約為 30%~50%,因此有學者提出胃鏡并非是診斷 GERD 的首選工具[32-34]。pH 監測為侵入性檢查,且在偏遠地區尚未普及,使用具有局限性。PPI 試驗的敏感性和特異性均一般,不適宜作為診斷 GERD 的試驗[35]。故國內外許多學者致力于研究以癥狀為主要診斷依據的問卷,以期找到簡單易行的診斷方法。GerdQ 量表自問世以來,已廣泛使用于 GERD 的臨床診斷,其診斷及使用價值已得到了驗證[36, 37]。GerdQ 的診斷價值與食管 24 小時酸測定的診斷價值相近,可作為 GERD 初級篩查的工具[38, 39]。GerdQ 評分簡單易行,可以降低患者的醫療費用,使 GERD 患者受益更多,為醫生提供一個簡單的有效的診斷方法[40]。近年來,盡管國內外越來越多學者對 GerdQ 量表診斷 GERD 的價值進行研究,但臨界值不一致,結論不盡相同。目前國內外尚無學者對該量表診斷 GERD 的診斷價值進行 Meta 分析,故本研究將對 GerdQ 診斷 GERD 的研究進行 Meta 分析,合并各個研究效應量,增大樣本量,使檢驗效能得到提高,為今后開展 GerdQ 診斷 GERD 提供有服力的循證證據。
本研究最終納入了 20 篇文獻,Meta 分析結果顯示問卷診斷 GERD 的合并 Sen、Spe、+LP、?LP 及 DOR 分別為:0.79[95%CI(0.78,0.81)]、0.66[95%CI(0.65,0.68)]、2.28[95%CI(1.77,2.94)]、0.37[95% CI(0.27,0.52)]、6.34 [95%CI(3.59,11.19)];SROC(AUC)為 0.778 93,Q*指數 0.726 6。從我們的結果看,GerdQ 診斷 GERD 的合并 Sen 及 Spe 均較高,SROC(AUC)約 0.79,表明 GerdQ 量表診斷 GERD 具有較高的診斷價值,結果與 Numans[41]報道的一項關于食管 24 小時酸測定診斷 GERD 的 Meta 分析結果(Sen 78%、Spe 54%)相近,且 GerdQ 的特異性更高。本 Meta 分析共納入 7 978 例病例,確診的 GERD 共 4 848 例,樣本量較大,因此結論具有較強代表性,但由于合并效應量具有較高異質性,上述結論仍需更多大樣本試驗來驗證。
此外,本研究所有納入研究在病例的選擇、待評價試驗、金標準及病例流程和進展情況部分均存在一定的偏倚風險,表明研究質量較低。納入合并的研究具有較高異質性,但 Spearman 檢驗結果提示 P>0.05 表明異質性為非閾值效應所致。從亞組分析結果得知,當臨界值為 7 分時,Sen、Spe、DOR 最高,SROC(ACU)最大,提示當臨界值為 7 分時,GerdQ 診斷 GERD 的準確性最高,因此 GerdQ 評分總分 7 分為最佳臨界值,總分為 9 分時次之。國內的研究結果與國外的研究結果相比,表明 GerdQ 量表用于診斷中國人群胃食管反流性疾病的準確性更高,表明 GerdQ 量表可能更適合中國人群使用。
本研究其它局限性:① 盡管本研究進行了廣泛檢索,但納入的研究數量較少,而且以中文文獻居多,可能存在發表偏倚;② 大部分納入研究受試對象使用多個的金標準,且病例選擇、待評價試驗、病例流程及進展情況描寫不清楚,表明納入研究質量較低;③ 合并的Sen、Spe、DOR、+LR及?LR的異質性均較高;④ 本研究未檢索到未發表的研究。因此,本研究結論仍需進一步研究結果驗證。
綜上所述,GerdQ 量表診斷 GERD 的準確性較高,可作為診斷胃食管反流性疾病的輔助工具,方法簡單易行,既可減少患者的經濟負擔,使 GERD 患者避免了做胃鏡、食管 24 小時 PH 監測的痛苦,又為消化內科臨床醫生提供了方便有效的診療手段,值得臨床推廣使用。