引用本文: 許永生, 劉海峰, 王寅中, 高玉嶺, 田水水, 田金徽, 楊克虎, 雷軍強. 磁共振成像診斷髖臼唇撕裂價值的 Meta 分析. 中國循證醫學雜志, 2017, 17(3): 291-297. doi: 10.7507/1672-2531.201611079 復制
髖臼唇為附著于髖臼邊緣的纖維軟骨環,具有保持關節腔內負壓、保護關節軟骨、增加對股骨頭的包容性及增加髖關節穩定性等重要生理作用[1,2]。然而,髖臼唇撕裂(acetabular labral tear, ALT)破壞其生理作用,導致患者出現髖關節疼痛、活動受限等臨床癥狀[3]。研究表明,臨床癥狀為不明原因髖關節疼痛的患者中有 22%~55% 是由 ALT 引起,如不及時診斷治療,會導致 ALT 范圍增大并可引起髖關節骨關節炎的發生,嚴重者會引起軟骨纖維化、斷裂、分離[4,5]。
目前對 ALT 的診斷方法主要有磁共振成像(magnetic resonance imaging, MRI)、磁共振髖關節造影(magnetic resonance arthrography, MRA)和髖關節鏡。髖關節鏡為有創性檢查,其存在臨床操作不規范、檢查費用高等缺點,限制其臨床應用[6,7]。而 MRA 較 MRI 更好的顯出裂隙的形態、位置和深度,因此 MRA 對診斷 ALT 有更高的價值[8]。目前已有多個原始研究探索 MR 對診斷 ALT 的價值,但多為單個中心試驗。為綜合評價 MR 診斷 ALT 的價值,本研究采用 Meta 分析的方法評價 MR 診斷 ALT 的價值,以期為臨床診斷和科學決策提供依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型 ① 研究目的為評價 MRI 和(或)MRA 對診斷 ALT 的準確性。② 研究設計為前瞻性或回顧性研究。③ 可以直接或間接地獲得四格表數據:真陽性(TP)、假陽性(FP)、真陰性(TN)、假陰性(FN)。
1.1.2 研究對象 懷疑 ALT 的患者,接受髖關節鏡或開放手術前均進行 MRI 和(或)MRA 檢查。患者年齡、種族、國別不限。
1.1.3 金標準 髖關節鏡和(或)手術證實 ALT。
1.1.4 結局指標 合并的敏感度(sensitivity, Sen)、特異度(specificity, Spe)、陽性似然比(positive likelihood ratio, +LR)、陰性似然比(negative likelihood ratio, –LR)、診斷比值比(diagnosis odds ratios, DOR)、匯總受試者工作特征曲線(SROC 曲線)并計算曲線下面積(AUC)。
1.1.5 排除標準 ① 重復發表的文獻;② 綜述、評述、病例報告及文摘類研究;③ 動物試驗;④ 文獻不能直接或間接提供四格表數據,不能分別計算真陽性(TP)、假陽性(FP)、真陰性(TN)、假陰性(FN)。
1.2 文獻檢索
計算機檢索 CBM、CNKI、VIP、WanFang Data、PubMed、EMbase、The Cochrane Library、Web of Science 等數據庫,搜集磁共振成像診斷髖臼唇撕裂的診斷性試驗,檢索時限為 1990 年 1 月至 2016 年 10 月。英文檢索詞包括 magnetic resonance imaging、 MR、 acetabula、 cotyloid cavity、 acetabulum。中文檢索詞包括髖臼唇、髖臼盂唇、磁共振成像、MR。以 PubMed 為例,其具體檢索策略見框 1。
1.3 文獻篩選和資料提取
由 2 位研究者獨立進行文獻篩選和資料提取,意見不同時通過討論解決。采用自制的 Excel 資料提取表提取資料,主要包括第一作者、發表時間、國家、研究類型、樣本量、MR 檢查方法、場強、年齡、性別、行 MRI/MRA 檢查到行關節鏡/手術的時間,四格表數據真陽性(TP)、假陽性(FP)、假陰性(FN)、真陰性(TN),以及進行偏倚風險評價的指標。
1.4 納入研究的偏倚風險評價
由 2 位研究者采用 QUADAS-2 工具獨立評價納入研究的偏倚風險[9]。對每個條目做出“是”(低度偏倚或適用性好)、“否”(高度偏倚或適用性差)或“不清楚”(缺乏相關信息或偏倚情況不確定)的判斷。
1.5 統計分析
各研究結果間的異質性采用χ2 檢驗進行分析(檢驗水準為α=0.1),并結合I2 定量判斷異質性的大小。在排除閾值效應引起的異質性后按照可能產生異質性的因素進行亞組或者 Meta 回歸分析,同時采用敏感性分析判斷研究結果的穩定性。采用 Stata 12.0 軟件利用隨機效應模型計算其合并的 Sen、Spe、+LR、–LR、DOR,并繪制 SROC 曲線,計算 AUC。根據 AUC 值的大小評價診斷性試驗的價值,AUC 為 0.7~0.9 時表示診斷準確性中等,AUC>0.9 時表示診斷準確性較高。
2 結果
2.1 文獻檢索結果
初檢共獲得相關文獻 1 223 篇,經逐層篩選后,最終納入 21 篇文獻[10-30]。文獻篩選流程及結果見圖 1。

2.2 納入研究的基本特征
納入研究的基本特征見表 1。

2.3 納入研究的偏倚風險評價
納入研究的偏倚風險評價結果見圖 2。

2.4 Meta 分析結果
2.4.1 異質性檢驗 MRI 診斷 ALT 閾值效應檢驗結果為:Spearman 相關系數=0.594,P=0.092,研究間 Sen 和 Spe 的異質性檢驗結果顯示:P=0.00,I2=93%;P=0.01,I2=58%。MRA 診斷 ALT 閾值效應檢驗結果顯示:Spearman 相關系數為–0.308,P=0.245,研究間 Sen 和 Spe 的異質性檢驗結果顯示:P=0.00,I2=66%;P=0.00,I2=57%。納入的 MRI 和 MRA 研究結果間存在異質性,且并非閾值效應引起,故采用隨機模型進行合并分析。
2.4.2 MRI 及 MRA 診斷 ALT 的結果 見表 2 及圖 3 和圖 4。




2.5 敏感性分析和發表偏倚分析
剔除質量較低的研究和敏感度/特異度較高或較低的研究進行敏感性分析,結果顯示總體合并敏感度、特異度變化不大,改變效應模型,結果也無明顯改變,說明 Meta 分析結果的穩定性較好,可信度較高。納入的 MRI 和 MRA 診斷 ALT 的研究,分別以有效樣本量(ESS)為橫坐標,診斷比值比(DOR)為縱坐標繪制漏斗圖,結果顯示斜率系數分別為P=0.846,P=0.608,提示兩種檢查方法不存在發表偏倚,結果見圖 5 和圖 6。

3 討論
影像學檢查作為一種無創性診斷疾病的方法,在 ALT 的診斷中應用較廣[31]。雖然 CT 檢查能明確髖關節發育不良、骨關節炎、髖臼的囊性變,但其對軟組織病變不敏感,診斷 ALT 的準確性非常低[32],限制了其應用。MR 檢查有較好的軟組織分辨率,能多方位和多序列成像,可以直接顯示髖臼唇的形態,因此在 ALT 的診斷中有較大價值[33]。本研究采用 Meta 分析方法綜合評價磁共振成像對診斷 ALT 的價值,以期為影像和臨床醫師的決策提供科學依據[34]。
本研究納入文獻的診斷試驗的實施及金標準合理性的報告質量較好,提示納入的研究具有較高的質量,引起選擇偏倚的可能性較小[35]。但其在病例選擇和病例流程及進展情況方面的報告質量參差不齊,其原因可能與納入的研究中含有病例-對照研究、盲法的實施和磁共振與金標準檢查間隔時間報告不清有關。研究的報告的質量較差,發生實施和測量偏倚的可能性較大[36],建議在今后的研究采用診斷性試驗報告標準(STARD)[37],以提高診斷性試驗的報告質量。
本研究納入的 25 個以髖關節鏡和手術為金標準的磁共振診斷 ALT 的研究,MRI 和 MRA 診斷 ALT 的單個研究的 Sen 和 Spe 分別為 22%~100%、33%~100% 和 63%~100%、13%~100%,所以從單個研究來評價磁共振成像的診斷效能較為困難。Smith 等[38]采用 Meta 分析對 MRI 和 MRA 診斷 ALT 的準確性進行評價,其結果發現 MRI 診斷的合并敏感度和特異度分別為 66% 和 79%,而 MRA 診斷的合并敏感度和特異度分別為 87% 和 64%。本研究結果顯示,MRI 和 MRA 診斷的合并敏感度和特異度分別為 66%、72% 及 86%、71%,MRI 診斷的特異度低于 Smith 等[38]的報道結果,而 MRA 診斷的特異度較之更高,推測造成結果差異的原因可能與收集文獻的數據庫范圍、語言和年限等有關,綜合考慮 MRA 有更高的診斷價值。
本 Meta 分析納入研究間的研究人群、樣本量、檢查設備、圖像分析人員信息、診斷標準等存在一定的差別,這導致本研究具有一定的異質性。其異質性來源可能原因如下:① 各研究的樣本量差別較大,為 8~122 例,研究人群的年齡多在 30~50 歲。② 各研究所應用的 MR 磁場強度從 0.5T 到 3.0T 不等,多使用 1.5T 進行檢查,而使用 3.0T 設備進行檢查的僅有 3 項研究,提示還需用 3.0T 設備進行大樣本研究才能得到符合當今 MRI 真實檢查情況的數據。③ 部分研究對從進行 MRI 檢查后到行髖關節鏡手術的時間介紹不清,甚至有研究在行 MRI 檢查后半年以上才行髖關節鏡檢查,時間間隔過長可能造成患者在此期間 ALT 病變已發生變化。部分研究圖像分析人員的人數、工作年限和職稱不清,這些容易對研究結果的準確性產生懷疑。④ 部分研究對關節鏡操作的具體步驟描述過于簡單而不能按照作者的描述進行重復操作。⑤ 個別研究對圖像分析人員和關節鏡手術人員是否知曉對方檢查結果的介紹不清楚或未介紹,降低了研究結果的可信程度[39,40]。
為了提高研究結果的穩定性和可靠性,在實施本 Meta 分析的過程中,2 名研究者獨立地提取數據和評價納入研究的偏倚風險以減少偏倚;在文獻篩選時制訂了嚴格的納入標準和排除標準;考慮到研究間的差異,采用隨機效應模型,并進行敏感性、亞組和發表偏倚分析,使得最終的結果更為可靠。
本研究的局限性:① 由于納入研究的患者數目不同、磁場強度不一、診斷方法的差異,會造成異質性較高;② 由于納入研究未提供撕裂程度的數據,且應用 0.5T、1.0T、3.0T 磁共振成像儀的研究分別只有 1、2、3 個,因此,本研究未進行亞組分析探究其異質性來源[41];③ 由于各研究的金標準存在一定差異,診斷實驗與金標準檢查之間時長不一致,可能會造成部分判讀偏倚,這也可能會影響本研究的結果。
總之,本研究顯示磁共振成像在髖臼唇撕裂的診斷具有明確的診斷價值,尤其是使用磁共振髖關節造影的病例具備更高的診斷效能。受納入研究的數量和質量的限制,上述結論尚需要更多研究予以證實。
髖臼唇為附著于髖臼邊緣的纖維軟骨環,具有保持關節腔內負壓、保護關節軟骨、增加對股骨頭的包容性及增加髖關節穩定性等重要生理作用[1,2]。然而,髖臼唇撕裂(acetabular labral tear, ALT)破壞其生理作用,導致患者出現髖關節疼痛、活動受限等臨床癥狀[3]。研究表明,臨床癥狀為不明原因髖關節疼痛的患者中有 22%~55% 是由 ALT 引起,如不及時診斷治療,會導致 ALT 范圍增大并可引起髖關節骨關節炎的發生,嚴重者會引起軟骨纖維化、斷裂、分離[4,5]。
目前對 ALT 的診斷方法主要有磁共振成像(magnetic resonance imaging, MRI)、磁共振髖關節造影(magnetic resonance arthrography, MRA)和髖關節鏡。髖關節鏡為有創性檢查,其存在臨床操作不規范、檢查費用高等缺點,限制其臨床應用[6,7]。而 MRA 較 MRI 更好的顯出裂隙的形態、位置和深度,因此 MRA 對診斷 ALT 有更高的價值[8]。目前已有多個原始研究探索 MR 對診斷 ALT 的價值,但多為單個中心試驗。為綜合評價 MR 診斷 ALT 的價值,本研究采用 Meta 分析的方法評價 MR 診斷 ALT 的價值,以期為臨床診斷和科學決策提供依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型 ① 研究目的為評價 MRI 和(或)MRA 對診斷 ALT 的準確性。② 研究設計為前瞻性或回顧性研究。③ 可以直接或間接地獲得四格表數據:真陽性(TP)、假陽性(FP)、真陰性(TN)、假陰性(FN)。
1.1.2 研究對象 懷疑 ALT 的患者,接受髖關節鏡或開放手術前均進行 MRI 和(或)MRA 檢查。患者年齡、種族、國別不限。
1.1.3 金標準 髖關節鏡和(或)手術證實 ALT。
1.1.4 結局指標 合并的敏感度(sensitivity, Sen)、特異度(specificity, Spe)、陽性似然比(positive likelihood ratio, +LR)、陰性似然比(negative likelihood ratio, –LR)、診斷比值比(diagnosis odds ratios, DOR)、匯總受試者工作特征曲線(SROC 曲線)并計算曲線下面積(AUC)。
1.1.5 排除標準 ① 重復發表的文獻;② 綜述、評述、病例報告及文摘類研究;③ 動物試驗;④ 文獻不能直接或間接提供四格表數據,不能分別計算真陽性(TP)、假陽性(FP)、真陰性(TN)、假陰性(FN)。
1.2 文獻檢索
計算機檢索 CBM、CNKI、VIP、WanFang Data、PubMed、EMbase、The Cochrane Library、Web of Science 等數據庫,搜集磁共振成像診斷髖臼唇撕裂的診斷性試驗,檢索時限為 1990 年 1 月至 2016 年 10 月。英文檢索詞包括 magnetic resonance imaging、 MR、 acetabula、 cotyloid cavity、 acetabulum。中文檢索詞包括髖臼唇、髖臼盂唇、磁共振成像、MR。以 PubMed 為例,其具體檢索策略見框 1。
1.3 文獻篩選和資料提取
由 2 位研究者獨立進行文獻篩選和資料提取,意見不同時通過討論解決。采用自制的 Excel 資料提取表提取資料,主要包括第一作者、發表時間、國家、研究類型、樣本量、MR 檢查方法、場強、年齡、性別、行 MRI/MRA 檢查到行關節鏡/手術的時間,四格表數據真陽性(TP)、假陽性(FP)、假陰性(FN)、真陰性(TN),以及進行偏倚風險評價的指標。
1.4 納入研究的偏倚風險評價
由 2 位研究者采用 QUADAS-2 工具獨立評價納入研究的偏倚風險[9]。對每個條目做出“是”(低度偏倚或適用性好)、“否”(高度偏倚或適用性差)或“不清楚”(缺乏相關信息或偏倚情況不確定)的判斷。
1.5 統計分析
各研究結果間的異質性采用χ2 檢驗進行分析(檢驗水準為α=0.1),并結合I2 定量判斷異質性的大小。在排除閾值效應引起的異質性后按照可能產生異質性的因素進行亞組或者 Meta 回歸分析,同時采用敏感性分析判斷研究結果的穩定性。采用 Stata 12.0 軟件利用隨機效應模型計算其合并的 Sen、Spe、+LR、–LR、DOR,并繪制 SROC 曲線,計算 AUC。根據 AUC 值的大小評價診斷性試驗的價值,AUC 為 0.7~0.9 時表示診斷準確性中等,AUC>0.9 時表示診斷準確性較高。
2 結果
2.1 文獻檢索結果
初檢共獲得相關文獻 1 223 篇,經逐層篩選后,最終納入 21 篇文獻[10-30]。文獻篩選流程及結果見圖 1。

2.2 納入研究的基本特征
納入研究的基本特征見表 1。

2.3 納入研究的偏倚風險評價
納入研究的偏倚風險評價結果見圖 2。

2.4 Meta 分析結果
2.4.1 異質性檢驗 MRI 診斷 ALT 閾值效應檢驗結果為:Spearman 相關系數=0.594,P=0.092,研究間 Sen 和 Spe 的異質性檢驗結果顯示:P=0.00,I2=93%;P=0.01,I2=58%。MRA 診斷 ALT 閾值效應檢驗結果顯示:Spearman 相關系數為–0.308,P=0.245,研究間 Sen 和 Spe 的異質性檢驗結果顯示:P=0.00,I2=66%;P=0.00,I2=57%。納入的 MRI 和 MRA 研究結果間存在異質性,且并非閾值效應引起,故采用隨機模型進行合并分析。
2.4.2 MRI 及 MRA 診斷 ALT 的結果 見表 2 及圖 3 和圖 4。




2.5 敏感性分析和發表偏倚分析
剔除質量較低的研究和敏感度/特異度較高或較低的研究進行敏感性分析,結果顯示總體合并敏感度、特異度變化不大,改變效應模型,結果也無明顯改變,說明 Meta 分析結果的穩定性較好,可信度較高。納入的 MRI 和 MRA 診斷 ALT 的研究,分別以有效樣本量(ESS)為橫坐標,診斷比值比(DOR)為縱坐標繪制漏斗圖,結果顯示斜率系數分別為P=0.846,P=0.608,提示兩種檢查方法不存在發表偏倚,結果見圖 5 和圖 6。

3 討論
影像學檢查作為一種無創性診斷疾病的方法,在 ALT 的診斷中應用較廣[31]。雖然 CT 檢查能明確髖關節發育不良、骨關節炎、髖臼的囊性變,但其對軟組織病變不敏感,診斷 ALT 的準確性非常低[32],限制了其應用。MR 檢查有較好的軟組織分辨率,能多方位和多序列成像,可以直接顯示髖臼唇的形態,因此在 ALT 的診斷中有較大價值[33]。本研究采用 Meta 分析方法綜合評價磁共振成像對診斷 ALT 的價值,以期為影像和臨床醫師的決策提供科學依據[34]。
本研究納入文獻的診斷試驗的實施及金標準合理性的報告質量較好,提示納入的研究具有較高的質量,引起選擇偏倚的可能性較小[35]。但其在病例選擇和病例流程及進展情況方面的報告質量參差不齊,其原因可能與納入的研究中含有病例-對照研究、盲法的實施和磁共振與金標準檢查間隔時間報告不清有關。研究的報告的質量較差,發生實施和測量偏倚的可能性較大[36],建議在今后的研究采用診斷性試驗報告標準(STARD)[37],以提高診斷性試驗的報告質量。
本研究納入的 25 個以髖關節鏡和手術為金標準的磁共振診斷 ALT 的研究,MRI 和 MRA 診斷 ALT 的單個研究的 Sen 和 Spe 分別為 22%~100%、33%~100% 和 63%~100%、13%~100%,所以從單個研究來評價磁共振成像的診斷效能較為困難。Smith 等[38]采用 Meta 分析對 MRI 和 MRA 診斷 ALT 的準確性進行評價,其結果發現 MRI 診斷的合并敏感度和特異度分別為 66% 和 79%,而 MRA 診斷的合并敏感度和特異度分別為 87% 和 64%。本研究結果顯示,MRI 和 MRA 診斷的合并敏感度和特異度分別為 66%、72% 及 86%、71%,MRI 診斷的特異度低于 Smith 等[38]的報道結果,而 MRA 診斷的特異度較之更高,推測造成結果差異的原因可能與收集文獻的數據庫范圍、語言和年限等有關,綜合考慮 MRA 有更高的診斷價值。
本 Meta 分析納入研究間的研究人群、樣本量、檢查設備、圖像分析人員信息、診斷標準等存在一定的差別,這導致本研究具有一定的異質性。其異質性來源可能原因如下:① 各研究的樣本量差別較大,為 8~122 例,研究人群的年齡多在 30~50 歲。② 各研究所應用的 MR 磁場強度從 0.5T 到 3.0T 不等,多使用 1.5T 進行檢查,而使用 3.0T 設備進行檢查的僅有 3 項研究,提示還需用 3.0T 設備進行大樣本研究才能得到符合當今 MRI 真實檢查情況的數據。③ 部分研究對從進行 MRI 檢查后到行髖關節鏡手術的時間介紹不清,甚至有研究在行 MRI 檢查后半年以上才行髖關節鏡檢查,時間間隔過長可能造成患者在此期間 ALT 病變已發生變化。部分研究圖像分析人員的人數、工作年限和職稱不清,這些容易對研究結果的準確性產生懷疑。④ 部分研究對關節鏡操作的具體步驟描述過于簡單而不能按照作者的描述進行重復操作。⑤ 個別研究對圖像分析人員和關節鏡手術人員是否知曉對方檢查結果的介紹不清楚或未介紹,降低了研究結果的可信程度[39,40]。
為了提高研究結果的穩定性和可靠性,在實施本 Meta 分析的過程中,2 名研究者獨立地提取數據和評價納入研究的偏倚風險以減少偏倚;在文獻篩選時制訂了嚴格的納入標準和排除標準;考慮到研究間的差異,采用隨機效應模型,并進行敏感性、亞組和發表偏倚分析,使得最終的結果更為可靠。
本研究的局限性:① 由于納入研究的患者數目不同、磁場強度不一、診斷方法的差異,會造成異質性較高;② 由于納入研究未提供撕裂程度的數據,且應用 0.5T、1.0T、3.0T 磁共振成像儀的研究分別只有 1、2、3 個,因此,本研究未進行亞組分析探究其異質性來源[41];③ 由于各研究的金標準存在一定差異,診斷實驗與金標準檢查之間時長不一致,可能會造成部分判讀偏倚,這也可能會影響本研究的結果。
總之,本研究顯示磁共振成像在髖臼唇撕裂的診斷具有明確的診斷價值,尤其是使用磁共振髖關節造影的病例具備更高的診斷效能。受納入研究的數量和質量的限制,上述結論尚需要更多研究予以證實。