引用本文: 王聰, 師丹丹, 梁景宏, 朱紹成. 磁共振簡化序列對肝細胞肝癌篩查價值的Meta分析. 中國循證醫學雜志, 2022, 22(6): 641-648. doi: 10.7507/1672-2531.202201035 復制
肝細胞肝癌(hepatocellular carcinoma,HCC)是最常見的原發性肝臟惡性腫瘤,約占所有病例的75%~90%[1],是癌癥相關死亡的第三大原因[2]。大多數HCC中晚期患者的預后不佳,總體5年生存率低于20%,及早發現并診斷的患者可積極采取根治性治療,預后會得到顯著改善[3],5年生存率可達到70%以上[4-5]。因此,一般建議HCC高風險人群進行定期篩查以盡早發現病變[6]。目前,多數國內外指南使用一年兩次的超聲檢查作為HCC的主要篩查方式[6-7]。然而超聲篩查早期肝癌的敏感度僅47%[8],超聲聯合甲胎蛋白篩查早期肝癌的敏感度約為63%[8-9]。由于超聲檢查方案存在敏感度較低、可視化差等局限性,有指南建議HCC高風險人群進行磁共振成像(magnetic resonance imaging,MRI)檢查作為替代篩查手段[6]。一個超聲和MRI的前瞻性診斷性研究表明,具有肝癌高危風險的人群中,使用肝膽特異性對比劑MRI篩查可提高HCC診斷準確性,并降低假陰性結果[10]。但MRI掃描序列較多,時間-經濟成本較高。近年有研究嘗試使用少量序列組成MRI簡化序列的方案(abbreviated magnetic resonance imaging,AMRI)用于HCC篩查,希望能夠兼具高性價比和成本-效益,但目前尚無相關的系統評價。本研究系統評價AMRI篩查HCC的診斷價值,以期為臨床實踐提供依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
診斷準確性試驗。
1.1.2 研究對象
HCC高風險人群(符合中國臨床腫瘤學會2022版《原發性肝癌診療指南》[11]或美國放射學院肝臟影像報告及數據系統[12]標準),且既往無其他腫瘤病史和手術史。
1.1.3 診斷標準
采用公認的影像和/或病理診斷作為金標準,影像診斷標準符合中國臨床腫瘤學會2022版《原發性肝癌診療指南》[11],病理診斷標準符合國際肝癌共識小組[13]標準及中國抗癌協會2015版《原發性肝癌規范化病理診斷指南》[14]。
1.1.4 結局指標
① 敏感度;② 特異度;③ 陽性似然比;④ 陰性似然比;⑤ 診斷比值比(diagnostic odd ratio,DOR);⑥ 擬合受試者工作特征(summary receiver operating characteristic,SROC)曲線下面積(area under curve,AUC)。
1.1.5 排除標準
① 不是以篩查或模擬篩查為目的的研究;② 無法提取四格表或原始數據的研究;③ 磁共振設備場強1.5T以下的研究;④ 重復發表的研究;⑤ 非中、英文研究。
1.2 文獻檢索策略
計算機檢索PubMed、EMbase、The Cochrane Library、Web of Science、CNKI、WanFang Data和VIP數據庫,搜集有關AMRI篩查HCC的研究,檢索時限均從建庫至2022年3月1日。檢索采用主題詞與自由詞相結合的方式進行,并根據各數據庫特點進行調整。同時檢索納入研究的參考文獻,以補充獲取相關資料。中文檢索詞包括:肝細胞肝癌、篩查、監視、磁共振簡化序列等;英文檢索詞包括:hepatocellular carcinoma、screen、surveillance、abbreviated magnetic resonance imaging等。以PubMed為例,其具體檢索策略見框1。

1.3 文獻篩選和資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。如有需要,通過郵件、電話聯系原始研究作者獲取未確定但對本研究非常重要的信息。資料提取內容包括:① 納入研究的基本信息:第一作者、發表年份、研究國家、研究類型、樣本量、患者平均年齡、性別、肝硬化占比、診斷金標準方法、設備場強等;② 不同AMRI選擇的掃描序列:無對比劑增強組(non-contrast MRI,NC MRI):不包含肝膽特異期在內的簡化序列;肝膽期組(contrast-enhanced hepatobiliary phase MRI,HBP MRI):包含肝膽特異期和/或其他在內的簡化序列。當有研究中采用多種不同AMRI方案,將各個方案數據單獨錄入并分析;若一種AMRI方案使用2位以上研究者的診斷結果,則取其平均值作為該方案的數據結果錄入,最終整理形成用于統計分析的四格表(真陽性、假陽性、假陰性和真陰性)資料。
1.4 納入研究的偏倚風險評價
由2名研究者獨立評價納入研究的偏倚風險,并交叉核對結果。偏倚風險評價采用Cochrane協作網推薦的診斷準確性研究質量評價工具(QUADAS-2)[15]。
1.5 統計分析
采用Stata 16.0軟件MIDAS模塊進行診斷性試驗Meta分析。納入研究結果間的異質性采用χ2檢驗進行分析(檢驗水準為α=0.1),同時結合I2定量判斷異質性大小[16]。若各研究結果間無統計學異質性,則采用固定效應模型進行Meta分析;若各研究結果間存在統計學異質性,則進一步分析異質性來源,在排除明顯臨床異質性的影響后,采用隨機效應模型進行Meta分析。計算的合并診斷效能指標包括:合并敏感度、合并特異度、合并陽性似然比、合并陰性似然比及合并DOR,所有合并效應量均提供其95%可信區間(confidence interval,CI)。使用診斷試驗Meta分析的雙變量混合效應模型[17-20],通過對真陽性率和假陽性率的logit變換,繪制森林圖及ROC,采用AUC比較各類簡化序列方案診斷效能的優劣,AUC越接近1.0,提示該類簡化序列方案的診斷效能越高。通過Deek’s不對稱回歸檢驗評估是否存在發表偏倚[21]。繪制Fagan圖,評價診斷試驗的臨床運用價值。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻1 696篇,經逐層篩選后,最終納入15個研究[22-36],包括2 823例患者。文獻篩選流程及結果見圖1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入研究的基本特征與偏倚風險評價結果


2.3 Meta分析結果
2.3.1 AMRI方案
有7個研究[22-23,25,32-34,36]采用2種及以上的AMRI方案,將各方案數據單獨錄入,最終錄入24組AMRI方案,包括15組NC MRI方案,9組HBP MRI方案。NC MRI中5組使用了T2+T1+DWI序列作為簡化方案,4組使用了T2+DWI序列作為簡化方案;HBP MRI中6組使用了T2+DWI+HBP序列作為簡化方案。
2.3.2 合并效應量
Meta分析結果顯示,AMRI的合并敏感度、合并特異度分別為0.85[95%CI(0.83,0.87)]、0.93[95%CI(0.90,0.94)]。各簡化方案合并效應量結果見表3。NC AMRI方案和HBP AMRI方案的合并敏感度、合并特異度相當,T2+DWI+HBP序列作為簡化序列方案顯示出相對最高的診斷準確性(圖2)。


2.3.3 發表偏倚檢驗
T2+DWI+HBP方案的Deek’s圖見圖3,結果顯示各研究點基本對稱,提示存在發表偏倚的可能性較小。

2.3.4 Fagan圖
T2+DWI+HBP的Fagan圖見圖4,其似然比點狀圖見圖5,提示T2+DWI+HBP作為確診試驗時診斷準確性可能相對較好。


3 討論
T1WI序列中,因病灶內部出現纖維化或液化壞死區域,常呈低或稍低信號[37]。T2WI序列中,肝癌病灶主要表現為相對于背景肝實質輕度至中度高信號,區別于囊腫或血管瘤的高亮信號,故信號強度不同可進行良惡性鑒別[37-38]。DWI序列中,肝癌病灶水分子擴散受限,表現為b=0和/或b=50 s/mm2的DWI上與肝實質相比輕度至中度高信號,b=500 s/mm2和/或b=800 s/mm2 處持續高信號[39]。釓塞酸二鈉作為肝膽特異性對比劑,經靜脈注射隨血流進入肝臟后可被肝細胞特異性攝取,在注射約20分鐘后的肝膽特異期產生良好的影像增強效果,而肝癌病灶內缺乏正常肝細胞,無法攝取對比劑呈現低信號[40],故有利于病灶的早期檢出。
本研究結果顯示,AMRI對HCC有良好的診斷效能,NC MRI 和HBP MRI在HCC的篩查中均顯示出可接受的診斷效能,提示無論是否使用對比劑,AMRI對肝癌篩查的敏感度都顯著高于以往報道的超聲敏感度(0.47)[8],且同時保持了較高的特異度。Kim等[10]比較了超聲和完整序列MRI成像篩查HCC時的診斷準確性,二者的敏感度分別為0.279和0.86,有新指南建議在超聲檢查不足以達到診斷標準的肝癌高風險人群中使用CT或MRI進行監測。但也有研究[41]表明,完整序列MRI用于高危人群篩查的成本-效益并不高。因此,近年有研究提出使用少量序列作為簡化方案,替代完整序列MRI進行篩查,以期在保證較高診斷準確性的同時降低篩查的時間和經濟成本。在本研究中,AMRI的診斷效能與先前使用完整序列MRI進行篩查時結果相似,敏感度分別為0.85和0.86,特異度分別為0.93和0.97[10]。Goossens等[42]研究表明,采用AMRI對肝癌中高危人群進行腫瘤的早期監測,是具有高敏感度和增量-成本效果比的診斷方式。Lima等[43]研究同樣表明,在患者依從性尚可的前提下,AMRI是可能取代超聲進行篩查且經濟有效的方案。基于先前的研究和本Meta分析結果,AMRI具有掃描序列較少,時間和經濟成本較低和較高的診斷效能,有望替代超聲在臨床上用于肝癌的篩查。
本研究進一步分析表明,包含肝膽特異性對比劑的HBP AMRI診斷效能較NC AMRI更高。在HBP AMRI中,采用T2+DWI+HBP序列篩查HCC時,具有相對最高的整體診斷準確性,或許可作為一種相對較理想的HCC篩查方案。肝膽特異期肝實質與肝癌病灶間的對比度增高,更有利于小病灶檢出[44],聯合T2和DWI圖像可對進行篩查的高風險人群提供病灶早期的圖像信息,幫助臨床評估并及時治療疾病,改善患者預后。在晚期肝硬化患者中,肝功能受損較重可能會限制對比劑的攝取,降低肝臟與病灶之間的對比度,若存在發育不良的結節也可能表現為肝膽期低信號,導致假陽性診斷的可能[45]。相比之下,NC AMRI無需注射對比劑,可避免其在體內長期蓄積的潛在風險及腎源性系統性纖維化的產生[46],并具有與HBP AMRI相當的診斷效能。但是T1序列對比度和噪聲比均較低,肝癌病灶的可視化程度不高;DWI序列較易出現偽影,影響肝頂及肝左葉病灶的檢出,且早期肝癌可能不會表現出相對于肝實質的擴散受限[47];HCC在T2序列可能與肝實質等信號,在晚期肝硬化患者中背景肝實質信號不均容易影響病灶的檢出[45]。故在臨床應用時需考慮到各序列的優點與不足,綜合選擇合適的簡化序列用于肝癌高風險人群的篩查。當篩查出的癌灶處于較早期階段時,采用經腹腔鏡肝切除術創傷小,術中出血量及術后并發癥均較少,有利于進一步改善患者預后[48]。
本研究的局限性:① 采用超聲和AMRI篩查直接對比的前瞻性研究較少,需要更多同步研究比較二者在真實篩查環境中的診斷效能以進行綜合分析;② AMRI多為回顧性研究納入的高風險人群,部分研究人群中肝硬化占比過高,存在對患者的選擇性偏倚;③ 評估AMRI診斷效能同時進行成本效益分析的文獻過少,間接比較可能存在統計學上的不足。
綜上所述,現有證據表明,各AMRI方案對HCC的篩查均具有可接受的敏感度和特異度,其中T2+DWI+HBP方案診斷效能最高。受納入研究數量和質量的限制,上述結論尚需更多高質量研究予以驗證。
肝細胞肝癌(hepatocellular carcinoma,HCC)是最常見的原發性肝臟惡性腫瘤,約占所有病例的75%~90%[1],是癌癥相關死亡的第三大原因[2]。大多數HCC中晚期患者的預后不佳,總體5年生存率低于20%,及早發現并診斷的患者可積極采取根治性治療,預后會得到顯著改善[3],5年生存率可達到70%以上[4-5]。因此,一般建議HCC高風險人群進行定期篩查以盡早發現病變[6]。目前,多數國內外指南使用一年兩次的超聲檢查作為HCC的主要篩查方式[6-7]。然而超聲篩查早期肝癌的敏感度僅47%[8],超聲聯合甲胎蛋白篩查早期肝癌的敏感度約為63%[8-9]。由于超聲檢查方案存在敏感度較低、可視化差等局限性,有指南建議HCC高風險人群進行磁共振成像(magnetic resonance imaging,MRI)檢查作為替代篩查手段[6]。一個超聲和MRI的前瞻性診斷性研究表明,具有肝癌高危風險的人群中,使用肝膽特異性對比劑MRI篩查可提高HCC診斷準確性,并降低假陰性結果[10]。但MRI掃描序列較多,時間-經濟成本較高。近年有研究嘗試使用少量序列組成MRI簡化序列的方案(abbreviated magnetic resonance imaging,AMRI)用于HCC篩查,希望能夠兼具高性價比和成本-效益,但目前尚無相關的系統評價。本研究系統評價AMRI篩查HCC的診斷價值,以期為臨床實踐提供依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
診斷準確性試驗。
1.1.2 研究對象
HCC高風險人群(符合中國臨床腫瘤學會2022版《原發性肝癌診療指南》[11]或美國放射學院肝臟影像報告及數據系統[12]標準),且既往無其他腫瘤病史和手術史。
1.1.3 診斷標準
采用公認的影像和/或病理診斷作為金標準,影像診斷標準符合中國臨床腫瘤學會2022版《原發性肝癌診療指南》[11],病理診斷標準符合國際肝癌共識小組[13]標準及中國抗癌協會2015版《原發性肝癌規范化病理診斷指南》[14]。
1.1.4 結局指標
① 敏感度;② 特異度;③ 陽性似然比;④ 陰性似然比;⑤ 診斷比值比(diagnostic odd ratio,DOR);⑥ 擬合受試者工作特征(summary receiver operating characteristic,SROC)曲線下面積(area under curve,AUC)。
1.1.5 排除標準
① 不是以篩查或模擬篩查為目的的研究;② 無法提取四格表或原始數據的研究;③ 磁共振設備場強1.5T以下的研究;④ 重復發表的研究;⑤ 非中、英文研究。
1.2 文獻檢索策略
計算機檢索PubMed、EMbase、The Cochrane Library、Web of Science、CNKI、WanFang Data和VIP數據庫,搜集有關AMRI篩查HCC的研究,檢索時限均從建庫至2022年3月1日。檢索采用主題詞與自由詞相結合的方式進行,并根據各數據庫特點進行調整。同時檢索納入研究的參考文獻,以補充獲取相關資料。中文檢索詞包括:肝細胞肝癌、篩查、監視、磁共振簡化序列等;英文檢索詞包括:hepatocellular carcinoma、screen、surveillance、abbreviated magnetic resonance imaging等。以PubMed為例,其具體檢索策略見框1。

1.3 文獻篩選和資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。如有需要,通過郵件、電話聯系原始研究作者獲取未確定但對本研究非常重要的信息。資料提取內容包括:① 納入研究的基本信息:第一作者、發表年份、研究國家、研究類型、樣本量、患者平均年齡、性別、肝硬化占比、診斷金標準方法、設備場強等;② 不同AMRI選擇的掃描序列:無對比劑增強組(non-contrast MRI,NC MRI):不包含肝膽特異期在內的簡化序列;肝膽期組(contrast-enhanced hepatobiliary phase MRI,HBP MRI):包含肝膽特異期和/或其他在內的簡化序列。當有研究中采用多種不同AMRI方案,將各個方案數據單獨錄入并分析;若一種AMRI方案使用2位以上研究者的診斷結果,則取其平均值作為該方案的數據結果錄入,最終整理形成用于統計分析的四格表(真陽性、假陽性、假陰性和真陰性)資料。
1.4 納入研究的偏倚風險評價
由2名研究者獨立評價納入研究的偏倚風險,并交叉核對結果。偏倚風險評價采用Cochrane協作網推薦的診斷準確性研究質量評價工具(QUADAS-2)[15]。
1.5 統計分析
采用Stata 16.0軟件MIDAS模塊進行診斷性試驗Meta分析。納入研究結果間的異質性采用χ2檢驗進行分析(檢驗水準為α=0.1),同時結合I2定量判斷異質性大小[16]。若各研究結果間無統計學異質性,則采用固定效應模型進行Meta分析;若各研究結果間存在統計學異質性,則進一步分析異質性來源,在排除明顯臨床異質性的影響后,采用隨機效應模型進行Meta分析。計算的合并診斷效能指標包括:合并敏感度、合并特異度、合并陽性似然比、合并陰性似然比及合并DOR,所有合并效應量均提供其95%可信區間(confidence interval,CI)。使用診斷試驗Meta分析的雙變量混合效應模型[17-20],通過對真陽性率和假陽性率的logit變換,繪制森林圖及ROC,采用AUC比較各類簡化序列方案診斷效能的優劣,AUC越接近1.0,提示該類簡化序列方案的診斷效能越高。通過Deek’s不對稱回歸檢驗評估是否存在發表偏倚[21]。繪制Fagan圖,評價診斷試驗的臨床運用價值。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻1 696篇,經逐層篩選后,最終納入15個研究[22-36],包括2 823例患者。文獻篩選流程及結果見圖1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入研究的基本特征與偏倚風險評價結果


2.3 Meta分析結果
2.3.1 AMRI方案
有7個研究[22-23,25,32-34,36]采用2種及以上的AMRI方案,將各方案數據單獨錄入,最終錄入24組AMRI方案,包括15組NC MRI方案,9組HBP MRI方案。NC MRI中5組使用了T2+T1+DWI序列作為簡化方案,4組使用了T2+DWI序列作為簡化方案;HBP MRI中6組使用了T2+DWI+HBP序列作為簡化方案。
2.3.2 合并效應量
Meta分析結果顯示,AMRI的合并敏感度、合并特異度分別為0.85[95%CI(0.83,0.87)]、0.93[95%CI(0.90,0.94)]。各簡化方案合并效應量結果見表3。NC AMRI方案和HBP AMRI方案的合并敏感度、合并特異度相當,T2+DWI+HBP序列作為簡化序列方案顯示出相對最高的診斷準確性(圖2)。


2.3.3 發表偏倚檢驗
T2+DWI+HBP方案的Deek’s圖見圖3,結果顯示各研究點基本對稱,提示存在發表偏倚的可能性較小。

2.3.4 Fagan圖
T2+DWI+HBP的Fagan圖見圖4,其似然比點狀圖見圖5,提示T2+DWI+HBP作為確診試驗時診斷準確性可能相對較好。


3 討論
T1WI序列中,因病灶內部出現纖維化或液化壞死區域,常呈低或稍低信號[37]。T2WI序列中,肝癌病灶主要表現為相對于背景肝實質輕度至中度高信號,區別于囊腫或血管瘤的高亮信號,故信號強度不同可進行良惡性鑒別[37-38]。DWI序列中,肝癌病灶水分子擴散受限,表現為b=0和/或b=50 s/mm2的DWI上與肝實質相比輕度至中度高信號,b=500 s/mm2和/或b=800 s/mm2 處持續高信號[39]。釓塞酸二鈉作為肝膽特異性對比劑,經靜脈注射隨血流進入肝臟后可被肝細胞特異性攝取,在注射約20分鐘后的肝膽特異期產生良好的影像增強效果,而肝癌病灶內缺乏正常肝細胞,無法攝取對比劑呈現低信號[40],故有利于病灶的早期檢出。
本研究結果顯示,AMRI對HCC有良好的診斷效能,NC MRI 和HBP MRI在HCC的篩查中均顯示出可接受的診斷效能,提示無論是否使用對比劑,AMRI對肝癌篩查的敏感度都顯著高于以往報道的超聲敏感度(0.47)[8],且同時保持了較高的特異度。Kim等[10]比較了超聲和完整序列MRI成像篩查HCC時的診斷準確性,二者的敏感度分別為0.279和0.86,有新指南建議在超聲檢查不足以達到診斷標準的肝癌高風險人群中使用CT或MRI進行監測。但也有研究[41]表明,完整序列MRI用于高危人群篩查的成本-效益并不高。因此,近年有研究提出使用少量序列作為簡化方案,替代完整序列MRI進行篩查,以期在保證較高診斷準確性的同時降低篩查的時間和經濟成本。在本研究中,AMRI的診斷效能與先前使用完整序列MRI進行篩查時結果相似,敏感度分別為0.85和0.86,特異度分別為0.93和0.97[10]。Goossens等[42]研究表明,采用AMRI對肝癌中高危人群進行腫瘤的早期監測,是具有高敏感度和增量-成本效果比的診斷方式。Lima等[43]研究同樣表明,在患者依從性尚可的前提下,AMRI是可能取代超聲進行篩查且經濟有效的方案。基于先前的研究和本Meta分析結果,AMRI具有掃描序列較少,時間和經濟成本較低和較高的診斷效能,有望替代超聲在臨床上用于肝癌的篩查。
本研究進一步分析表明,包含肝膽特異性對比劑的HBP AMRI診斷效能較NC AMRI更高。在HBP AMRI中,采用T2+DWI+HBP序列篩查HCC時,具有相對最高的整體診斷準確性,或許可作為一種相對較理想的HCC篩查方案。肝膽特異期肝實質與肝癌病灶間的對比度增高,更有利于小病灶檢出[44],聯合T2和DWI圖像可對進行篩查的高風險人群提供病灶早期的圖像信息,幫助臨床評估并及時治療疾病,改善患者預后。在晚期肝硬化患者中,肝功能受損較重可能會限制對比劑的攝取,降低肝臟與病灶之間的對比度,若存在發育不良的結節也可能表現為肝膽期低信號,導致假陽性診斷的可能[45]。相比之下,NC AMRI無需注射對比劑,可避免其在體內長期蓄積的潛在風險及腎源性系統性纖維化的產生[46],并具有與HBP AMRI相當的診斷效能。但是T1序列對比度和噪聲比均較低,肝癌病灶的可視化程度不高;DWI序列較易出現偽影,影響肝頂及肝左葉病灶的檢出,且早期肝癌可能不會表現出相對于肝實質的擴散受限[47];HCC在T2序列可能與肝實質等信號,在晚期肝硬化患者中背景肝實質信號不均容易影響病灶的檢出[45]。故在臨床應用時需考慮到各序列的優點與不足,綜合選擇合適的簡化序列用于肝癌高風險人群的篩查。當篩查出的癌灶處于較早期階段時,采用經腹腔鏡肝切除術創傷小,術中出血量及術后并發癥均較少,有利于進一步改善患者預后[48]。
本研究的局限性:① 采用超聲和AMRI篩查直接對比的前瞻性研究較少,需要更多同步研究比較二者在真實篩查環境中的診斷效能以進行綜合分析;② AMRI多為回顧性研究納入的高風險人群,部分研究人群中肝硬化占比過高,存在對患者的選擇性偏倚;③ 評估AMRI診斷效能同時進行成本效益分析的文獻過少,間接比較可能存在統計學上的不足。
綜上所述,現有證據表明,各AMRI方案對HCC的篩查均具有可接受的敏感度和特異度,其中T2+DWI+HBP方案診斷效能最高。受納入研究數量和質量的限制,上述結論尚需更多高質量研究予以驗證。