引用本文: 謝文苑, 羅詩樵. 肝細胞癌術前肝儲備功能評估方法的研究進展. 中國普外基礎與臨床雜志, 2023, 30(1): 115-122. doi: 10.7507/1007-9424.202208036 復制
原發性肝癌中肝細胞癌(hepatocellular carcinoma,HCC)占絕大多數。盡管HCC的治療方法眾多,比如手術、射頻消融、經肝動脈化學藥物栓塞、外照射、藥物綜合治療等,但到目前為止,手術切除仍然是HCC首選且行之有效的治療方案。根治性肝切除作為HCC的主要治療措施,會導致肝功能下降,如果肝切除過多則可能會出現肝切除術后肝功能衰竭(post-hepatectomy liver failure,PHLF),導致高膽紅素血癥、低白蛋白血癥、凝血酶原時間延長、血清乳酸升高和(或)不同級別的肝性腦病甚至死亡。因此,術前準確評估HCC患者肝功能并預測術后殘余肝功能,對HCC患者選擇根治性切除具有重要意義。目前,常見的肝儲備功能評估主要有臨床評估、清除代謝試驗及影像學評估(表1),筆者現將這三方面近年的研究情況進行綜述,比較各評估方法的特點,為HCC患者術前肝儲備功能評估以判斷是否手術提供參考。

1 臨床評估方法
1.1 Child-Pugh分級
Child-Pugh分級是臨床上最常用的用于評估肝臟疾病嚴重程度和估計肝硬化患者預后的工具之一,其起源可追溯到1973年,最初被用于估計手術切除曲張的食管靜脈后的急性靜脈曲張出血的病死率[1]。Child-Pugh分級包括5個指標:血清總膽紅素、血清白蛋白水平、血漿凝血酶原時間、肝性腦病和腹水,在每個指標中,根據異常的嚴重程度給出1~3分的分數(表2),根據最后的總分數將Child-Pugh分級分為3個等級:A級(5~6分)、B級(7~9分)和 C級(10~15分)。現在Child-Pugh分級更多地被用于評估HCC的分期,以指導HCC的治療和預后,評估為A級患者支持手術治療,C級患者不適宜任何抗腫瘤治療。與A級肝功能的患者相比,B級患者實行手術切除具有相當高的術后發病率和病死率。然而,隨著腹腔鏡下肝切除術的發展,許多外科醫生認為,精心挑選的Child-Pugh B級患者實施手術切除可能會獲得良好的短期和長期生存率。Child-Pugh分級目前存在許多缺陷:① 評估指標是根據經驗選擇的,每個變量的截斷值也是如此;② 每個變量都有相同的權重,不能體現各指標的重要性,如評分均為2分的肝性腦病表示肝衰竭情況的嚴重程度遠超過其他幾個指標,從而導致錯誤估計病情嚴重程度;③ 變量之間應該相互獨立,而血清白蛋白濃度和腹水之間可能存在聯系;④ 腹水和肝性腦病的臨床評估相對主觀,并且嚴重程度可能隨乳果糖和利尿劑的使用而變化,會損害觀察的可重復性,不能用于回顧性評估;⑤ 每個分級可以容納病情嚴重程度有很大不同的患者,膽紅素為600 μmol/L的患者與膽紅素為60 μmol/L的患者都評為3分;⑥ 即使在現在,依然尚未明確臨床變量是否應該在藥物治療的背景下進行分級,如用利尿劑改善少量腹水后該評為1分還是2分等。

1.2 MELD評分
MELD評分是Malinchoc等[2]于2000年提出的,最初是用于預測經頸靜脈肝內門體分流手術患者的短期生存率。MELD評分指標包括血清膽紅素、肌酐水平和國際標準化比值。原計算公式為: R=0.378 ln[膽紅素(mg/dL)]+1.12ln(國際標準化比值)+0.957ln[肌酐(mg/dL)]+0.643(病因:膽汁性或酒精性0,其他1),該研究團隊的Kamath等為方便計算,將MELD評分簡化:R=9.6×ln[肌酐(mg/dL)]+3.8×ln[膽紅素(mg/dL)]+11.2×ln(國際標準化比值)+6.4×(病因:膽汁性或酒精性0;其他為1)。MELD評分≤10分被認為可安全施行肝切除術[3]。現如今,MELD評分已取代Child-Pugh評分成為評估肝硬化患者肝移植優先性的指標: MELD評分≤15分可以行保守治療,MELD評分>15分則需要行肝移植手術[4]。MELD評分目前主要用于肝移植的評估,但也用作肝切除術前肝功能的評估。與Child-Pugh分級相比,它具有如下優勢:① MELD評分的分數是連續的,沒有產生分數的閾值,它對更嚴重患者的功能障礙程度有更精細的區分;② 終末期肝臟疾病患者常合并有出血、感染、使用大劑量利尿劑等情況,腎功能受損嚴重,甚至出現腎功能衰竭,MELD評分的肌酐水平則能反映腎功能受損情況;③ MELD評分將Child-Pugh評分中的凝血酶原時間替換為國際標準化比值,避免了因實驗室條件不同而造成的測量差異;④ MELD評分的指標都是容易獲得的客觀變量。MELD評分的缺點也很明顯:① 血清肌酐受肌肉質量、蛋白質飲食攝入量、年齡、性別和種族的影響。由于肌肉萎縮,晚期肝硬化患者的血清肌酐低于普通人群,因此,血清肌酐正常并不能排除腎功能受損;在大量或頑固性腹水接受利尿劑治療或穿刺引流和血漿容量擴張的患者中,血清肌酐在短期內可能有相當大的波動,這些波動可能不能反映實際情況的變化。② Budd-Chiari綜合征或其他血栓形成綜合征的患者通常使用口服抗凝劑進行治療,這些藥物可以改變國際標準化比值,從而影響MELD評分。③ 我國肝硬化病因多為病毒性肝炎,與國外常見的酒精性肝硬化不同。④ MELD評分適用于終末期肝臟疾病,但能手術切除的肝癌均為早期,肝儲備功能較好。⑤ MELD評分不能反映門靜脈高壓的嚴重程度。
由于血清鈉(Na)濃度已被認為是等待肝移植的終末期肝臟疾病患者病死率的有用預測指標,于是Biggins等[5]提出了一種基于MELD評分的改良評分方法,稱為“MELD-Na”,它將血清鈉整合到MELD評分中,MELD-Na=MELD評分+1.59 [135 – Na( mEq/L)]。2019年有研究者[6]提出MELD評分的變化(即ΔMELD,定義為當前MELD與前30 d內測量的最低MELD評分之間的差異),可能會給患者提供更多的預后信息。MELD評分快速增加的患者比MELD評分穩定的患者更可能有更差的預后結果。
1.3 ALBI分級
ALBI分級是Johnson等[7]于2005年提出的一種新的術前肝儲備功能評估方法,該指標僅包含2個指標:血清白蛋白和膽紅素。ALBI值=log10膽紅素×0.66+白蛋白×(–0.085),其中膽紅素和白蛋白的單位分別為μmol/L和g/L。ALBI分級分為3級:1 級,≤–2.60;2 級,–2.60~–1.39;3級,>–1.39。越來越多的證據[8-9]表明,ALBI分級可用作肝功能評估工具,作為治療策略的一部分,如巴塞羅那臨床肝癌分期和日本肝病學會提出的實用指南以及總分期評分系統。與ALBI分級1級患者相比,ALBI 2級和3級患者的PHLF發生率增加。ALBI分級系統指標均為客觀檢測值,避免了觀察者之間的差異,同時更精細地區分了Child-Pugh分級A級患者的術前肝功能情況,故對Child-Pugh分級A級的肝癌圍術期風險有更好的預測作用(表3)。但ALBI分級也存在一些缺陷:① 肝臟疾病患者在接受補充白蛋白的治療時,血清白蛋白水平可能在短時間內發生改變,而并非肝儲備功能的改善。② 體質性黃疸患者在肝功能正常的情況下,膽紅素水平升高。③ ALBI分級不能評估門靜脈高壓癥的情況,而門靜脈高壓往往預示著患者肝硬化情況嚴重。2017年Hiraoka等[9]提出了改良的ALBI(modified ALBI,mALBI),對患者肝功能進行了更詳細的劃分,根據臨界值“?2.270”(ALBI 得分)將ALBI 2級劃分為2a和2b(mALBI等級)級。為了簡化計算,Kariyama等[10]提出了一種更為簡單的簡化白蛋白-膽紅素(easy-ALBI,EZ-ALBI)評估方式,EZ-ALBI=總膽紅素(mg/dL)? 9 ×白蛋白(g/dL)。

1.4 MCP分級
MCP分級系統是由Wen等[18]于2018年提出。近年來,術前血清前白蛋白水平被認為是HCC肝切除術后生存率低和PHLF的獨立預測因素,該評分系統則首次將前白蛋白納入Child-Pugh評分中,同時也剔除了腹水和肝性腦病這2個主觀指標(表4)。MCP分級分為3級:MCP-1級(4分)、MCP-2級(5分)、MCP-3級(≥6分)。MCP分級系統主要用于肝儲備功能的評估,可將Child-Pugh分級A級的患者再細分為3個不同的亞組,從而也適用于預測 Child-Pugh分級A 級的HCC患者術后情況。肝功能為MCP-1級和MCP-2級的患者適合手術切除,而MCP-3級的患者應慎重考慮是否行手術治療[18]。MCP分級系統雖然在傳統Child-Pugh分級上改善了很多不足,但仍存在以下缺點:① 該評分系統的研究還較少,且均為國內的研究,仍需更多試驗證明其可靠性;② 該評分系統與Child-Pugh分級一樣,實驗室指標超過3分就不能更加詳細區分肝功能受損程度,且整體評分較為集中;③ 營養狀況會極大地影響個體的血清前白蛋白水平,尤其是老年患者或其他患有慢性疾病的患者[19]。

2 清除代謝試驗
2.1 ICG清除試驗
ICG清除試驗是一種定量分析肝功能的方法。1993年Makuuchi等[20]首次報道了一種基于ICG注射后 15 min殘留ICG染料的百分比(indocyanine green retention rate at 15 min,ICGR15)的手術決策算法。ICG是一種不被代謝的染料,它幾乎完全被排泄到膽汁中而不進入腸肝循環。因此,從血液中消除ICG的能力取決于肝血流量、細胞攝取和膽汁排泄能力[21]。其次,ICG在臨床劑量下是無毒的,因此它被認為是肝功能動力學分析的理想物質。目前,ICGR15和血漿清除率已被常規用來評價患者的肝儲備功能。Makuuchi等[20]提出,ICGR15為10%~20%的患者,最多可切除肝總體積的1/3。ICGR15<30%的患者,施行肝的單段切除是安全的。但需注意的是:① ICG和膽紅素在肝細胞轉運過程中載體相同且表現為競爭性抑制。因此,ICGR15或血漿清除率在高膽紅素血癥(>3 mg/dL,50 μmol/L)的患者中不再適用[22]。② 此外,極少數患者存在體質性ICG排泄缺陷[23]。③ ICG清除測試反映了整體肝功能,但沒有考慮肝內部存在的區域變化,從而忽視了要保留的節段可能存在的功能缺陷。為了更充分地評估患者術前肝儲備功能,并估算肝切除的最大體積,Kokudo等[24]提出了一種新的評估方法:白蛋白-吲哚菁綠評估(albumin-indocyanine green evaluation,ALICE)分級法,ALICE預測值=0.663×log10ICGR15(%)–0.071 8×白蛋白值(g/L),預測值≤–2.20時為ALICE 1級,預測值–2.20~ –1.88(包含–1.88)時為ALICE 2a級,預測值–1.88~–1.39(包含–1.39)時為ALICE 2b級,預測值>–1.39時為ALICE 3級。ALICE分級可以被認為是 Makuuchi標準和 Child-Pugh分級系統的組合。根據ALICE分級提出的HCC患者手術治療策略見圖1。

2.2 LiMAx試驗
LiMAx試驗是通過靜脈注射13C-美沙西丁和連續實時呼吸分析來評估肝功能的,于2009年由Stockmann等[25] 報道,13C-美沙西丁由肝臟中的微粒體細胞色素P450 1A2酶特異性代謝。因此,新出現的13C-二氧化碳(carbon dioxide,CO2)被釋放到血液中并被呼出,導致呼吸中的13CO2 /12CO2的比例改變,由此,可以根據13CO2呼出量測量肝功能。LiMAx的計算公式為:LiMAx=DOBmax×R(PDB)×P×BSA×MM/BW ,其中DOBmax表示自然基線13CO2(DOB)的最大值;R(PDB)是根據Pee Dee Belemnite標準(Craig 1957)計算出的13CO2 /12CO2基線比率,其值為0.011 237;P是每平方米體表面積的CO 2產生率,其值為300 mmol/(h·m2);BSA是體表面積(m2);MM表示13C-美沙西丁的分子質量,其值為166;BW表示體質量。LiMAx>315 μg/(kg·h)肝功能正常的患者允許切除多達4個肝段;LiMAx<140 μg/(kg·h)肝功能嚴重受損的患者則為肝切除術的禁忌證,該類患者在小部分肝切除后就可能發生PHLF。LiMAx試驗因侵入性較小、相對簡單且患者接受度高而被廣泛應用;但也存在以下缺點:① 慢性肝臟疾病的病因可能對實際肝功能有影響,導致體內肝酶數量、功能改變,從而影響預測值;② 肝硬化患者的血流動力學和體液分布變化可能導致測量值的不準確;③ 只有一小部分釋放的13CO2立即呼出,而另一部分被身體隔室吸收,并延遲返回血漿[26]。為了提高LiMAx試驗對終末期肝臟疾病的準確性,Dziodzio等[27]將血清肌酐水平加入該模型中,提出了CreLiMAx風險評分。CreLiMAx=?0.532×log10(LiMAx)+1.373×log10(血清肌酐),預測值<0.9的患者的短期生存率遠高于>0.9的患者[28]。
3 影像學檢查
3.1 99Tcm-甲溴芬寧閃爍顯像
甲溴芬寧是一種亞氨基二乙酸類似物,以白蛋白結合形式循環,它與ICG類似,在不進行生物轉化的情況下經膽汁排泄,因此是膽管的理想示蹤劑[29]。99Tcm標記的亞氨基二乙酸最初用于診斷多種膽管疾病,Heyman[30]于1994年開始用它來評估肝功能,靜脈注射 99Tcm-甲溴芬寧后,使用γ相機進行動態肝膽閃爍顯像,然后通過局部與整體的對比來測算肝功能。總肝 99Tcm-甲溴芬寧攝取率可通過將時間-活動曲線除以患者體表面積 [%/(min·m2)]來計算,因此可以對患者進行個體化評估。殘肝攝取量超過2.5 %/(min·m2)的患者可以進行安全切除,需要大肝切除(≥3個肝段)的高危患者的殘肝攝取量需超過2.7 %/(min·m2)[31]。由于 99Tcm-甲溴芬寧肝膽閃爍顯像具有選擇性測量殘肝功能的能力,是為數不多的可用于測量門靜脈栓塞術后殘肝功能的檢查之一。另外,新開發的旋轉γ相機,使得可以對節段性肝功能和肝功能體積進行三維測量。雖然亞氨基二乙酸和膽紅素的受體攝取機制相同,在高膽紅素血癥狀態下存在底物競爭,但是甲溴芬寧對高膽紅素置換的抵抗力極強,即使在膽紅素水平為20~30 mg/dL時也能產生高質量的診斷圖像。對膽紅素超過30 mg/dL且伴有膽管梗阻的患者進行 99Tcm-甲溴芬寧肝膽閃爍顯像時則需要對功能性殘肝的膽道進行完全引流[32]。然而白蛋白是甲溴芬寧的主要血漿載體,低白蛋白血癥會阻礙 99Tcm-甲溴芬寧的攝取[29] 。
3.2 99Tcm-GSA閃爍顯像
GSA是人工合成的去唾液酸糖蛋白類似物,可與肝表面的去唾液酸糖蛋白受體相結合。患者肝功能受損時,肝細胞和去唾液酸糖蛋白受體數量下降,導致對GSA的結合和攝取降低,可間接反映肝功能的受損情況。2010年Iimuro等[33]使用放射性核素 99Tcm標記GSA的分子探針 99Tcm-GSA評估患者肝儲備功能。99Tcm-GSA經靜脈注射入人體后,根據肝不同區域 99Tcm-GSA放射性差異而成像,便可有效地評估不同區域肝功能,特別是不同肝段之間肝功能存在異質分布,這在纖維化、肝硬化或化學藥物治療后的肝中尤為顯著。99Tcm-GSA單光子發射計算機斷層掃描(single photon emission computed tomography,SPECT)顯像主要為動態掃描,能夠獲得肝功能體積、攝取率及攝取密度,克服肝功能的不均勻分布,對區域性肝功能進行更精確地評估,它的常用參數有15 min時肝臟攝取與肝臟和心臟攝取的比率(liver to that by the liver and heart combined at 15 min,LHL15)和15 min時肝臟攝取與 99Tcm-GSA注射劑量的比率( ratio of uptake by the liver at 15 min to the injected dose of 99Tcm-GSA,LU15)。LHL15>0.903的肝門膽管癌患者進行手術的風險較低[34],為預防PHLF,剩余肝的LU15不應小于16.7[35]。肝攝取 99Tcm-GSA與膽紅素無競爭抑制關系,因此 99Tcm-GSA SPECT顯像可用于高膽紅素血癥患者肝功能評估及術后肝功能預測,并且顯著優于CT[36]。但 99Tcm-GSA SPECT也存在一些不足:① SPECT獲得的圖像分辨率低,無法分辨膽囊、膽管、血管等解剖結構;② 參數繁多且復雜,并且尚未實現標準化操作,無法獲得一致結果;③ 目前相關研究較少,國內也尚未正式將 99Tcm-GSA運用于臨床,還需要更多的臨床試驗來驗證其價值。
3.3 超聲彈性成像
超聲彈性成像是一種對組織硬度敏感的成像技術,在20世紀90年代首次被報道[37],它是根據有病組織與無病組織之間硬度的不同進行成像。通過按壓或振動身體表面、自然發生的內部生理運動或通過電子控制超聲換能器,在人體內部產生聚焦的聲輻射來施加力,從而測量和顯示與組織中抵抗剪切變形的彈性恢復力相關的生物力學特性。最初,超聲彈性成像用于診斷肝纖維化并評估其嚴重程度,其診斷臨界值取決于潛在肝臟疾病的病因以及目標人群中該疾病的患病率[38]。近年來,超聲彈性成像通過肝臟硬度用來預測HCC肝切除術后PHLF[39-40],它預測PHLF的臨界值為11.75 kPa(1 kPa=7.5 mmHg),其中預測PHLF B級(或更高)的臨界值為11.9 kPa[39]。
目前,可用于評估肝臟硬度的超聲彈性成像常用的方法有4種:包括瞬時彈性成像、實時超聲彈性成像、聲脈沖輻射力成像及實時剪切波彈性成像。① 瞬時彈性成像是最早用于評估肝纖維化程度的超聲彈性成像,診斷價值可靠,但腹水、肥胖、肋間隙過窄會影響檢查效果;② 實時超聲彈性成像可定性或半定量地評估肝組織硬度,但因檢查時需手部施加壓力或依靠自身心臟的搏動,所以彈性結果容易受操作者手法及受檢者心率個體差異的影響,同時在心功能不全患者應用中受到限制;③ 聲脈沖輻射力成像可定量評估組織硬度,無需手動壓迫且操作迅速,但檢查時范圍較小且固定;④ 實時剪切波彈性成像為最新的超聲彈性成像技術,整體上克服了另外3種彈性成像的不足,可重復性強。
由于肝臟被包裹在一個可擴張但堅硬的包膜(Glisson囊)中,導致的額外占位變化如水腫、炎癥、肝外膽汁淤積或充血可以增加其硬度并提高測量值,而與纖維化無關[41]。除了生理差異(如患者的吸氣和呼氣水平以及餐后狀態)外,包括肝臟炎癥、被動肝充血(如心功能不全、膽汁淤積和肝脂肪變性)在內的疾病過程會影響超聲彈性成像測量[42]。肝硬化的嚴重程度與肝功能狀態相關[43],在HCC患者中肝臟硬度與術前肝功能參數(包括個體生化指標、肝功能評分和ICG清除試驗結果)之間存在明顯的相關性,但仍需要進一步的研究來驗證肝臟硬度在預測HCC患者術后風險和長期生存率方面的效用。
3.4 釓塞酸二鈉增強MRI
① 釓塞酸二鈉增強MRI在評估HCC局部肝功能方面顯示出巨大潛力[44-45]。釓塞酸二鈉具肝細胞特異性,它被有機陰離子轉運多肽1B1/B3轉運蛋白系統吸收到肝細胞中,并通過三磷酸腺苷依賴性多藥耐藥相關蛋白2復合物排泄到膽汁中,這些轉運途徑與攝取的途徑與ICG和亞氨基二乙酸物質的排泄相似。ICG完全通過膽管排泄,沒有代謝活動;釓塞酸二鈉有50%通過膽管排泄,另外50%通過腎臟排泄[46]。② 釓塞酸二鈉增強MRI在HCC的診斷方面具有顯著的優勢,特別是針對<2 cm的HCC。標準化的殘肝細胞攝取指數(standardized remnant hepatocellular uptake index,SrHUI),其計算公式為:SrHUI =未來殘肝體積×[(肝膽期圖像上的殘肝信號強度/肝膽期圖像上的脾臟信號強度)– 1]/體表面積,它預測PHLF A級和B級的截斷值分別為0.313 L/m2和0.257 L/m2 [47]。③ 釓塞酸二鈉增強MRI有助于評估肝組織的纖維化、脂肪變性、微灌注水平及膽管疾病[48]。④ 將釓塞酸二鈉增強MRI和虛擬肝切除術相結合,三維可視化可提供肝及其內部結構、腫瘤和脈管系統的空間關系概覽,虛擬肝切除術可準確計算切除后的剩余肝體積,從而為HCC患者的局部肝功能提供準確的術前評估,以預測大肝切除術后的短期結果[49]。總體來說,釓塞酸二鈉增強MRI技術應用時間較短,仍需更多的臨床試驗來驗證其功效。
4 小結與展望
盡管目前HCC切除術后的病死率大幅度降低,但是PHLF仍然是圍術期死亡的重要原因。術前準確評估肝儲備功能能極大地降低PHLF的發生,但目前的評估方法都存在一定的局限性。特別是隨著門靜脈栓塞術、二期切除術、聯合肝分割和門靜脈結扎分期肝切除術等增加殘余肝體積的技術推動了肝切除術的發展,但術后并發癥率和病死率也大幅提高[50]。此時,由于門靜脈栓塞導致壞死和代償性增生的肝功能相互抵消,所以整體肝功能測量就不再適合預測PHLF。而Child-Pugh分級、MELD評分、MCP分級、ALBI分級等評估方法,雖操作簡便,可于床旁進行,但它們只能評估整體肝儲備功能,而且藥物干預后它們的預測值短期波動較大,不能準確地反映患者肝功能。ICG清除試驗和LiMAx試驗評估結果穩定,但均需注射藥物,操作相對復雜,而且評價的仍是整體肝功能。99Tcm-甲溴芬寧、99Tcm-GSA肝膽顯像和釓塞酸二鈉增強MRI均為功能成像,可評估局部肝儲備功能,但費用昂貴,耗時較長。超聲彈性成像費用相對較低,但目前臨床上更多地被用于肝硬化的評估。現如今,仍然主要依靠臨床參數與體積測量相結合來估計肝功能儲備并決定是否可以進行手術切除,影像檢查作為新興技術,能否取代傳統的臨床評估方法,需要更多大樣本量的前瞻性、多中心試驗來驗證,相信在未來一定能為患者制定獲益最大的治療方案,顯著提高患者的遠期生存率。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:謝文苑負責文獻檢索、閱讀、歸納與論文撰寫、修改;羅詩樵負責指導論文寫作及審閱。
原發性肝癌中肝細胞癌(hepatocellular carcinoma,HCC)占絕大多數。盡管HCC的治療方法眾多,比如手術、射頻消融、經肝動脈化學藥物栓塞、外照射、藥物綜合治療等,但到目前為止,手術切除仍然是HCC首選且行之有效的治療方案。根治性肝切除作為HCC的主要治療措施,會導致肝功能下降,如果肝切除過多則可能會出現肝切除術后肝功能衰竭(post-hepatectomy liver failure,PHLF),導致高膽紅素血癥、低白蛋白血癥、凝血酶原時間延長、血清乳酸升高和(或)不同級別的肝性腦病甚至死亡。因此,術前準確評估HCC患者肝功能并預測術后殘余肝功能,對HCC患者選擇根治性切除具有重要意義。目前,常見的肝儲備功能評估主要有臨床評估、清除代謝試驗及影像學評估(表1),筆者現將這三方面近年的研究情況進行綜述,比較各評估方法的特點,為HCC患者術前肝儲備功能評估以判斷是否手術提供參考。

1 臨床評估方法
1.1 Child-Pugh分級
Child-Pugh分級是臨床上最常用的用于評估肝臟疾病嚴重程度和估計肝硬化患者預后的工具之一,其起源可追溯到1973年,最初被用于估計手術切除曲張的食管靜脈后的急性靜脈曲張出血的病死率[1]。Child-Pugh分級包括5個指標:血清總膽紅素、血清白蛋白水平、血漿凝血酶原時間、肝性腦病和腹水,在每個指標中,根據異常的嚴重程度給出1~3分的分數(表2),根據最后的總分數將Child-Pugh分級分為3個等級:A級(5~6分)、B級(7~9分)和 C級(10~15分)。現在Child-Pugh分級更多地被用于評估HCC的分期,以指導HCC的治療和預后,評估為A級患者支持手術治療,C級患者不適宜任何抗腫瘤治療。與A級肝功能的患者相比,B級患者實行手術切除具有相當高的術后發病率和病死率。然而,隨著腹腔鏡下肝切除術的發展,許多外科醫生認為,精心挑選的Child-Pugh B級患者實施手術切除可能會獲得良好的短期和長期生存率。Child-Pugh分級目前存在許多缺陷:① 評估指標是根據經驗選擇的,每個變量的截斷值也是如此;② 每個變量都有相同的權重,不能體現各指標的重要性,如評分均為2分的肝性腦病表示肝衰竭情況的嚴重程度遠超過其他幾個指標,從而導致錯誤估計病情嚴重程度;③ 變量之間應該相互獨立,而血清白蛋白濃度和腹水之間可能存在聯系;④ 腹水和肝性腦病的臨床評估相對主觀,并且嚴重程度可能隨乳果糖和利尿劑的使用而變化,會損害觀察的可重復性,不能用于回顧性評估;⑤ 每個分級可以容納病情嚴重程度有很大不同的患者,膽紅素為600 μmol/L的患者與膽紅素為60 μmol/L的患者都評為3分;⑥ 即使在現在,依然尚未明確臨床變量是否應該在藥物治療的背景下進行分級,如用利尿劑改善少量腹水后該評為1分還是2分等。

1.2 MELD評分
MELD評分是Malinchoc等[2]于2000年提出的,最初是用于預測經頸靜脈肝內門體分流手術患者的短期生存率。MELD評分指標包括血清膽紅素、肌酐水平和國際標準化比值。原計算公式為: R=0.378 ln[膽紅素(mg/dL)]+1.12ln(國際標準化比值)+0.957ln[肌酐(mg/dL)]+0.643(病因:膽汁性或酒精性0,其他1),該研究團隊的Kamath等為方便計算,將MELD評分簡化:R=9.6×ln[肌酐(mg/dL)]+3.8×ln[膽紅素(mg/dL)]+11.2×ln(國際標準化比值)+6.4×(病因:膽汁性或酒精性0;其他為1)。MELD評分≤10分被認為可安全施行肝切除術[3]。現如今,MELD評分已取代Child-Pugh評分成為評估肝硬化患者肝移植優先性的指標: MELD評分≤15分可以行保守治療,MELD評分>15分則需要行肝移植手術[4]。MELD評分目前主要用于肝移植的評估,但也用作肝切除術前肝功能的評估。與Child-Pugh分級相比,它具有如下優勢:① MELD評分的分數是連續的,沒有產生分數的閾值,它對更嚴重患者的功能障礙程度有更精細的區分;② 終末期肝臟疾病患者常合并有出血、感染、使用大劑量利尿劑等情況,腎功能受損嚴重,甚至出現腎功能衰竭,MELD評分的肌酐水平則能反映腎功能受損情況;③ MELD評分將Child-Pugh評分中的凝血酶原時間替換為國際標準化比值,避免了因實驗室條件不同而造成的測量差異;④ MELD評分的指標都是容易獲得的客觀變量。MELD評分的缺點也很明顯:① 血清肌酐受肌肉質量、蛋白質飲食攝入量、年齡、性別和種族的影響。由于肌肉萎縮,晚期肝硬化患者的血清肌酐低于普通人群,因此,血清肌酐正常并不能排除腎功能受損;在大量或頑固性腹水接受利尿劑治療或穿刺引流和血漿容量擴張的患者中,血清肌酐在短期內可能有相當大的波動,這些波動可能不能反映實際情況的變化。② Budd-Chiari綜合征或其他血栓形成綜合征的患者通常使用口服抗凝劑進行治療,這些藥物可以改變國際標準化比值,從而影響MELD評分。③ 我國肝硬化病因多為病毒性肝炎,與國外常見的酒精性肝硬化不同。④ MELD評分適用于終末期肝臟疾病,但能手術切除的肝癌均為早期,肝儲備功能較好。⑤ MELD評分不能反映門靜脈高壓的嚴重程度。
由于血清鈉(Na)濃度已被認為是等待肝移植的終末期肝臟疾病患者病死率的有用預測指標,于是Biggins等[5]提出了一種基于MELD評分的改良評分方法,稱為“MELD-Na”,它將血清鈉整合到MELD評分中,MELD-Na=MELD評分+1.59 [135 – Na( mEq/L)]。2019年有研究者[6]提出MELD評分的變化(即ΔMELD,定義為當前MELD與前30 d內測量的最低MELD評分之間的差異),可能會給患者提供更多的預后信息。MELD評分快速增加的患者比MELD評分穩定的患者更可能有更差的預后結果。
1.3 ALBI分級
ALBI分級是Johnson等[7]于2005年提出的一種新的術前肝儲備功能評估方法,該指標僅包含2個指標:血清白蛋白和膽紅素。ALBI值=log10膽紅素×0.66+白蛋白×(–0.085),其中膽紅素和白蛋白的單位分別為μmol/L和g/L。ALBI分級分為3級:1 級,≤–2.60;2 級,–2.60~–1.39;3級,>–1.39。越來越多的證據[8-9]表明,ALBI分級可用作肝功能評估工具,作為治療策略的一部分,如巴塞羅那臨床肝癌分期和日本肝病學會提出的實用指南以及總分期評分系統。與ALBI分級1級患者相比,ALBI 2級和3級患者的PHLF發生率增加。ALBI分級系統指標均為客觀檢測值,避免了觀察者之間的差異,同時更精細地區分了Child-Pugh分級A級患者的術前肝功能情況,故對Child-Pugh分級A級的肝癌圍術期風險有更好的預測作用(表3)。但ALBI分級也存在一些缺陷:① 肝臟疾病患者在接受補充白蛋白的治療時,血清白蛋白水平可能在短時間內發生改變,而并非肝儲備功能的改善。② 體質性黃疸患者在肝功能正常的情況下,膽紅素水平升高。③ ALBI分級不能評估門靜脈高壓癥的情況,而門靜脈高壓往往預示著患者肝硬化情況嚴重。2017年Hiraoka等[9]提出了改良的ALBI(modified ALBI,mALBI),對患者肝功能進行了更詳細的劃分,根據臨界值“?2.270”(ALBI 得分)將ALBI 2級劃分為2a和2b(mALBI等級)級。為了簡化計算,Kariyama等[10]提出了一種更為簡單的簡化白蛋白-膽紅素(easy-ALBI,EZ-ALBI)評估方式,EZ-ALBI=總膽紅素(mg/dL)? 9 ×白蛋白(g/dL)。

1.4 MCP分級
MCP分級系統是由Wen等[18]于2018年提出。近年來,術前血清前白蛋白水平被認為是HCC肝切除術后生存率低和PHLF的獨立預測因素,該評分系統則首次將前白蛋白納入Child-Pugh評分中,同時也剔除了腹水和肝性腦病這2個主觀指標(表4)。MCP分級分為3級:MCP-1級(4分)、MCP-2級(5分)、MCP-3級(≥6分)。MCP分級系統主要用于肝儲備功能的評估,可將Child-Pugh分級A級的患者再細分為3個不同的亞組,從而也適用于預測 Child-Pugh分級A 級的HCC患者術后情況。肝功能為MCP-1級和MCP-2級的患者適合手術切除,而MCP-3級的患者應慎重考慮是否行手術治療[18]。MCP分級系統雖然在傳統Child-Pugh分級上改善了很多不足,但仍存在以下缺點:① 該評分系統的研究還較少,且均為國內的研究,仍需更多試驗證明其可靠性;② 該評分系統與Child-Pugh分級一樣,實驗室指標超過3分就不能更加詳細區分肝功能受損程度,且整體評分較為集中;③ 營養狀況會極大地影響個體的血清前白蛋白水平,尤其是老年患者或其他患有慢性疾病的患者[19]。

2 清除代謝試驗
2.1 ICG清除試驗
ICG清除試驗是一種定量分析肝功能的方法。1993年Makuuchi等[20]首次報道了一種基于ICG注射后 15 min殘留ICG染料的百分比(indocyanine green retention rate at 15 min,ICGR15)的手術決策算法。ICG是一種不被代謝的染料,它幾乎完全被排泄到膽汁中而不進入腸肝循環。因此,從血液中消除ICG的能力取決于肝血流量、細胞攝取和膽汁排泄能力[21]。其次,ICG在臨床劑量下是無毒的,因此它被認為是肝功能動力學分析的理想物質。目前,ICGR15和血漿清除率已被常規用來評價患者的肝儲備功能。Makuuchi等[20]提出,ICGR15為10%~20%的患者,最多可切除肝總體積的1/3。ICGR15<30%的患者,施行肝的單段切除是安全的。但需注意的是:① ICG和膽紅素在肝細胞轉運過程中載體相同且表現為競爭性抑制。因此,ICGR15或血漿清除率在高膽紅素血癥(>3 mg/dL,50 μmol/L)的患者中不再適用[22]。② 此外,極少數患者存在體質性ICG排泄缺陷[23]。③ ICG清除測試反映了整體肝功能,但沒有考慮肝內部存在的區域變化,從而忽視了要保留的節段可能存在的功能缺陷。為了更充分地評估患者術前肝儲備功能,并估算肝切除的最大體積,Kokudo等[24]提出了一種新的評估方法:白蛋白-吲哚菁綠評估(albumin-indocyanine green evaluation,ALICE)分級法,ALICE預測值=0.663×log10ICGR15(%)–0.071 8×白蛋白值(g/L),預測值≤–2.20時為ALICE 1級,預測值–2.20~ –1.88(包含–1.88)時為ALICE 2a級,預測值–1.88~–1.39(包含–1.39)時為ALICE 2b級,預測值>–1.39時為ALICE 3級。ALICE分級可以被認為是 Makuuchi標準和 Child-Pugh分級系統的組合。根據ALICE分級提出的HCC患者手術治療策略見圖1。

2.2 LiMAx試驗
LiMAx試驗是通過靜脈注射13C-美沙西丁和連續實時呼吸分析來評估肝功能的,于2009年由Stockmann等[25] 報道,13C-美沙西丁由肝臟中的微粒體細胞色素P450 1A2酶特異性代謝。因此,新出現的13C-二氧化碳(carbon dioxide,CO2)被釋放到血液中并被呼出,導致呼吸中的13CO2 /12CO2的比例改變,由此,可以根據13CO2呼出量測量肝功能。LiMAx的計算公式為:LiMAx=DOBmax×R(PDB)×P×BSA×MM/BW ,其中DOBmax表示自然基線13CO2(DOB)的最大值;R(PDB)是根據Pee Dee Belemnite標準(Craig 1957)計算出的13CO2 /12CO2基線比率,其值為0.011 237;P是每平方米體表面積的CO 2產生率,其值為300 mmol/(h·m2);BSA是體表面積(m2);MM表示13C-美沙西丁的分子質量,其值為166;BW表示體質量。LiMAx>315 μg/(kg·h)肝功能正常的患者允許切除多達4個肝段;LiMAx<140 μg/(kg·h)肝功能嚴重受損的患者則為肝切除術的禁忌證,該類患者在小部分肝切除后就可能發生PHLF。LiMAx試驗因侵入性較小、相對簡單且患者接受度高而被廣泛應用;但也存在以下缺點:① 慢性肝臟疾病的病因可能對實際肝功能有影響,導致體內肝酶數量、功能改變,從而影響預測值;② 肝硬化患者的血流動力學和體液分布變化可能導致測量值的不準確;③ 只有一小部分釋放的13CO2立即呼出,而另一部分被身體隔室吸收,并延遲返回血漿[26]。為了提高LiMAx試驗對終末期肝臟疾病的準確性,Dziodzio等[27]將血清肌酐水平加入該模型中,提出了CreLiMAx風險評分。CreLiMAx=?0.532×log10(LiMAx)+1.373×log10(血清肌酐),預測值<0.9的患者的短期生存率遠高于>0.9的患者[28]。
3 影像學檢查
3.1 99Tcm-甲溴芬寧閃爍顯像
甲溴芬寧是一種亞氨基二乙酸類似物,以白蛋白結合形式循環,它與ICG類似,在不進行生物轉化的情況下經膽汁排泄,因此是膽管的理想示蹤劑[29]。99Tcm標記的亞氨基二乙酸最初用于診斷多種膽管疾病,Heyman[30]于1994年開始用它來評估肝功能,靜脈注射 99Tcm-甲溴芬寧后,使用γ相機進行動態肝膽閃爍顯像,然后通過局部與整體的對比來測算肝功能。總肝 99Tcm-甲溴芬寧攝取率可通過將時間-活動曲線除以患者體表面積 [%/(min·m2)]來計算,因此可以對患者進行個體化評估。殘肝攝取量超過2.5 %/(min·m2)的患者可以進行安全切除,需要大肝切除(≥3個肝段)的高危患者的殘肝攝取量需超過2.7 %/(min·m2)[31]。由于 99Tcm-甲溴芬寧肝膽閃爍顯像具有選擇性測量殘肝功能的能力,是為數不多的可用于測量門靜脈栓塞術后殘肝功能的檢查之一。另外,新開發的旋轉γ相機,使得可以對節段性肝功能和肝功能體積進行三維測量。雖然亞氨基二乙酸和膽紅素的受體攝取機制相同,在高膽紅素血癥狀態下存在底物競爭,但是甲溴芬寧對高膽紅素置換的抵抗力極強,即使在膽紅素水平為20~30 mg/dL時也能產生高質量的診斷圖像。對膽紅素超過30 mg/dL且伴有膽管梗阻的患者進行 99Tcm-甲溴芬寧肝膽閃爍顯像時則需要對功能性殘肝的膽道進行完全引流[32]。然而白蛋白是甲溴芬寧的主要血漿載體,低白蛋白血癥會阻礙 99Tcm-甲溴芬寧的攝取[29] 。
3.2 99Tcm-GSA閃爍顯像
GSA是人工合成的去唾液酸糖蛋白類似物,可與肝表面的去唾液酸糖蛋白受體相結合。患者肝功能受損時,肝細胞和去唾液酸糖蛋白受體數量下降,導致對GSA的結合和攝取降低,可間接反映肝功能的受損情況。2010年Iimuro等[33]使用放射性核素 99Tcm標記GSA的分子探針 99Tcm-GSA評估患者肝儲備功能。99Tcm-GSA經靜脈注射入人體后,根據肝不同區域 99Tcm-GSA放射性差異而成像,便可有效地評估不同區域肝功能,特別是不同肝段之間肝功能存在異質分布,這在纖維化、肝硬化或化學藥物治療后的肝中尤為顯著。99Tcm-GSA單光子發射計算機斷層掃描(single photon emission computed tomography,SPECT)顯像主要為動態掃描,能夠獲得肝功能體積、攝取率及攝取密度,克服肝功能的不均勻分布,對區域性肝功能進行更精確地評估,它的常用參數有15 min時肝臟攝取與肝臟和心臟攝取的比率(liver to that by the liver and heart combined at 15 min,LHL15)和15 min時肝臟攝取與 99Tcm-GSA注射劑量的比率( ratio of uptake by the liver at 15 min to the injected dose of 99Tcm-GSA,LU15)。LHL15>0.903的肝門膽管癌患者進行手術的風險較低[34],為預防PHLF,剩余肝的LU15不應小于16.7[35]。肝攝取 99Tcm-GSA與膽紅素無競爭抑制關系,因此 99Tcm-GSA SPECT顯像可用于高膽紅素血癥患者肝功能評估及術后肝功能預測,并且顯著優于CT[36]。但 99Tcm-GSA SPECT也存在一些不足:① SPECT獲得的圖像分辨率低,無法分辨膽囊、膽管、血管等解剖結構;② 參數繁多且復雜,并且尚未實現標準化操作,無法獲得一致結果;③ 目前相關研究較少,國內也尚未正式將 99Tcm-GSA運用于臨床,還需要更多的臨床試驗來驗證其價值。
3.3 超聲彈性成像
超聲彈性成像是一種對組織硬度敏感的成像技術,在20世紀90年代首次被報道[37],它是根據有病組織與無病組織之間硬度的不同進行成像。通過按壓或振動身體表面、自然發生的內部生理運動或通過電子控制超聲換能器,在人體內部產生聚焦的聲輻射來施加力,從而測量和顯示與組織中抵抗剪切變形的彈性恢復力相關的生物力學特性。最初,超聲彈性成像用于診斷肝纖維化并評估其嚴重程度,其診斷臨界值取決于潛在肝臟疾病的病因以及目標人群中該疾病的患病率[38]。近年來,超聲彈性成像通過肝臟硬度用來預測HCC肝切除術后PHLF[39-40],它預測PHLF的臨界值為11.75 kPa(1 kPa=7.5 mmHg),其中預測PHLF B級(或更高)的臨界值為11.9 kPa[39]。
目前,可用于評估肝臟硬度的超聲彈性成像常用的方法有4種:包括瞬時彈性成像、實時超聲彈性成像、聲脈沖輻射力成像及實時剪切波彈性成像。① 瞬時彈性成像是最早用于評估肝纖維化程度的超聲彈性成像,診斷價值可靠,但腹水、肥胖、肋間隙過窄會影響檢查效果;② 實時超聲彈性成像可定性或半定量地評估肝組織硬度,但因檢查時需手部施加壓力或依靠自身心臟的搏動,所以彈性結果容易受操作者手法及受檢者心率個體差異的影響,同時在心功能不全患者應用中受到限制;③ 聲脈沖輻射力成像可定量評估組織硬度,無需手動壓迫且操作迅速,但檢查時范圍較小且固定;④ 實時剪切波彈性成像為最新的超聲彈性成像技術,整體上克服了另外3種彈性成像的不足,可重復性強。
由于肝臟被包裹在一個可擴張但堅硬的包膜(Glisson囊)中,導致的額外占位變化如水腫、炎癥、肝外膽汁淤積或充血可以增加其硬度并提高測量值,而與纖維化無關[41]。除了生理差異(如患者的吸氣和呼氣水平以及餐后狀態)外,包括肝臟炎癥、被動肝充血(如心功能不全、膽汁淤積和肝脂肪變性)在內的疾病過程會影響超聲彈性成像測量[42]。肝硬化的嚴重程度與肝功能狀態相關[43],在HCC患者中肝臟硬度與術前肝功能參數(包括個體生化指標、肝功能評分和ICG清除試驗結果)之間存在明顯的相關性,但仍需要進一步的研究來驗證肝臟硬度在預測HCC患者術后風險和長期生存率方面的效用。
3.4 釓塞酸二鈉增強MRI
① 釓塞酸二鈉增強MRI在評估HCC局部肝功能方面顯示出巨大潛力[44-45]。釓塞酸二鈉具肝細胞特異性,它被有機陰離子轉運多肽1B1/B3轉運蛋白系統吸收到肝細胞中,并通過三磷酸腺苷依賴性多藥耐藥相關蛋白2復合物排泄到膽汁中,這些轉運途徑與攝取的途徑與ICG和亞氨基二乙酸物質的排泄相似。ICG完全通過膽管排泄,沒有代謝活動;釓塞酸二鈉有50%通過膽管排泄,另外50%通過腎臟排泄[46]。② 釓塞酸二鈉增強MRI在HCC的診斷方面具有顯著的優勢,特別是針對<2 cm的HCC。標準化的殘肝細胞攝取指數(standardized remnant hepatocellular uptake index,SrHUI),其計算公式為:SrHUI =未來殘肝體積×[(肝膽期圖像上的殘肝信號強度/肝膽期圖像上的脾臟信號強度)– 1]/體表面積,它預測PHLF A級和B級的截斷值分別為0.313 L/m2和0.257 L/m2 [47]。③ 釓塞酸二鈉增強MRI有助于評估肝組織的纖維化、脂肪變性、微灌注水平及膽管疾病[48]。④ 將釓塞酸二鈉增強MRI和虛擬肝切除術相結合,三維可視化可提供肝及其內部結構、腫瘤和脈管系統的空間關系概覽,虛擬肝切除術可準確計算切除后的剩余肝體積,從而為HCC患者的局部肝功能提供準確的術前評估,以預測大肝切除術后的短期結果[49]。總體來說,釓塞酸二鈉增強MRI技術應用時間較短,仍需更多的臨床試驗來驗證其功效。
4 小結與展望
盡管目前HCC切除術后的病死率大幅度降低,但是PHLF仍然是圍術期死亡的重要原因。術前準確評估肝儲備功能能極大地降低PHLF的發生,但目前的評估方法都存在一定的局限性。特別是隨著門靜脈栓塞術、二期切除術、聯合肝分割和門靜脈結扎分期肝切除術等增加殘余肝體積的技術推動了肝切除術的發展,但術后并發癥率和病死率也大幅提高[50]。此時,由于門靜脈栓塞導致壞死和代償性增生的肝功能相互抵消,所以整體肝功能測量就不再適合預測PHLF。而Child-Pugh分級、MELD評分、MCP分級、ALBI分級等評估方法,雖操作簡便,可于床旁進行,但它們只能評估整體肝儲備功能,而且藥物干預后它們的預測值短期波動較大,不能準確地反映患者肝功能。ICG清除試驗和LiMAx試驗評估結果穩定,但均需注射藥物,操作相對復雜,而且評價的仍是整體肝功能。99Tcm-甲溴芬寧、99Tcm-GSA肝膽顯像和釓塞酸二鈉增強MRI均為功能成像,可評估局部肝儲備功能,但費用昂貴,耗時較長。超聲彈性成像費用相對較低,但目前臨床上更多地被用于肝硬化的評估。現如今,仍然主要依靠臨床參數與體積測量相結合來估計肝功能儲備并決定是否可以進行手術切除,影像檢查作為新興技術,能否取代傳統的臨床評估方法,需要更多大樣本量的前瞻性、多中心試驗來驗證,相信在未來一定能為患者制定獲益最大的治療方案,顯著提高患者的遠期生存率。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:謝文苑負責文獻檢索、閱讀、歸納與論文撰寫、修改;羅詩樵負責指導論文寫作及審閱。