2005年美國胸科學會(ATS)和歐洲呼吸協會(ERS)共同發布了肺功能檢查的判讀指南,并在2021年進行了更新。為及時了解和借鑒2021年版指南更新內容,本文將重點對2021年指南在肺功能預計值方程與正常范圍、肺功能隨時間的自然變化、支氣管舒張劑反應性試驗、肺生理功能障礙分類和肺功能障礙嚴重程度分度等方面更新內容進行介紹,同時結合我國實際情況給予點評或建議,以期為我國肺功能檢查臨床應用提供參考。
引用本文: 李允, 高怡, 鄭勁平. 《2021年ERS/ATS常規肺功能檢查判讀指南》的解讀. 中國循證醫學雜志, 2022, 22(12): 1375-1381. doi: 10.7507/1672-2531.202206044 復制
肺功能檢查(pulmonary function test,PFT)是評估呼吸功能的重要手段,通過檢測呼吸氣體流量、容積等指標反映受檢者的呼吸生理特性,對于篩查早期氣道病變、鑒別呼吸困難原因、評估肺部疾病嚴重程度及預后、判斷藥物或其他治療方法的療效、評估外科患者對手術的耐受性等方面有重要的價值。為提高PFT的依從性、檢查質量和臨床可比性,國內外陸續發布和更新了一系列PFT的技術標準規范[1-11]。但在嚴格技術質量控制的基礎上,正確判讀PFT同樣重要,如何選擇恰當的預計值方程和正常范圍,還應結合個人的病史和暴露史,考慮肺功能測量固有的生物變異性及隨時間變化的變化。
2005年美國胸科學會(American Thoracic Society,ATS)和歐洲呼吸協會(European Respiratory Society,ERS)共同發布了PFT的判讀指南[12](以下簡稱“2005版”),2019年ATS推薦采用標準化PFT報告[13],2021年ERS/ATS更新了PFT判讀指南[14](以下簡稱“2021版”)。對比2005版,2021版更加強調判讀的審慎性,即不能單純以閾值評估異常與否,要充分考慮受檢者個體特征、疾病狀態及參考人群、結果代表性等諸多因素。與ERS/ATS劃分獨立的PFT質控指南和判讀指南不同,我國為臨床易于理解和推廣應用,將PFT判讀方法整合到各項檢查指南[5-11]和報告規范[15]中。為及時了解和借鑒2021版更新內容,本文將重點對其在肺功能預計值方程與正常范圍、肺功能隨時間的自然變化、支氣管舒張劑反應性試驗、肺生理功能障礙分類及肺功能障礙嚴重程度評估等方面更新內容進行介紹。同時結合我國實際情況給予點評或建議,以期加深和提高臨床醫師和相關從業人員對PFT的認識和理解,為今后我國標準化PFT應用和指南更新提供參考。
1 全球肺功能倡議預計值方程與正常范圍
1.1 全球肺功能倡議預計值方程
選擇合適的預計值方程是正確解讀肺功能結果的前提。肺功能受到年齡、身高、性別、種族、環境等多種因素影響,尚無適用于所有人群的單一預計值方程,而應盡量選取相似人群的方程。PFT報告和研究出版物必須注明所使用的參考方程。2021版特別指出,雖然應尊重性別認同,但使用生物性別將更準確預測肺功能;性別確認激素療法對肺功能的影響知之甚少,目前尚不清楚針對跨性別個體的適當參考方程。2005版推薦北美人群使用第3次全國健康和營養調查的肺量計方程,但未對歐洲和其他地方使用何種預計值方程提出明確建議。2021版推薦使用全球肺功能倡議(global lung function initiative,GLI)方程是迄今為止應用最普遍的預計方程,包括肺量計方程[16]、一氧化碳肺彌散量(diffusing capacity of the lung for carbon monoxide,DLCO)方程[17]和肺容量方程[18]。GLI肺量計方程原始數據來自33個國家3~95歲的97 759例受試者,推導方程可用于白種人、非裔美國人、東北亞人和東南亞人4個群體。對于種族不在以上4個群體或具有混合種族血統的個體,可使用上述群體平均值調整后的綜合方程。由于缺乏其他種族的資料,GLI的DLCO方程和肺容量方程主要基于歐洲血統個體的數據。
點評:盡管2021版推薦全球普遍采用GLI預計值,但由于我國國土幅員遼闊,橫跨GLI所定義的東北亞及東南亞地域(依秦嶺和淮河劃分),中國人采用兩個不同地域的公式并不合適,特別是在橫跨上述分界的區域或采用統一方案的全國多中心研究等情況下更易引起混亂,不建議采用。我國于2017年更新了基于全國6大行政區域7 115例4~80歲人群的肺量計正常預計值[19],更適合中國人的肺功能結果判讀。
1.2 參考人群正常范圍
健康人群的正常范圍為預計值的95%可信區間。對于多數肺功能指標如用力肺活量(forced vital capacity,FVC)、第一秒用力呼氣容積(forced expiratory volume in 1 s,FEV1)等,低值為異常值,即<第5百分位數,用正常值下限(lower limit of normal,LLN)表示;少部分指標如肺總量(total lung capacity,TLC)、殘氣量(residual volume,RV)等,過低、過高均為異常,即<LLN及>正常值上限(upper limit of normal,ULN)。2005版和2021版均推薦使用LLN來判讀肺功能結果是否在正常范圍之內,不建議使用簡化的固定閾值(如FVC或FEV1<80%預計值、FEV1/FVC<0.70)來判斷異常,因為上述固定閾值多基于青年和中年人群的數據,沒有充分考慮年齡相關的測量變異,會增加兒童、老年人或較矮的成年人異常的假陰性或假陽性的概率,甚至誤診率超過20%[20]。例如,22歲男性FEV1的LLN對應81.1%預計值,同樣身高的85歲男性則為67.9%,如果均以80%作為標準,則會引起誤判。值得注意的是,對于接近LLN的結果,應結合患者的病史、體格檢查和驗前概率進行謹慎解讀。
點評:目前我國常用固定閾值法進行臨床判斷,操作簡單易行,對基層醫療機構更為適用,但對于三級醫院等高水平醫院或研究型醫院而言,采用LLN和ULN可更準確理解呼吸生理及符合臨床變化,建議推行。
2 肺功能隨時間的自然變化
PFT的正確判讀需要了解PFT的重復性和隨時間的自然變化。當肺功能變化值大于測試的生物變異性和測量誤差時,變化才可能有意義,才可用于指導臨床決策。在25歲以上成年人中,健康非吸煙者FEV1通常下降值為30 mL/年[21];在職業環境的研究中,綜合考慮測試變異、職業暴露、癥狀等因素,年度(或間隔更長時間)測量的肺功能變化超過15%被認為是額外的下降,具有臨床意義[22]。然而,肺功能的變化受到年齡、性別、基線肺功能和疾病嚴重程度等因素影響,來自健康群體的數據也難以準確反映特定疾病或條件下的情況,故上述參考值并不一定適用于隨訪間隔較短的慢性呼吸道疾病患者肺功能監測。因此,2021版推薦使用FEV1系數(FEV1 divided by the sex-specific 1st percentile values of the absolute FEV1 values,FEV1Q)評估肺功能的變化[23],即FEV1實測值除以在肺功能異常的成年人中性別特異性FEV1絕對值的第1百分位值,女性為0.4 L,男性為0.5 L。例如,1例70歲的女性,FEV1為0.9 L,則FEV1Q為0.9 L/0.4 L=2.25。在正常情況下,FEV1Q大約每18年會降低1個單位,而在吸煙者和老年人中大約每10年會降低1個單位。FEV1Q在短時間內應該保持穩定,如果出現變化,則可能提示肺功能的惡化。FEV1Q被證實在預測生存率、慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)急性加重和不良健康結局方面優于z值、FEV1預測百分比、FEV1·Ht-2和FEV1·Ht-3,并有助于區分老年人肺功能嚴重程度[23-25]。FEV1Q表示生存率與FEV1高于“生存底線”的程度有關,而非FEV1低于預測值的程度,越接近1提示預后越差。推薦將這個指標作為判讀成年人各項肺功能指標變化的方法,但不適用于兒童和青少年。
由于胸壁肌肉生理機能和認知發展的差異,兒童的肺功能測量比成人的變異更大。在兒童中使用的肺功能重復性評估標準一般都是從成人研究中推斷而來,并未考慮兒童的獨特發育情況(如軀干長度和肺的發育并非總是同步的)。2021版基于最近的一個研究[26]推薦條件變化分數可用于評估兒童肺功能的變化,具體公式如下:條件變化分數=[zFEV1t2?(r×zFEV1t1)]/,zFEV1t1、zFEV1t2分別是在初始(t1)和第二個時間點(t2)的z值,r=0.642?0.04×時間(年)+0.020×年齡(年)(t1時)。條件變化分數在(?1.96,1.96)內被視為在正常范圍。例如,1例170 cm的14歲男性肺功能在3個月內(r=0.907)從z值?0.78(90.6%預測值)下降至z值?1.60(80.6%預測值),其相應的變化評分為?2.12,超出正常范圍;而4年內出現相同的下降(r=0.769),對應的變化分數為?1.56,則在正常變異范圍內。這一概念尚未推廣到成人群體或應用到其他肺功能指標中,有待進一步研究。
點評:我國目前有關不同年齡層、不同健康狀態下個體肺功能指標隨時間自然變化的數據還很少,有必要建立相應的大型隊列人群,觀察個體肺功能的縱向變化,為更深刻理解肺功能的演變及確定疾病相關閾值提供參考。2021版推薦條件變化分數和FEV1Q分別評估兒童與成人肺功能的自然變化,前者要基于兩次FEV1、z、r值計算,較為繁瑣,不便在臨床推廣應用;后者計算簡單,易于理解,可考慮在中國人群中探索其適用性。
3 支氣管舒張劑反應性試驗
支氣管舒張劑反應性(bronchodilator responsiveness,BDR)試驗,即臨床常用的“支氣管舒張試驗”,用于評估吸入支氣管舒張劑后呼吸功能的變化,其代表氣道上皮、神經、介質和氣道平滑肌的綜合生理反應。既往曾使用“可逆性測試”的概念,提示使用支氣管舒張劑后氣流阻塞可能完全恢復;但為避免兩者混淆,現推薦使用BDR試驗的概念[27]。2005版推薦的BDR陽性標準為FEV1和/或FVC增加≥200 mL且≥12%,該標準的主要局限性在于,FEV1和FVC的絕對和相對變化與基線肺功能成反比,并與身高、年齡和性別相關,這些因素均會影響識別BDR的準確性。2021版基于Tan等[28]和Quanjer等[29]研究,更新BDR陽性標準為相對于個人FEV1或FVC預測值>10%的變化,這種方法避免了基線肺功能水平不同導致的誤判,而且最大程度減少了身高和性別的影響。例如,1例50歲男性,身高165 cm,使用支氣管舒張劑前FEV1為2.0 L,使用支氣管舒張劑后FEV1為2.4 L,FEV1預測值為3.2 L。BDR=(2.4?2.0)×100%/3.2=12.5%,BDR>10%,因此該患者BDR為陽性。同時,判讀指南指出,應避免過度依賴BDR的嚴格臨界值,因為這些臨界值與正常值范圍一樣存在局限性。
點評:我國廣泛使用2005版BDR陽性標準[20],但目前有關2021版BDR標準的臨床研究數量尚少,尤其在兒童和年輕人群中的數據有限。我國二級以上醫院已普遍開展支氣管舒張試驗,獲取大樣本數據具有可行性,可在不同年齡段比較不同標準的差異,并對不同疾病狀態(哮喘、慢阻肺)和不同嚴重程度(輕、中、重等)的反應特征乃至臨床預后(急性加重頻率、住院等)做進一步分析,探索更適合中國人的標準。
4 肺生理功能障礙分類和嚴重程度評估
4.1 肺功能障礙分類
肺生理功能障礙通常分為阻塞性、限制性和彌散功能障礙。2005年、2019年ATS/ERS肺功能指南對阻塞性通氣障礙的定義是FEV1/FVC(或FEV1/VC)低于LLN,而全球慢性阻塞性肺疾病倡議[30]和ATS/ERS COPD指南[31]則使用FEV1/FVC固定值0.7來判斷阻塞性通氣障礙。2005版推薦FEV1/VC替代FEV1/FVC診斷氣流阻塞,但鑒于FEV1/VC相比FEV1/FVC缺乏可靠的參考方程,可能增加診斷的不確定性,因此2021版仍推薦使用FEV1/FVC。限制性通氣障礙定義為肺容量的減少,典型特征是TLC低于LLN。混合性通氣障礙的特點是阻塞和限制并存,FEV1/FVC和TLC均低于LLN。而彌散功能通常通過DLCO來評估。2005版、2021版在肺功能障礙分類方面(包括上氣道阻塞、大氣道阻塞)總體變化不大,本文不再贅述,重點關注以下幾種通氣功能障礙。
4.1.1 小氣道功能障礙
2021版指出,由于呼氣中期流量指標(如FEF25%-75%)變異性高,重復性差,對診斷小氣道疾病缺乏特異性,且與FEV1、FVC和FEV1/FVC比較沒有額外的診斷價值,故未推薦作為日常使用指標[32]。但最近來自1個大型隊列研究的報道顯示[33],較低的FEF25-75%與COPD嚴重性相關,影像學表現為功能性小氣道疾病、肺氣腫、殘余容積、總肺容量等增加,臨床表現為癥狀增多、6分鐘步行距離降低及BDR增加。另1個指標FEV3/FEV6被認為可識別吸煙者早期氣道病變,識別出那些有可能在未來發展為COPD和急性加重的人群[34]。此外,強迫振蕩技術和多次呼吸氮氣沖洗也可能發現早期氣道阻塞[35]。
點評:小氣道功能是反映氣道疾病更早期、更敏感的指標,因而其特異性稍差也可接受。針對小氣道功能的變化,應做長期觀察以更深入發現其特征和臨床意義。我國的肺功能檢查指南[5]及報告格式規范[5]都特別說明了此點,建議繼續保留該指標并加以深入研究。
4.1.2 低1秒率
即FEV1/FVC低于LLN,但FEV1和FVC正常。1974年,Green等[36]將肺容積大小和氣道管徑之間的不成比例增長稱為“失適應生長”,他們發現肺容積相似的正常受試者最大呼氣流量差異很大。目前低1秒率的確切意義尚未完全清楚,有可能是一種正常的生理變異,更常見于女性和肥胖的兒童;也可能是異常的肺功能障礙,與疾病臨床預后和COPD的發生有關[37-39]。
4.1.3 非特異性通氣功能障礙
FVC和/或FEV1降低,FEV1/FVC和TLC正常稱為非特異性通氣功能障礙。2005版指出這種類型障礙與氣流阻塞/塌陷有關,2021版則認為可能與吸氣/呼氣努力不足有關,可通過流量-容積曲線、時間-容量曲線協助判斷是否存在呼吸努力不足;也可能與早期限制性通氣障礙有關,此時FVC降低,但RV未降低;還可能是早期氣流阻塞的表現,小氣道塌陷可在FEV1/FVC比率下降之前降低FVC并增加RV。值得注意的是,凡是FVC降低,都應測量TLC以確認是否存在限制性通氣障礙。在基于人群的研究中,當TLC無法測定或未測定時,非特異性類型被定義為“保留比率受損肺功能”(preserved ratio impaired spirometry,PRISm),該類型被證實在吸煙人群中非常普遍,且會隨著時間的推移轉變為其他肺功能類型,并與死亡率增加有關[40-42]。大型COPD隊列研究顯示,被診斷PRISm的受試者在5年隨訪后,有22.2%轉變為GOLD 0級(FEV1/FVC>0.7及FEV1%pred>80%),25.1%進展為《全球慢性阻塞性肺疾病倡議》定義的1~4級[42]。
點評:在我國臨床實踐中非特異性通氣功能障礙是指FEV1降低,FEV1/FVC和FVC正常。FVC用肺量計檢查即可獲得,而TLC必須用儀器構造復雜、價格較為昂貴的體積描記儀或結合氣體分析儀才能檢測,可提供更精準的呼吸生理分析,但臨床推廣受限。FVC或TLC兩種評估方法都可推薦,由各地根據臨床實際情況選擇和加以說明。此外,PRISm在臨床實際中較為常見,可能代表了一個重要的異質性群體,有必要在中國人群進一步研究其縱向進展。
4.1.4 簡單、復雜限制性通氣功能障礙
肺量計檢查只能提示存在限制性通氣功能障礙,必須通過肺容量檢查加以證實。在大多數情況下,FEV1、FVC和TLC通常以大致相同的比例降低,被稱為簡單限制性通氣功能障礙。然而,部分人群的FVC與TLC降低不成比例,RV不成比例地升高,這種類型被稱為復雜限制性通氣功能障礙,與神經肌肉疾病、胸壁限制或伴有氣體潴留的隱匿性阻塞等導致的肺排空障礙有關。
4.2 肺功能障礙嚴重程度評估
2005版推薦使用FEV1占預計值百分比對阻塞性或限制性肺功能障礙嚴重程度進行分級:輕度:>70%;中度:60%~69%;中重度:50%~59%;重度:35%~49%;極重度:<35%。DLCO分級也是采取占預計值百分比的方法:輕度:>60%且<LLN;中度:40%~60%;重度:<40%。然而,使用預測值百分比并不能對不同年齡層進行統一分級[43],因此2021版推薦所有測量指標均采用z值代替FEV1預計值%評估肺功能嚴重程度,以避免性別、身高、年齡和種族差異引起的差異[44],截斷值分別為?2、?2.5、?3和?4。由于z值在?1.65~?2.5之間的個體在死亡風險方面幾乎沒有差異,因此被合并為“輕度組”;z值在?2.51和?4之間的個體均與中等的死亡風險相關,因此合并到“中度組”,即:z值>?1.645為正常,?1.65~?2.5為輕度,?2.51~?4為中度,<?4.1為重度。患者FEV1、FVC、DLCO的z值絕對值越大,全因死亡風險越高[45]。2021年版還對比了同一個體采用兩種方法的情況,發現老年人差異最大。例如1例80歲老人FEV1的z值正常,但使用FEV1占預計值%則被認為有輕度肺功能障礙。
點評:目前國人對z值尚缺乏足夠了解,未在臨床實踐中普遍采用,對此指標的認識及其臨床意義的優劣仍需進一步闡明[46],建議目前我國可同步使用兩種方法,進而開展后續評估。
5 2021版其他建議
2021版還提出以下建議:① 在精準醫學和新型預測工具時代,開發更精細的診斷模型,更準確、更早期識別肺功能降低的決定因素;② 將基于人工智能/機器學習的軟件用于PFT判讀,將提供更準確和標準化的解釋,并作為強大的決策支持工具來改善臨床實踐[47-48],還有助于對正常肺功能進行個性化、無偏倚的預測;③ 不能簡單地根據結果是否在正常范圍內,而應根據臨床風險和觀察到的臨床結果為肺功能指標設定臨床決策閾值;④ 臨床醫生應該向受試者解釋PFT結果及這些結果如何用于指導決策。
點評:國內Wang等[49]構建的人工智能模型對正常、阻塞、限制、混合等通氣功能障礙的類型進行識別判斷,平均準確率達95.6%,對上氣道阻塞的識別準確度達81.3%[50],還可識別高位小平臺,準確度達95.2%[51],展現了人工智能在PFT判讀方面的巨大潛力,可繼續深入相關研究。
總之,2021年ERS/ATS發布的PFT判讀指南更新要點總結見表1,但部分建議不一定適合我國,需要結合中國實際情況進行分析和借鑒。

肺功能檢查(pulmonary function test,PFT)是評估呼吸功能的重要手段,通過檢測呼吸氣體流量、容積等指標反映受檢者的呼吸生理特性,對于篩查早期氣道病變、鑒別呼吸困難原因、評估肺部疾病嚴重程度及預后、判斷藥物或其他治療方法的療效、評估外科患者對手術的耐受性等方面有重要的價值。為提高PFT的依從性、檢查質量和臨床可比性,國內外陸續發布和更新了一系列PFT的技術標準規范[1-11]。但在嚴格技術質量控制的基礎上,正確判讀PFT同樣重要,如何選擇恰當的預計值方程和正常范圍,還應結合個人的病史和暴露史,考慮肺功能測量固有的生物變異性及隨時間變化的變化。
2005年美國胸科學會(American Thoracic Society,ATS)和歐洲呼吸協會(European Respiratory Society,ERS)共同發布了PFT的判讀指南[12](以下簡稱“2005版”),2019年ATS推薦采用標準化PFT報告[13],2021年ERS/ATS更新了PFT判讀指南[14](以下簡稱“2021版”)。對比2005版,2021版更加強調判讀的審慎性,即不能單純以閾值評估異常與否,要充分考慮受檢者個體特征、疾病狀態及參考人群、結果代表性等諸多因素。與ERS/ATS劃分獨立的PFT質控指南和判讀指南不同,我國為臨床易于理解和推廣應用,將PFT判讀方法整合到各項檢查指南[5-11]和報告規范[15]中。為及時了解和借鑒2021版更新內容,本文將重點對其在肺功能預計值方程與正常范圍、肺功能隨時間的自然變化、支氣管舒張劑反應性試驗、肺生理功能障礙分類及肺功能障礙嚴重程度評估等方面更新內容進行介紹。同時結合我國實際情況給予點評或建議,以期加深和提高臨床醫師和相關從業人員對PFT的認識和理解,為今后我國標準化PFT應用和指南更新提供參考。
1 全球肺功能倡議預計值方程與正常范圍
1.1 全球肺功能倡議預計值方程
選擇合適的預計值方程是正確解讀肺功能結果的前提。肺功能受到年齡、身高、性別、種族、環境等多種因素影響,尚無適用于所有人群的單一預計值方程,而應盡量選取相似人群的方程。PFT報告和研究出版物必須注明所使用的參考方程。2021版特別指出,雖然應尊重性別認同,但使用生物性別將更準確預測肺功能;性別確認激素療法對肺功能的影響知之甚少,目前尚不清楚針對跨性別個體的適當參考方程。2005版推薦北美人群使用第3次全國健康和營養調查的肺量計方程,但未對歐洲和其他地方使用何種預計值方程提出明確建議。2021版推薦使用全球肺功能倡議(global lung function initiative,GLI)方程是迄今為止應用最普遍的預計方程,包括肺量計方程[16]、一氧化碳肺彌散量(diffusing capacity of the lung for carbon monoxide,DLCO)方程[17]和肺容量方程[18]。GLI肺量計方程原始數據來自33個國家3~95歲的97 759例受試者,推導方程可用于白種人、非裔美國人、東北亞人和東南亞人4個群體。對于種族不在以上4個群體或具有混合種族血統的個體,可使用上述群體平均值調整后的綜合方程。由于缺乏其他種族的資料,GLI的DLCO方程和肺容量方程主要基于歐洲血統個體的數據。
點評:盡管2021版推薦全球普遍采用GLI預計值,但由于我國國土幅員遼闊,橫跨GLI所定義的東北亞及東南亞地域(依秦嶺和淮河劃分),中國人采用兩個不同地域的公式并不合適,特別是在橫跨上述分界的區域或采用統一方案的全國多中心研究等情況下更易引起混亂,不建議采用。我國于2017年更新了基于全國6大行政區域7 115例4~80歲人群的肺量計正常預計值[19],更適合中國人的肺功能結果判讀。
1.2 參考人群正常范圍
健康人群的正常范圍為預計值的95%可信區間。對于多數肺功能指標如用力肺活量(forced vital capacity,FVC)、第一秒用力呼氣容積(forced expiratory volume in 1 s,FEV1)等,低值為異常值,即<第5百分位數,用正常值下限(lower limit of normal,LLN)表示;少部分指標如肺總量(total lung capacity,TLC)、殘氣量(residual volume,RV)等,過低、過高均為異常,即<LLN及>正常值上限(upper limit of normal,ULN)。2005版和2021版均推薦使用LLN來判讀肺功能結果是否在正常范圍之內,不建議使用簡化的固定閾值(如FVC或FEV1<80%預計值、FEV1/FVC<0.70)來判斷異常,因為上述固定閾值多基于青年和中年人群的數據,沒有充分考慮年齡相關的測量變異,會增加兒童、老年人或較矮的成年人異常的假陰性或假陽性的概率,甚至誤診率超過20%[20]。例如,22歲男性FEV1的LLN對應81.1%預計值,同樣身高的85歲男性則為67.9%,如果均以80%作為標準,則會引起誤判。值得注意的是,對于接近LLN的結果,應結合患者的病史、體格檢查和驗前概率進行謹慎解讀。
點評:目前我國常用固定閾值法進行臨床判斷,操作簡單易行,對基層醫療機構更為適用,但對于三級醫院等高水平醫院或研究型醫院而言,采用LLN和ULN可更準確理解呼吸生理及符合臨床變化,建議推行。
2 肺功能隨時間的自然變化
PFT的正確判讀需要了解PFT的重復性和隨時間的自然變化。當肺功能變化值大于測試的生物變異性和測量誤差時,變化才可能有意義,才可用于指導臨床決策。在25歲以上成年人中,健康非吸煙者FEV1通常下降值為30 mL/年[21];在職業環境的研究中,綜合考慮測試變異、職業暴露、癥狀等因素,年度(或間隔更長時間)測量的肺功能變化超過15%被認為是額外的下降,具有臨床意義[22]。然而,肺功能的變化受到年齡、性別、基線肺功能和疾病嚴重程度等因素影響,來自健康群體的數據也難以準確反映特定疾病或條件下的情況,故上述參考值并不一定適用于隨訪間隔較短的慢性呼吸道疾病患者肺功能監測。因此,2021版推薦使用FEV1系數(FEV1 divided by the sex-specific 1st percentile values of the absolute FEV1 values,FEV1Q)評估肺功能的變化[23],即FEV1實測值除以在肺功能異常的成年人中性別特異性FEV1絕對值的第1百分位值,女性為0.4 L,男性為0.5 L。例如,1例70歲的女性,FEV1為0.9 L,則FEV1Q為0.9 L/0.4 L=2.25。在正常情況下,FEV1Q大約每18年會降低1個單位,而在吸煙者和老年人中大約每10年會降低1個單位。FEV1Q在短時間內應該保持穩定,如果出現變化,則可能提示肺功能的惡化。FEV1Q被證實在預測生存率、慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)急性加重和不良健康結局方面優于z值、FEV1預測百分比、FEV1·Ht-2和FEV1·Ht-3,并有助于區分老年人肺功能嚴重程度[23-25]。FEV1Q表示生存率與FEV1高于“生存底線”的程度有關,而非FEV1低于預測值的程度,越接近1提示預后越差。推薦將這個指標作為判讀成年人各項肺功能指標變化的方法,但不適用于兒童和青少年。
由于胸壁肌肉生理機能和認知發展的差異,兒童的肺功能測量比成人的變異更大。在兒童中使用的肺功能重復性評估標準一般都是從成人研究中推斷而來,并未考慮兒童的獨特發育情況(如軀干長度和肺的發育并非總是同步的)。2021版基于最近的一個研究[26]推薦條件變化分數可用于評估兒童肺功能的變化,具體公式如下:條件變化分數=[zFEV1t2?(r×zFEV1t1)]/,zFEV1t1、zFEV1t2分別是在初始(t1)和第二個時間點(t2)的z值,r=0.642?0.04×時間(年)+0.020×年齡(年)(t1時)。條件變化分數在(?1.96,1.96)內被視為在正常范圍。例如,1例170 cm的14歲男性肺功能在3個月內(r=0.907)從z值?0.78(90.6%預測值)下降至z值?1.60(80.6%預測值),其相應的變化評分為?2.12,超出正常范圍;而4年內出現相同的下降(r=0.769),對應的變化分數為?1.56,則在正常變異范圍內。這一概念尚未推廣到成人群體或應用到其他肺功能指標中,有待進一步研究。
點評:我國目前有關不同年齡層、不同健康狀態下個體肺功能指標隨時間自然變化的數據還很少,有必要建立相應的大型隊列人群,觀察個體肺功能的縱向變化,為更深刻理解肺功能的演變及確定疾病相關閾值提供參考。2021版推薦條件變化分數和FEV1Q分別評估兒童與成人肺功能的自然變化,前者要基于兩次FEV1、z、r值計算,較為繁瑣,不便在臨床推廣應用;后者計算簡單,易于理解,可考慮在中國人群中探索其適用性。
3 支氣管舒張劑反應性試驗
支氣管舒張劑反應性(bronchodilator responsiveness,BDR)試驗,即臨床常用的“支氣管舒張試驗”,用于評估吸入支氣管舒張劑后呼吸功能的變化,其代表氣道上皮、神經、介質和氣道平滑肌的綜合生理反應。既往曾使用“可逆性測試”的概念,提示使用支氣管舒張劑后氣流阻塞可能完全恢復;但為避免兩者混淆,現推薦使用BDR試驗的概念[27]。2005版推薦的BDR陽性標準為FEV1和/或FVC增加≥200 mL且≥12%,該標準的主要局限性在于,FEV1和FVC的絕對和相對變化與基線肺功能成反比,并與身高、年齡和性別相關,這些因素均會影響識別BDR的準確性。2021版基于Tan等[28]和Quanjer等[29]研究,更新BDR陽性標準為相對于個人FEV1或FVC預測值>10%的變化,這種方法避免了基線肺功能水平不同導致的誤判,而且最大程度減少了身高和性別的影響。例如,1例50歲男性,身高165 cm,使用支氣管舒張劑前FEV1為2.0 L,使用支氣管舒張劑后FEV1為2.4 L,FEV1預測值為3.2 L。BDR=(2.4?2.0)×100%/3.2=12.5%,BDR>10%,因此該患者BDR為陽性。同時,判讀指南指出,應避免過度依賴BDR的嚴格臨界值,因為這些臨界值與正常值范圍一樣存在局限性。
點評:我國廣泛使用2005版BDR陽性標準[20],但目前有關2021版BDR標準的臨床研究數量尚少,尤其在兒童和年輕人群中的數據有限。我國二級以上醫院已普遍開展支氣管舒張試驗,獲取大樣本數據具有可行性,可在不同年齡段比較不同標準的差異,并對不同疾病狀態(哮喘、慢阻肺)和不同嚴重程度(輕、中、重等)的反應特征乃至臨床預后(急性加重頻率、住院等)做進一步分析,探索更適合中國人的標準。
4 肺生理功能障礙分類和嚴重程度評估
4.1 肺功能障礙分類
肺生理功能障礙通常分為阻塞性、限制性和彌散功能障礙。2005年、2019年ATS/ERS肺功能指南對阻塞性通氣障礙的定義是FEV1/FVC(或FEV1/VC)低于LLN,而全球慢性阻塞性肺疾病倡議[30]和ATS/ERS COPD指南[31]則使用FEV1/FVC固定值0.7來判斷阻塞性通氣障礙。2005版推薦FEV1/VC替代FEV1/FVC診斷氣流阻塞,但鑒于FEV1/VC相比FEV1/FVC缺乏可靠的參考方程,可能增加診斷的不確定性,因此2021版仍推薦使用FEV1/FVC。限制性通氣障礙定義為肺容量的減少,典型特征是TLC低于LLN。混合性通氣障礙的特點是阻塞和限制并存,FEV1/FVC和TLC均低于LLN。而彌散功能通常通過DLCO來評估。2005版、2021版在肺功能障礙分類方面(包括上氣道阻塞、大氣道阻塞)總體變化不大,本文不再贅述,重點關注以下幾種通氣功能障礙。
4.1.1 小氣道功能障礙
2021版指出,由于呼氣中期流量指標(如FEF25%-75%)變異性高,重復性差,對診斷小氣道疾病缺乏特異性,且與FEV1、FVC和FEV1/FVC比較沒有額外的診斷價值,故未推薦作為日常使用指標[32]。但最近來自1個大型隊列研究的報道顯示[33],較低的FEF25-75%與COPD嚴重性相關,影像學表現為功能性小氣道疾病、肺氣腫、殘余容積、總肺容量等增加,臨床表現為癥狀增多、6分鐘步行距離降低及BDR增加。另1個指標FEV3/FEV6被認為可識別吸煙者早期氣道病變,識別出那些有可能在未來發展為COPD和急性加重的人群[34]。此外,強迫振蕩技術和多次呼吸氮氣沖洗也可能發現早期氣道阻塞[35]。
點評:小氣道功能是反映氣道疾病更早期、更敏感的指標,因而其特異性稍差也可接受。針對小氣道功能的變化,應做長期觀察以更深入發現其特征和臨床意義。我國的肺功能檢查指南[5]及報告格式規范[5]都特別說明了此點,建議繼續保留該指標并加以深入研究。
4.1.2 低1秒率
即FEV1/FVC低于LLN,但FEV1和FVC正常。1974年,Green等[36]將肺容積大小和氣道管徑之間的不成比例增長稱為“失適應生長”,他們發現肺容積相似的正常受試者最大呼氣流量差異很大。目前低1秒率的確切意義尚未完全清楚,有可能是一種正常的生理變異,更常見于女性和肥胖的兒童;也可能是異常的肺功能障礙,與疾病臨床預后和COPD的發生有關[37-39]。
4.1.3 非特異性通氣功能障礙
FVC和/或FEV1降低,FEV1/FVC和TLC正常稱為非特異性通氣功能障礙。2005版指出這種類型障礙與氣流阻塞/塌陷有關,2021版則認為可能與吸氣/呼氣努力不足有關,可通過流量-容積曲線、時間-容量曲線協助判斷是否存在呼吸努力不足;也可能與早期限制性通氣障礙有關,此時FVC降低,但RV未降低;還可能是早期氣流阻塞的表現,小氣道塌陷可在FEV1/FVC比率下降之前降低FVC并增加RV。值得注意的是,凡是FVC降低,都應測量TLC以確認是否存在限制性通氣障礙。在基于人群的研究中,當TLC無法測定或未測定時,非特異性類型被定義為“保留比率受損肺功能”(preserved ratio impaired spirometry,PRISm),該類型被證實在吸煙人群中非常普遍,且會隨著時間的推移轉變為其他肺功能類型,并與死亡率增加有關[40-42]。大型COPD隊列研究顯示,被診斷PRISm的受試者在5年隨訪后,有22.2%轉變為GOLD 0級(FEV1/FVC>0.7及FEV1%pred>80%),25.1%進展為《全球慢性阻塞性肺疾病倡議》定義的1~4級[42]。
點評:在我國臨床實踐中非特異性通氣功能障礙是指FEV1降低,FEV1/FVC和FVC正常。FVC用肺量計檢查即可獲得,而TLC必須用儀器構造復雜、價格較為昂貴的體積描記儀或結合氣體分析儀才能檢測,可提供更精準的呼吸生理分析,但臨床推廣受限。FVC或TLC兩種評估方法都可推薦,由各地根據臨床實際情況選擇和加以說明。此外,PRISm在臨床實際中較為常見,可能代表了一個重要的異質性群體,有必要在中國人群進一步研究其縱向進展。
4.1.4 簡單、復雜限制性通氣功能障礙
肺量計檢查只能提示存在限制性通氣功能障礙,必須通過肺容量檢查加以證實。在大多數情況下,FEV1、FVC和TLC通常以大致相同的比例降低,被稱為簡單限制性通氣功能障礙。然而,部分人群的FVC與TLC降低不成比例,RV不成比例地升高,這種類型被稱為復雜限制性通氣功能障礙,與神經肌肉疾病、胸壁限制或伴有氣體潴留的隱匿性阻塞等導致的肺排空障礙有關。
4.2 肺功能障礙嚴重程度評估
2005版推薦使用FEV1占預計值百分比對阻塞性或限制性肺功能障礙嚴重程度進行分級:輕度:>70%;中度:60%~69%;中重度:50%~59%;重度:35%~49%;極重度:<35%。DLCO分級也是采取占預計值百分比的方法:輕度:>60%且<LLN;中度:40%~60%;重度:<40%。然而,使用預測值百分比并不能對不同年齡層進行統一分級[43],因此2021版推薦所有測量指標均采用z值代替FEV1預計值%評估肺功能嚴重程度,以避免性別、身高、年齡和種族差異引起的差異[44],截斷值分別為?2、?2.5、?3和?4。由于z值在?1.65~?2.5之間的個體在死亡風險方面幾乎沒有差異,因此被合并為“輕度組”;z值在?2.51和?4之間的個體均與中等的死亡風險相關,因此合并到“中度組”,即:z值>?1.645為正常,?1.65~?2.5為輕度,?2.51~?4為中度,<?4.1為重度。患者FEV1、FVC、DLCO的z值絕對值越大,全因死亡風險越高[45]。2021年版還對比了同一個體采用兩種方法的情況,發現老年人差異最大。例如1例80歲老人FEV1的z值正常,但使用FEV1占預計值%則被認為有輕度肺功能障礙。
點評:目前國人對z值尚缺乏足夠了解,未在臨床實踐中普遍采用,對此指標的認識及其臨床意義的優劣仍需進一步闡明[46],建議目前我國可同步使用兩種方法,進而開展后續評估。
5 2021版其他建議
2021版還提出以下建議:① 在精準醫學和新型預測工具時代,開發更精細的診斷模型,更準確、更早期識別肺功能降低的決定因素;② 將基于人工智能/機器學習的軟件用于PFT判讀,將提供更準確和標準化的解釋,并作為強大的決策支持工具來改善臨床實踐[47-48],還有助于對正常肺功能進行個性化、無偏倚的預測;③ 不能簡單地根據結果是否在正常范圍內,而應根據臨床風險和觀察到的臨床結果為肺功能指標設定臨床決策閾值;④ 臨床醫生應該向受試者解釋PFT結果及這些結果如何用于指導決策。
點評:國內Wang等[49]構建的人工智能模型對正常、阻塞、限制、混合等通氣功能障礙的類型進行識別判斷,平均準確率達95.6%,對上氣道阻塞的識別準確度達81.3%[50],還可識別高位小平臺,準確度達95.2%[51],展現了人工智能在PFT判讀方面的巨大潛力,可繼續深入相關研究。
總之,2021年ERS/ATS發布的PFT判讀指南更新要點總結見表1,但部分建議不一定適合我國,需要結合中國實際情況進行分析和借鑒。
