呼吸困難是急性心力衰竭綜合征(acute heart failure syndromes,AHFS)患者最常見的癥狀,緩解呼吸困難是臨床實踐、臨床試驗和新藥審批中須關注的重要目標。然而,在臨床和科研中,如何評估呼吸困難依然沒有形成共識,目前尚缺乏統一的測量方法。本文將從急性心力衰竭呼吸困難的病理生理學機制、呼吸困難測量時間、測量時患者的體位、測量條件、臨床試驗中常見的呼吸困難測量方法及其優缺點等方面進行討論,為急性心力衰竭臨床試驗中呼吸困難的測量方法選擇提供參考。
引用本文: 張晶晶, 劉巖, 張曉雨, 陳瑩, 商洪才. 急性心力衰竭臨床試驗中呼吸困難的測量方法. 中國循證醫學雜志, 2020, 20(11): 1334-1339. doi: 10.7507/1672-2531.202004180 復制
呼吸困難是急性心力衰竭綜合征(acute heart failure syndromes,AHFS)患者最常見的癥狀[1-3],通常是導致患者急診入院的主要原因,也是大多數急性干預措施所針對的目標結局指標。因此,研究者和監管機構,包括美國食品藥品管理局和歐洲藥品管理局,均將呼吸困難的改善作為急性心衰臨床試驗的一個關鍵指標[4, 5]。然而,目前無論在臨床實踐還是臨床研究中,仍然缺乏可靠的、標準的、可重復的呼吸困難評估工具,對于測量的時間、方法等,也沒有達成共識。那么在急性心衰臨床試驗中究竟如何衡量這一主觀癥狀的變化呢?本文將從急性心力衰竭呼吸困難的病理生理學機制、呼吸困難測量時間、測量時患者的體位、測量條件、臨床試驗中常見呼吸困難測量方法及其優缺點等方面進行介紹,為急性心力衰竭臨床試驗中呼吸困難的測量方法選擇提供參考。
1 急性心衰呼吸困難的病理生理學機制
美國胸科協會在 2012 年發布的呼吸困難專家共識中將呼吸困難定義為“呼吸不適的主觀體驗,由強度可變、性質不同的感覺組成,該體驗來源于多種生理、心理、社會和環境因素的相互作用,并可能引起繼發性生理和行為反應”[6],由于呼吸困難病因不同,每個個體表現也會不同。在歐洲、美國及中國的心衰指南中,急性心衰是指繼發于心臟功能異常,導致迅速發生或惡化的癥狀和體征,并伴有血漿利鈉肽水平的升高,既可是急性新發,也可表現為慢性心力衰竭急性失代償(如呼吸困難、疲乏和液體潴留等典型癥狀體征急性加重)[7-9],分為急性左心衰竭、右心衰竭和全心衰竭。其中,呼吸困難最常見于急性左心衰竭。急性左心衰時,肺毛細血管楔壓升高,首先出現肺循環淤血,嚴重時可出現肺水腫。肺淤血、肺水腫的共同表現是呼吸困難,為患者氣短及呼吸費力的主觀感覺,具有一定限制體力活動的保護意義,也是判斷肺淤血程度的指標。發生呼吸困難的基本機制主要包括以下幾方面:① 肺淤血、肺水腫導致肺順應性降低,要吸入同樣體積的空氣,需要增加呼吸肌做功,消耗更多的能量,故患者感到呼吸費力;② 支氣管黏膜充血、腫脹和氣道內分泌物導致氣道阻力增大;③ 肺毛細血管壓增高和間質水腫使肺間質壓力增高,刺激肺毛細血管旁 J 受體,引起反射性淺快呼吸[10]。而根據肺淤血和肺水腫的嚴重程度,呼吸困難可有勞力性呼吸困難、夜間陣發性呼吸困難、端坐呼吸等不同的表現形式。
2 急性心衰呼吸困難的評估
呼吸困難是患者對疾病的主觀體驗,因此大多數急性心衰臨床試驗依賴于患者對呼吸困難的自我評估。在評估時,需要將測量時的條件進行標準化,考慮患者所處生理狀態,即體位、休息或勞累、是否補給氧氣等,了解呼吸困難持續時間及改變的程度和速度、患者的心理狀態、體驗及期望,確定最佳的測量時間,以上可能有助于確保對呼吸困難進行更有力的評估。
2.1 評估對象
評估對象的呼吸困難應該是由心力衰竭引起而非慢性阻塞性肺氣腫和支氣管炎等其他原因,臨床試驗患者診斷標準中加入 B 型利鈉肽/N 末端 B 型利鈉肽原(BNP/NT-ProBNP)、肺部影像學證據、心衰相關的癥狀、體征等指標,有助于準確納入研究對象。心衰時,心臟負荷增加,心肌細胞合成并釋放 BNP/NT-ProBNP,而呼吸困難的程度也與心臟負荷成正相關,因此 BNP/NT-ProBNP 濃度可很好地鑒別心臟/非心臟原因引起的呼吸困難[11]。在以呼吸困難為主要評價指標的臨床試驗中,招募患者時可能會更看重呼吸困難的癥狀,從而忽略掉臨床癥狀表現為疲勞、虛弱等而非呼吸困難的心衰患者,或者為觀察患者早期呼吸困難對于療法的反應、縮短試驗登記與入院之間的時長而允許納入疑似急性心衰患者。此外,鑒于呼吸困難這一癥狀的主觀性質,研究對象要有自我評估呼吸困難的能力。
2.2 評估時間
測量呼吸困難的時間是至關重要的,因為盡管許多患者在早期治療干預后仍有癥狀,但通常早期治療與更大程度的呼吸困難緩解相關[12]。大多數的急性心衰臨床試驗在入院后測量呼吸困難[13-18],通常患者招募入組后在基線以及固定的時間點進行測量。然而在試驗中,患者登記時間常常與癥狀出現或者入院時間有一定時間差,據報道,多數的急性心衰臨床試驗在患者入院后的 24~48 小時登記[17],可能在基線測量之前已經有了一些治療,因此,在研究干預之前或者干預措施一起給予的所有療法的時間和劑量都應該被詳細記錄。事實上,呼吸困難通過常規療法已有了迅速且很大程度的改善,若要在采用新療法的臨床試驗中捕捉到有臨床意義的變化,只有一個很短的時間窗口,因此應該盡量在呼吸困難出現的早期進行測量,并清楚地記錄試驗干預時間和呼吸困難測量時間。另外,呼吸困難應重復評估,而評估之間的最佳間隔時間目前仍不確定,有學者建議在前 3 小時每 1 個小時進行一次評估,以確定治療的應答情況,然后在首次評估 6 小時后進行評估,此后每 6 小時進行一次評估,直到達到 24 小時,這個時間里醫生能夠識別治療的延遲反應和復發情況[19]。在固定時間點測量呼吸困難,可能無法捕獲到癥狀的波動過程,尤其是治療采用如阿片類等半衰期較短的藥物,呼吸困難可能會在藥效過后復發,此時曲線下面積法是一種有用的方法,可多次測量以構建平均反應[20]。
2.3 評估條件
患者在何種條件下進行呼吸困難的測量也是一個需要考慮的問題。對于大多數的急性心衰患者來說,靜息時已出現呼吸困難,平臥時加重,故需被迫采取端坐位或半臥位以減輕呼吸困難的程度,稱為“端坐呼吸”。這是因為坐位時下肢血液回流減少,肺淤血減輕,且膈肌下移,胸腔容積增大,肺活量增加,通氣改善[10]。如果兩例患者有同等程度的呼吸困難,而一例評估時處于坐位,且有高流量的吸氧,而另一例處于仰臥位且無氧氣補給,那么顯而易見他們的評估結果沒有可比性。同樣,一例患者在不同時間點的評估也應該處于相同的生理狀態下。在一個探索標準化測量方法的 URGENT—呼吸困難研究中,所有患者在基線和常規治療 6 小時后記錄坐位呼吸困難,癥狀較輕的患者再次進行仰臥位測量,結果發現,47% 的患者從坐位到仰臥位導致更嚴重的呼吸困難,坐位呼吸困難在接受 AHFS 常規治療后可迅速改善,而改變體位(坐位→仰臥位)導致的呼吸困難對治療的反應卻相對滯后[17]。因此在臨床試驗中,呼吸困難應該在標準環境下進行評估,包括從坐位有氧到仰臥位無氧,2008 年曾有國際共識小組提出一種誘發性呼吸困難評估(provocative dyspnoea assessment,PDA)方法[19],分別在坐位吸氧、坐位不吸氧、仰臥位不吸氧、50 米盡可能快速走、6 分鐘步行試驗等情況下進行評估(表 1)。PDA 在測量時,逐漸變換測量條件直到患者難以忍受,可結合呼吸困難嚴重程度的測量量表,如李克特量表或視覺模擬評分表(visual analogue scale,VAS)等,綜合進行呼吸困難評分。但此方法仍需方法學和統計學的驗證,然而在更好的方法出來以前,PDA 法不失為一個有力的參考。

3 急性心衰呼吸困難常用測量工具
在呼吸困難的測量中,治療前后的變化在 AHFS 試驗中很關鍵。評估癥狀的變化至少有兩種方法,一種是在基線和之后的每個時間點用同一種工具測量呼吸困難的嚴重程度,通過計算來推斷變化,常用的有李克特-5 點量表(Likert-5 point scale)和 VAS;另一種方法是治療后詢問患者呼吸困難程度相比基線是否有變化,常用的有李克特-7 點量表(Likert-7 point scale),在實際的臨床試驗中,多數選擇以上 2 種工具相結合進行測量。此外,還有上文中提到的 PDA 評估法與李克特量表或 VAS 結合形成的呼吸困難嚴重程度評分表(dyspnoea severity score,DSS)。下面將詳細介紹每種評估工具并分析其優缺點。
3.1 VAS
VAS 是一種主觀量化的癥狀評估工具,在 1921 年由 Hayes 和 Patterson 提出[21],如今在臨床上被廣泛應用于感覺或心情的描述和測量,尤其是在以疼痛為結局指標的研究中,VAS 被認為是測量疼痛最敏感和可靠的方法[22]。在評估呼吸困難時,VAS 在試驗預先設定的時間點測量患者呼吸困難的絕對值。如圖 1 所示,使用一條長 10 cm 或 100 mm 的游動標尺(或在紙上面劃一條 10 cm 或 100 mm 的橫線),0 的一端表示“沒有呼吸困難”,10 cm 或 100 mm 的一端表示“難以忍受的、最嚴重的呼吸困難”,臨床測量時,患者面對無刻度的一面,將游標(或在直線上做記號)放在最能代表當下呼吸困難程度的位置,醫生面對有刻度的一面,從起點至記號處的距離長度即為呼吸困難的絕對值,治療前后使用同樣的方法對呼吸困難做出評估,此法簡單易行,相對比較客觀、靈敏。在臨床研究中,為捕捉到療效的動態變化,也可通過計算 VAS 的曲線下面積(area under the curve,AUC)來評估呼吸困難的治療效果,例如在 RELAX-AHFS 研究中[13],采用 VAS 的 AUC 測量呼吸困難在治療第 5 天較基線的改變,研究結果表明重組型人松弛素 2(serelaxin)可顯著改善呼吸困難這一主要終點[448 mm×h,95%CI(120,775),P=0.007](圖 2)。橫軸為測量時間(h),縱軸為 VAS 相對基線距離的變化(mm),AUC=變化距離×時間(mm×h)。

評估時患者面對無刻度的一面,0 端為“無呼吸困難”,另一端則表示“難以忍受的、最嚴重的呼吸困難”。

治療組和對照組呼吸困難的改變通過 VAS 測量,并量化為從基線到治療第 5 天的曲線下面積,其中增加的值代表呼吸困難的改善。
在臨床研究中,判斷干預措施帶來的量表得分變化是否具有“臨床意義”至關重要。因此就有了“最小臨床顯著性差異(minimal clinically important difference,MCID)”這個概念,MCID 的主要功能是協助臨床及研究人員解釋評價工具得分變化或差異的意義[23]。目前對于急性心衰呼吸困難中 VAS 評分的 MCID 還未進行深入研究,目前僅檢索到兩個研究,一是 2004 年發表的一個前瞻性、觀察性研究中,74 例患者接受了評估,VAS 有臨床意義變化的平均值為 21.1 mm[95%CI(12.3,29.9)][24];另一個是 2017 年發表的一個對于 URGENT-呼吸困難研究的二次分析,結果表明,491 例患者接受評估,仰臥位和直立坐位的 VAS 的 MCID 分別為 14.5 mm 和 10.5 mm[25],然而對于 AHFS 呼吸困難 VAS 的 MCID 的確立仍需大型隨機對照試驗來完成。盡管作為 AHFS 臨床試驗中評估呼吸困難最常用的工具之一,VAS 也有它自身的缺陷,例如 VAS 評分很難進行個體間的比較,由于每個患者對呼吸困難的自我感覺不同導致一個患者的 100 分對于另一個患者來說可能只有 50 分;另外對于理解能力不足的患者或老年患者,由于不能很好地實施評價,結果可能會有一定偏差。
3.2 李克特-5 點量表
李克特量表是一種測量態度的工具,反應受試者對問卷中陳述的認同程度,是由美國社會心理學家 Likert 在 1932 年所建立,自誕生以來在調查研究中得到了廣泛的使用[26-28],臨床醫學中常用的有 5 點和 7 點量表。在急性心衰臨床試驗中,李克特-5 點量表可以評估患者在任何時間點呼吸困難的程度,一共分為五個選項:① 無氣短(short of breath,SOB);② 輕度 SOB;③ 中度 SOB;④ 重度 SOB;⑤ 極重度 SOB,研究人員在基線和試驗預先設計的時間點讓患者評估自己目前屬于哪一種狀態。與 VAS 評分一樣,李克特-5 點量表的可靠性體現在其易操作性、可重復性和跟隨時間變化的能力,然而,在捕捉呼吸困難隨體位變化方面,VAS 評分似乎更優越[12, 17]。并且,李克特-5 分量表的 MCID 至今未確立,在一項對于 URGENT-呼吸困難研究的二次分析中[25],研究者試圖確立李克特-5 點量表的 MCID,但最終無論是坐位還是仰臥位均未找到,可能的原因是李克特量表的這五項分類不能充分區分呼吸困難程度。另外一個有待解決的問題是李克特-5 點量表 2 個選項之間呼吸困難的差異是否恒定?即呼吸困難在輕、中度 SOB 之間的差異和重度、極重度 SOB 之間的差異是相同的嗎?如果沒有對這個問題的確切答案,就很難確保包括平均值、中位數和任何統計比較在內的計算是正確的。
3.3 李克特-7 點量表
除上文介紹的李克特-5 點量表外,7 點量表也是急性心衰臨床試驗中常用來評價呼吸困難的工具,不同的是,李克特-7 點量表著重評估患者較基線時呼吸困難的改善情況,而不是測量當下呼吸困難的狀態,具體分為 7 個選項:① 顯著改善;② 中度改善;③ 輕度改善;④ 無改善;⑤ 輕度惡化;⑥ 中度惡化;⑦ 明顯惡化。所以,李克特-7 點量表在基線測量時不能使用,只有在干預后的其他時間點詢問患者目前的癥狀跟基線比較是否改變。這種方法的主要優點是在評估時容易向患者解釋量表的內容,相對來說更好理解,而主要缺點為它對患者的記憶力是一大挑戰,患者往往會跟自己最嚴重時的癥狀進行比較而不是基線時的癥狀,尤其是在試驗后續的測量中,這個問題會變得更為明顯。此外,一些因素如高碳酸血癥、缺氧等可能會與患者的精神狀態相互作用,從而影響回答問題的能力,無法準確地與基線呼吸困難進行比較,于是許多學者更推薦使用 VAS 評分或李克特-5 點量表,或者建議李克特-7 點量表與上述一種或兩種工具結合使用。過去有研究表明,在用這三種工具同時測量呼吸困難時,李克特-5 點量表與 VAS 評分之間存在顯著的相關性,但二者與李克特-7 點量表之間的一致性較差[17]。
3.4 DSS
由于目前缺乏標準化的呼吸困難測量工具,有研究者提出了 DSS[19],即 PDA 法結合李克特量表或者 VAS 評分,以評估患者呼吸困難的嚴重程度,要求患者分別在坐位吸氧、坐位不吸氧、仰臥位不吸氧、50 米盡可能快走、6 分鐘步行試驗的情況下結合李克特-5 點量表(或 VAS、李克特其他量表)為自己呼吸困難嚴重程度進行評分,如表 2 所示。然而,DSS 至今未得到統計學和方法學上的驗證,且缺乏 MCID,但它試圖提供一個統一的、結合體位、吸氧等因素的評估方法。研究者表明該量表的進一步改進可能會納入血氧飽和度、呼吸頻率等客觀指標的測量結果,作為支持患者自我評估的客觀手段[29]。

4 總結
呼吸困難是急性心力衰竭最常見的癥狀,常常為患者帶來巨大的痛苦,也是目前大多數心力衰竭臨床試驗所針對的治療目標,然而對于呼吸困難測量的時間、患者的體位及測量的條件和測量工具卻仍然沒有被標準化。我們認為,測量呼吸困難的時機至關重要,應該在患者癥狀表現早期就有針對性的評估,以便測量與最嚴重狀態的最大差異,從而在時間上為展示新療法的有效性提供機會,另外試驗中也要盡量標準化患者體位及測量條件(表 1),以更好地捕捉到呼吸困難的變化,這種標準化也將促進研究之間進行比較。最后,對于呼吸困難的測量工具,我們介紹了 VAS 評分、李克特-5 點量表、李克特-7 點量表、DSS 評分,優先推薦采用前兩種評估方法,李克特-7 點量表在使用時最好與 VAS 評分或李克特-5 點量表結合使用,DSS 評分是第一個正在研究的標準化的評分系統,能對呼吸困難提供更詳細和一致的評估,能更好地顯示呼吸困難隨時間和治療的變化,但此方法仍需要進一步驗證。對測量工具 MCID 的研究也需要更深層次的探討。
呼吸困難是急性心力衰竭綜合征(acute heart failure syndromes,AHFS)患者最常見的癥狀[1-3],通常是導致患者急診入院的主要原因,也是大多數急性干預措施所針對的目標結局指標。因此,研究者和監管機構,包括美國食品藥品管理局和歐洲藥品管理局,均將呼吸困難的改善作為急性心衰臨床試驗的一個關鍵指標[4, 5]。然而,目前無論在臨床實踐還是臨床研究中,仍然缺乏可靠的、標準的、可重復的呼吸困難評估工具,對于測量的時間、方法等,也沒有達成共識。那么在急性心衰臨床試驗中究竟如何衡量這一主觀癥狀的變化呢?本文將從急性心力衰竭呼吸困難的病理生理學機制、呼吸困難測量時間、測量時患者的體位、測量條件、臨床試驗中常見呼吸困難測量方法及其優缺點等方面進行介紹,為急性心力衰竭臨床試驗中呼吸困難的測量方法選擇提供參考。
1 急性心衰呼吸困難的病理生理學機制
美國胸科協會在 2012 年發布的呼吸困難專家共識中將呼吸困難定義為“呼吸不適的主觀體驗,由強度可變、性質不同的感覺組成,該體驗來源于多種生理、心理、社會和環境因素的相互作用,并可能引起繼發性生理和行為反應”[6],由于呼吸困難病因不同,每個個體表現也會不同。在歐洲、美國及中國的心衰指南中,急性心衰是指繼發于心臟功能異常,導致迅速發生或惡化的癥狀和體征,并伴有血漿利鈉肽水平的升高,既可是急性新發,也可表現為慢性心力衰竭急性失代償(如呼吸困難、疲乏和液體潴留等典型癥狀體征急性加重)[7-9],分為急性左心衰竭、右心衰竭和全心衰竭。其中,呼吸困難最常見于急性左心衰竭。急性左心衰時,肺毛細血管楔壓升高,首先出現肺循環淤血,嚴重時可出現肺水腫。肺淤血、肺水腫的共同表現是呼吸困難,為患者氣短及呼吸費力的主觀感覺,具有一定限制體力活動的保護意義,也是判斷肺淤血程度的指標。發生呼吸困難的基本機制主要包括以下幾方面:① 肺淤血、肺水腫導致肺順應性降低,要吸入同樣體積的空氣,需要增加呼吸肌做功,消耗更多的能量,故患者感到呼吸費力;② 支氣管黏膜充血、腫脹和氣道內分泌物導致氣道阻力增大;③ 肺毛細血管壓增高和間質水腫使肺間質壓力增高,刺激肺毛細血管旁 J 受體,引起反射性淺快呼吸[10]。而根據肺淤血和肺水腫的嚴重程度,呼吸困難可有勞力性呼吸困難、夜間陣發性呼吸困難、端坐呼吸等不同的表現形式。
2 急性心衰呼吸困難的評估
呼吸困難是患者對疾病的主觀體驗,因此大多數急性心衰臨床試驗依賴于患者對呼吸困難的自我評估。在評估時,需要將測量時的條件進行標準化,考慮患者所處生理狀態,即體位、休息或勞累、是否補給氧氣等,了解呼吸困難持續時間及改變的程度和速度、患者的心理狀態、體驗及期望,確定最佳的測量時間,以上可能有助于確保對呼吸困難進行更有力的評估。
2.1 評估對象
評估對象的呼吸困難應該是由心力衰竭引起而非慢性阻塞性肺氣腫和支氣管炎等其他原因,臨床試驗患者診斷標準中加入 B 型利鈉肽/N 末端 B 型利鈉肽原(BNP/NT-ProBNP)、肺部影像學證據、心衰相關的癥狀、體征等指標,有助于準確納入研究對象。心衰時,心臟負荷增加,心肌細胞合成并釋放 BNP/NT-ProBNP,而呼吸困難的程度也與心臟負荷成正相關,因此 BNP/NT-ProBNP 濃度可很好地鑒別心臟/非心臟原因引起的呼吸困難[11]。在以呼吸困難為主要評價指標的臨床試驗中,招募患者時可能會更看重呼吸困難的癥狀,從而忽略掉臨床癥狀表現為疲勞、虛弱等而非呼吸困難的心衰患者,或者為觀察患者早期呼吸困難對于療法的反應、縮短試驗登記與入院之間的時長而允許納入疑似急性心衰患者。此外,鑒于呼吸困難這一癥狀的主觀性質,研究對象要有自我評估呼吸困難的能力。
2.2 評估時間
測量呼吸困難的時間是至關重要的,因為盡管許多患者在早期治療干預后仍有癥狀,但通常早期治療與更大程度的呼吸困難緩解相關[12]。大多數的急性心衰臨床試驗在入院后測量呼吸困難[13-18],通常患者招募入組后在基線以及固定的時間點進行測量。然而在試驗中,患者登記時間常常與癥狀出現或者入院時間有一定時間差,據報道,多數的急性心衰臨床試驗在患者入院后的 24~48 小時登記[17],可能在基線測量之前已經有了一些治療,因此,在研究干預之前或者干預措施一起給予的所有療法的時間和劑量都應該被詳細記錄。事實上,呼吸困難通過常規療法已有了迅速且很大程度的改善,若要在采用新療法的臨床試驗中捕捉到有臨床意義的變化,只有一個很短的時間窗口,因此應該盡量在呼吸困難出現的早期進行測量,并清楚地記錄試驗干預時間和呼吸困難測量時間。另外,呼吸困難應重復評估,而評估之間的最佳間隔時間目前仍不確定,有學者建議在前 3 小時每 1 個小時進行一次評估,以確定治療的應答情況,然后在首次評估 6 小時后進行評估,此后每 6 小時進行一次評估,直到達到 24 小時,這個時間里醫生能夠識別治療的延遲反應和復發情況[19]。在固定時間點測量呼吸困難,可能無法捕獲到癥狀的波動過程,尤其是治療采用如阿片類等半衰期較短的藥物,呼吸困難可能會在藥效過后復發,此時曲線下面積法是一種有用的方法,可多次測量以構建平均反應[20]。
2.3 評估條件
患者在何種條件下進行呼吸困難的測量也是一個需要考慮的問題。對于大多數的急性心衰患者來說,靜息時已出現呼吸困難,平臥時加重,故需被迫采取端坐位或半臥位以減輕呼吸困難的程度,稱為“端坐呼吸”。這是因為坐位時下肢血液回流減少,肺淤血減輕,且膈肌下移,胸腔容積增大,肺活量增加,通氣改善[10]。如果兩例患者有同等程度的呼吸困難,而一例評估時處于坐位,且有高流量的吸氧,而另一例處于仰臥位且無氧氣補給,那么顯而易見他們的評估結果沒有可比性。同樣,一例患者在不同時間點的評估也應該處于相同的生理狀態下。在一個探索標準化測量方法的 URGENT—呼吸困難研究中,所有患者在基線和常規治療 6 小時后記錄坐位呼吸困難,癥狀較輕的患者再次進行仰臥位測量,結果發現,47% 的患者從坐位到仰臥位導致更嚴重的呼吸困難,坐位呼吸困難在接受 AHFS 常規治療后可迅速改善,而改變體位(坐位→仰臥位)導致的呼吸困難對治療的反應卻相對滯后[17]。因此在臨床試驗中,呼吸困難應該在標準環境下進行評估,包括從坐位有氧到仰臥位無氧,2008 年曾有國際共識小組提出一種誘發性呼吸困難評估(provocative dyspnoea assessment,PDA)方法[19],分別在坐位吸氧、坐位不吸氧、仰臥位不吸氧、50 米盡可能快速走、6 分鐘步行試驗等情況下進行評估(表 1)。PDA 在測量時,逐漸變換測量條件直到患者難以忍受,可結合呼吸困難嚴重程度的測量量表,如李克特量表或視覺模擬評分表(visual analogue scale,VAS)等,綜合進行呼吸困難評分。但此方法仍需方法學和統計學的驗證,然而在更好的方法出來以前,PDA 法不失為一個有力的參考。

3 急性心衰呼吸困難常用測量工具
在呼吸困難的測量中,治療前后的變化在 AHFS 試驗中很關鍵。評估癥狀的變化至少有兩種方法,一種是在基線和之后的每個時間點用同一種工具測量呼吸困難的嚴重程度,通過計算來推斷變化,常用的有李克特-5 點量表(Likert-5 point scale)和 VAS;另一種方法是治療后詢問患者呼吸困難程度相比基線是否有變化,常用的有李克特-7 點量表(Likert-7 point scale),在實際的臨床試驗中,多數選擇以上 2 種工具相結合進行測量。此外,還有上文中提到的 PDA 評估法與李克特量表或 VAS 結合形成的呼吸困難嚴重程度評分表(dyspnoea severity score,DSS)。下面將詳細介紹每種評估工具并分析其優缺點。
3.1 VAS
VAS 是一種主觀量化的癥狀評估工具,在 1921 年由 Hayes 和 Patterson 提出[21],如今在臨床上被廣泛應用于感覺或心情的描述和測量,尤其是在以疼痛為結局指標的研究中,VAS 被認為是測量疼痛最敏感和可靠的方法[22]。在評估呼吸困難時,VAS 在試驗預先設定的時間點測量患者呼吸困難的絕對值。如圖 1 所示,使用一條長 10 cm 或 100 mm 的游動標尺(或在紙上面劃一條 10 cm 或 100 mm 的橫線),0 的一端表示“沒有呼吸困難”,10 cm 或 100 mm 的一端表示“難以忍受的、最嚴重的呼吸困難”,臨床測量時,患者面對無刻度的一面,將游標(或在直線上做記號)放在最能代表當下呼吸困難程度的位置,醫生面對有刻度的一面,從起點至記號處的距離長度即為呼吸困難的絕對值,治療前后使用同樣的方法對呼吸困難做出評估,此法簡單易行,相對比較客觀、靈敏。在臨床研究中,為捕捉到療效的動態變化,也可通過計算 VAS 的曲線下面積(area under the curve,AUC)來評估呼吸困難的治療效果,例如在 RELAX-AHFS 研究中[13],采用 VAS 的 AUC 測量呼吸困難在治療第 5 天較基線的改變,研究結果表明重組型人松弛素 2(serelaxin)可顯著改善呼吸困難這一主要終點[448 mm×h,95%CI(120,775),P=0.007](圖 2)。橫軸為測量時間(h),縱軸為 VAS 相對基線距離的變化(mm),AUC=變化距離×時間(mm×h)。

評估時患者面對無刻度的一面,0 端為“無呼吸困難”,另一端則表示“難以忍受的、最嚴重的呼吸困難”。

治療組和對照組呼吸困難的改變通過 VAS 測量,并量化為從基線到治療第 5 天的曲線下面積,其中增加的值代表呼吸困難的改善。
在臨床研究中,判斷干預措施帶來的量表得分變化是否具有“臨床意義”至關重要。因此就有了“最小臨床顯著性差異(minimal clinically important difference,MCID)”這個概念,MCID 的主要功能是協助臨床及研究人員解釋評價工具得分變化或差異的意義[23]。目前對于急性心衰呼吸困難中 VAS 評分的 MCID 還未進行深入研究,目前僅檢索到兩個研究,一是 2004 年發表的一個前瞻性、觀察性研究中,74 例患者接受了評估,VAS 有臨床意義變化的平均值為 21.1 mm[95%CI(12.3,29.9)][24];另一個是 2017 年發表的一個對于 URGENT-呼吸困難研究的二次分析,結果表明,491 例患者接受評估,仰臥位和直立坐位的 VAS 的 MCID 分別為 14.5 mm 和 10.5 mm[25],然而對于 AHFS 呼吸困難 VAS 的 MCID 的確立仍需大型隨機對照試驗來完成。盡管作為 AHFS 臨床試驗中評估呼吸困難最常用的工具之一,VAS 也有它自身的缺陷,例如 VAS 評分很難進行個體間的比較,由于每個患者對呼吸困難的自我感覺不同導致一個患者的 100 分對于另一個患者來說可能只有 50 分;另外對于理解能力不足的患者或老年患者,由于不能很好地實施評價,結果可能會有一定偏差。
3.2 李克特-5 點量表
李克特量表是一種測量態度的工具,反應受試者對問卷中陳述的認同程度,是由美國社會心理學家 Likert 在 1932 年所建立,自誕生以來在調查研究中得到了廣泛的使用[26-28],臨床醫學中常用的有 5 點和 7 點量表。在急性心衰臨床試驗中,李克特-5 點量表可以評估患者在任何時間點呼吸困難的程度,一共分為五個選項:① 無氣短(short of breath,SOB);② 輕度 SOB;③ 中度 SOB;④ 重度 SOB;⑤ 極重度 SOB,研究人員在基線和試驗預先設計的時間點讓患者評估自己目前屬于哪一種狀態。與 VAS 評分一樣,李克特-5 點量表的可靠性體現在其易操作性、可重復性和跟隨時間變化的能力,然而,在捕捉呼吸困難隨體位變化方面,VAS 評分似乎更優越[12, 17]。并且,李克特-5 分量表的 MCID 至今未確立,在一項對于 URGENT-呼吸困難研究的二次分析中[25],研究者試圖確立李克特-5 點量表的 MCID,但最終無論是坐位還是仰臥位均未找到,可能的原因是李克特量表的這五項分類不能充分區分呼吸困難程度。另外一個有待解決的問題是李克特-5 點量表 2 個選項之間呼吸困難的差異是否恒定?即呼吸困難在輕、中度 SOB 之間的差異和重度、極重度 SOB 之間的差異是相同的嗎?如果沒有對這個問題的確切答案,就很難確保包括平均值、中位數和任何統計比較在內的計算是正確的。
3.3 李克特-7 點量表
除上文介紹的李克特-5 點量表外,7 點量表也是急性心衰臨床試驗中常用來評價呼吸困難的工具,不同的是,李克特-7 點量表著重評估患者較基線時呼吸困難的改善情況,而不是測量當下呼吸困難的狀態,具體分為 7 個選項:① 顯著改善;② 中度改善;③ 輕度改善;④ 無改善;⑤ 輕度惡化;⑥ 中度惡化;⑦ 明顯惡化。所以,李克特-7 點量表在基線測量時不能使用,只有在干預后的其他時間點詢問患者目前的癥狀跟基線比較是否改變。這種方法的主要優點是在評估時容易向患者解釋量表的內容,相對來說更好理解,而主要缺點為它對患者的記憶力是一大挑戰,患者往往會跟自己最嚴重時的癥狀進行比較而不是基線時的癥狀,尤其是在試驗后續的測量中,這個問題會變得更為明顯。此外,一些因素如高碳酸血癥、缺氧等可能會與患者的精神狀態相互作用,從而影響回答問題的能力,無法準確地與基線呼吸困難進行比較,于是許多學者更推薦使用 VAS 評分或李克特-5 點量表,或者建議李克特-7 點量表與上述一種或兩種工具結合使用。過去有研究表明,在用這三種工具同時測量呼吸困難時,李克特-5 點量表與 VAS 評分之間存在顯著的相關性,但二者與李克特-7 點量表之間的一致性較差[17]。
3.4 DSS
由于目前缺乏標準化的呼吸困難測量工具,有研究者提出了 DSS[19],即 PDA 法結合李克特量表或者 VAS 評分,以評估患者呼吸困難的嚴重程度,要求患者分別在坐位吸氧、坐位不吸氧、仰臥位不吸氧、50 米盡可能快走、6 分鐘步行試驗的情況下結合李克特-5 點量表(或 VAS、李克特其他量表)為自己呼吸困難嚴重程度進行評分,如表 2 所示。然而,DSS 至今未得到統計學和方法學上的驗證,且缺乏 MCID,但它試圖提供一個統一的、結合體位、吸氧等因素的評估方法。研究者表明該量表的進一步改進可能會納入血氧飽和度、呼吸頻率等客觀指標的測量結果,作為支持患者自我評估的客觀手段[29]。

4 總結
呼吸困難是急性心力衰竭最常見的癥狀,常常為患者帶來巨大的痛苦,也是目前大多數心力衰竭臨床試驗所針對的治療目標,然而對于呼吸困難測量的時間、患者的體位及測量的條件和測量工具卻仍然沒有被標準化。我們認為,測量呼吸困難的時機至關重要,應該在患者癥狀表現早期就有針對性的評估,以便測量與最嚴重狀態的最大差異,從而在時間上為展示新療法的有效性提供機會,另外試驗中也要盡量標準化患者體位及測量條件(表 1),以更好地捕捉到呼吸困難的變化,這種標準化也將促進研究之間進行比較。最后,對于呼吸困難的測量工具,我們介紹了 VAS 評分、李克特-5 點量表、李克特-7 點量表、DSS 評分,優先推薦采用前兩種評估方法,李克特-7 點量表在使用時最好與 VAS 評分或李克特-5 點量表結合使用,DSS 評分是第一個正在研究的標準化的評分系統,能對呼吸困難提供更詳細和一致的評估,能更好地顯示呼吸困難隨時間和治療的變化,但此方法仍需要進一步驗證。對測量工具 MCID 的研究也需要更深層次的探討。