心房顫動(房顫)是最常見的心律失常之一,現全世界房顫患者眾多,且隨年齡增大,發病率上升。但是目前的輔助檢查對于房顫的診斷率較低,鑒于人工智能(AI)廣泛地運用到醫學領域中,用 AI 診斷房顫也成為了研究熱點。本文簡單介紹了 AI 及其在房顫中的應用。
引用本文: 何康, 武忠. 人工智能在心房顫動預測中的新進展. 中國胸心血管外科臨床雜志, 2020, 27(12): 1472-1478. doi: 10.7507/1007-4848.202005077 復制
心房顫動(房顫)是世界上最常見的一種心律失常,約占所有住院心律失常患者的 1/3。我國房顫患者超過 1 000 萬,根據世界衛生組織(WHO)報告,全世界大約 9 000 萬人患有房顫,且隨年齡增大新發患者增多,其患病率在 50~59 歲人群中達到 5%,80~89 歲人群中甚至達到 10%。另外,房顫引起患者死亡的主要原因為進行性心力衰竭、心臟驟停及腦卒中等并發癥。房顫患者卒中總體發生風險是無房顫患者的 5 倍,1 年致殘率和死亡率超過 50%,1 年復發率超過 1/3[1]。值得注意的是,大多數患者為無癥狀或陣發性房顫,極大地增加了卒中甚至死亡的風險。因此,對房顫相關危險因素進行干預控制或者早期準確檢測房顫,能讓醫生盡早制訂抗凝、消融等治療方案,改善患者預后。
目前房顫的診斷方法有心臟觸診、光學體積描記術、血壓監測振動法、心電圖(ECG)等[2],其中金標準是 12 導聯 ECG。由于患者數量急劇增多,醫生有時不能對大量 ECG 做出準確的判斷。同一份 ECG,不同醫生有不同判斷,也影響對患者疾病的診斷。除此之外,大部分患者為無癥狀或陣發性房顫,短時間的 ECG 并不能抓取到實時的特異性波形,而 24 h 動態 ECG 需要患者一直攜帶記錄盒,對于識別房顫短暫性腦缺血發作僅有 2.4%~13.9% 的概率,延長可植入記錄器監測 36 個月也只有 30% 的概率。這種持續監視器價格昂貴,并且給患者和臨床實踐帶來了負擔。
與此同時,由于互聯網、云計算的發展[3],大數據時代使人工智能(artificial intelligence,AI)成為了可能并且迅猛發展。AI 企圖了解智能的實質,并生產出一種新的能以人類智慧相似方法做出反應的智能機器。目前醫療領域使用較多的主要是自動語音識別、決策系統、影像分析、機器人、專家系統。鑒于 AI 強大的預測潛能,我們可以將其利用在房顫識別和預測方面,能夠使臨床實踐變得更加有效、方便、個性化。
1 與傳統數據分析比較
統計學強調推斷,機器學習(machine learning,ML)強調預測[4]。統計學方法核心是依據樣本和人口學參數進行推斷總體,我們需要先假設成立,再依據 P 值和檢驗方法判斷此項是否成立而比較。然而 AI 和 ML 主要在算法的基礎上,利用數據結構進行預測和推斷。但是我們不應該將統計學和 ML 劃分明確的界限,它們都屬于同一類,只是用于處理不同的問題[4]。
2 人工智能
AI 是計算機科學的一個分支,使機器和計算機系統模仿人類智力處理問題,包括 ML、深度學習(deep learning,DL)等(圖 1)。

2.1 機器學習
ML 是聚焦計算機如何從數據中學習的科學技術[5]。它由統計學(尋找數據關系)和計算機科學(強調有效的計算機算法)的交互作用產生[6]。其研究使計算機依靠經驗學習不斷優化自身性能,達到真實模擬人類學習的目的。ML 的過程大致分為數據預處理、特征選擇、數據分類、模型訓練及優化[4]。
2.2 深度學習
DL 是 ML 中的一個新研究領域,目的在于構建類似人腦的神經網絡[7]。神經網絡含有多隱層的多層感受器,通過組合較低層輸出形成更加抽象的高層表示屬性類別或特征[8]。這種多層非線性運算模型,可采用從大量數據中學習有效的特征表示,廣泛用于分類、回歸等問題中。其包括人工神經網絡(artificial neural network,ANN)、卷積神經網絡(convolution neural network,CNN)等。
2.2.1 人工神經網絡
人腦中有大量的神經元細胞和神經纖維,一個神經元發出多根軸突連接其它多個神經元,無數神經元之間互連形成錯綜復雜的網絡。ANN 基于此基本原理,形成一種模擬人腦組合眾多信號計算單元的數學模型,對復雜信息能夠簡單統籌地處理。ANN 由大量處理單元(神經元)構成(圖 2)[9-10],這些神經元排列成多層結構,層間神經元通過一定的權值(weight)互相連接[11],輸入數據通過隱喻層的處理而產出相應結果。
2.2.2 卷積神經網絡
在眾多 DL 模型中,CNN 是應用最廣泛的一類[12]。其仿造生物的視知覺機制,通過多次卷積計算,在圖像、音頻數據集特征提取分類方面,依靠其認知模式能力得到不錯的結果。CNN 不需輸入和輸出間精確的數學表達關系,卻能有效地學習兩者間的非線性映射關系(圖 3)[13]。

Convolution:卷積層;Pooling:池化層;Fully-connected:全連接層;卷積層由多個特征面構成,每個特征面有多個神經元,每個神經元以一定的權值與上一層中的局部區域相連;池化層中的神經元與卷積層的局部區域相連,起到二次提取的作用;全連接層整合前面所有層中具有類別區分性的局部信息;最后通過輸出層得到每個類別的后驗概率
2.3 機器學習技術
盡管 ML 有很多策略和技術,但主要分為 3 種(圖 4)[4]:監督式學習(supervised learning)、無監督式學習(unsupervised learning)和強化學習(reinforcement leaning)。

2.3.1 監督式學習
監督式學習可由訓練資料中學習到或建立一個模式,并依此模式推測新的實例[4]。監督式學習的任務就是依靠正確標簽的訓練資料,得到任何可能出現的輸入值的輸出,輸出可能是預測或者是分類。比如給定一系列事先標簽好的 ECG 數據訓練,最終得到的模型便可以用來判斷新的 ECG 是否屬于正常。
2.3.2 無監督式學習
無監督式學習不需要預測結果,主要集中發現數據中不同變量之間基本的結構和關系。這種方法輸入數據是不帶標簽的,輸出數據也是未知的[14],系統也會依靠輸入數據的基礎尋找特定的模式。聚類分析是無監督式學習常用的算法,將研究對象按照一定的規則或標準分成不同的類別,每一類別都有其相應的特征。
2.3.3 強化學習
強化學習,又稱再獎勵學習,通過給定的輸入數據和結果循環試驗來學習的行為。它包括有一個可以實時作用于環境的智能體(Agent)。當環境接受一個由 Agent 發出的動作后,其狀態發生變化,同時產生一個強化信號反饋給 Agent,Agent 根據強化信號和環境當前狀態再選擇下一個動作(圖 5)[15]。

3 人工智能在房顫中的相關應用
目前 AI 在房顫方面的應用主要有兩個方面,一是利用大量 ECG 數據進行模擬醫生分類和判別房顫;二是收集患者的基線資料來預測房顫。由于無癥狀性或陣發性房顫患者日益增多,僅靠我們做短時程的 ECG 檢測已經不能夠做出最正確的判斷。因此利用數據訓練算法的研究已經呈井噴式發展。
3.1 利用心電圖檢測和預測房顫
因 CNN 在圖像處理和特征提取方面的優勢,便主要利用它來作為研究對象。絕大數研究使用監督式學習的 CNN,且其中的步驟大致相同,即 ECG 數據預處理、特征提取和分類算法模型。通過識別 ECG 信號的 ML 技術已經取得了較大的成功和進步。目前的研究一般基于以下幾點來對 ECG 特征進行提取。
3.1.1 基于心電圖波形
許多基于識別 P 波特征建立的自動化算法已經取代了耗時耗力的長時程心電記錄。現在越來越多的證據[16]表明即使是明顯正常的心臟,發展為房顫的患者有傾向于房性心律失常的結構性改變。這些改變可能是缺血性或者栓塞性卒中的重要病理改變機制[17]。在房顫發生之前心房結構就出現了如心肌肥大、纖維化、心房增大等改變,這些導致了微弱的心電改變。同時,研究[18]表明在 ECG 上的竇性心律并不能完全表明心房功能。有近 1/3 經歷了電復律的房顫患者,盡管 ECG 上顯示竇性心律,但是左心房沒有竇性收縮。另一項研究[19]中,近 1/4 行經食管超聲心動圖的患者,同樣 ECG 有竇性心律,但左心房有房顫。因此,在 ECG 上改變不明顯的 P 波可能反映的是心房局部的非竇性心電活動,雖然人眼難以發現,但是對這些細微的改變機器可以通過大量的數據訓練而找出并以此為依據進行預測。Attia 等[17]利用 CNN 建立了一個 ECG 算法模型,在竇性心律中間通過 P 波識別房顫,并且取得了很高的準確率。該研究團隊納入了 180 922 例 18 歲以上患者的649 931 份正常竇性心律 ECG(標準 12 導聯,10 s),將其按照 7∶1∶2 比例分為了訓練集、驗證集、測試集。對于無房顫患者使用的是所有收集到的 ECG 中第 1 個竇性心律波形,對于房顫患者則使用的是第 1 個房顫波形前 31 d 內的第 1 個竇性心律。最終結果為曲線下面積(AUC)0.87,敏感性 79%,特異性 79.5%,F1 比值 39.2%,準確率 79.4%。這項研究中,在正常竇性心律期間記錄的具有 AI 功能的 ECG 在確定房顫的存在方面表現良好。這種可廣泛獲得的即時檢查來識別房顫的能力具有重要的實際意義,特別是對房顫的篩查工作和對栓塞來源不明卒中患者的管理。
除了特征性的 P 波改變,對于 ECG 其它特征,例如 QRS、T 波等,也被考慮為可提取的特征供算法學習。Dai 等[20]提出了一種在提取心房活動時減少 QRS 波殘留的新型方法,在識別房顫中得到較高的準確性。Khamis 等[21]將 QRS 波、T 波形態納入學習的范圍,用 5 920 份 ECG 訓練算法,因綜合了多種特征變量,最終平均 F1 比值為 0.78。研究中所描述的特征和方法,其性能具有可比性并且未發生過擬合現象。ECG 上波形復雜,除了明顯的 PQRST 波以外,甚至可能存在人類無法察覺的不明顯波形,卻能被機器捕捉乃至成為決定性因素,這需要人們進一步的探索和驗證。
3.1.2 基于心率變異性
除了對典型波形的研究,針對心率變異性(heart rate variability,HRV)也提出了不少模型。Chesnokov 等[22]使用 51 份 ECG 樣本對 ANN 和支持向量機分類器進行了訓練測試,ANN 得到最優的結果,敏感性 76%,特異性 93%,陽性預測值 94%。該 ANN 模型能夠在陣發性房顫發生(62±21)min 之前進行實時預測。這就使得 AI 利用 HRV 這一特征提前預測房顫發生成為可能。因為該研究的模型只能提前約 60 min 進行預測,所以如果能夠將這一時間延長,對臨床實踐來說或許更有意義。Christov 等[23]設計了一個線性分類算法,提取了數據中的 44 個特征,其中包括 HRV、波形等,最終算法檢測房顫 F1 比值為 0.81。該研究人員將所有的特征進行了排序,結果為 RR 間期差異這一特征對總的 F1 比值貢獻最大。Henzel 等[24]使用 4 種基于 RR 間期的數據特征和線性分類器來自動化識別房顫和正常竇性心律。Boon 等[25]則利用 HRV 的優化算法和非主導分類遺傳算法來區分房顫信號,其主要分析了 HRV 的時域、頻域特征,準確率達到了 87.7%,并且所采用的 HRV 信號長度從 30 min 降到了 5 min。因此,HRV 作為反映心臟活動與否的重要指標,我們可以通過 AI 更加方便地分析逐次心搏之間的差異,即使是在醫生看來正常的 RR 間期。
3.1.3 基于心電圖時程
算法模型接受不同長短的 ECG 信號(幾秒到數十秒)也可以有不同的準確率。現大多數研究采用 12 導聯 10 s 的 ECG 數據,但是存在所納入的數據中信號不全的可能,這對整個模型的訓練影響較大,同時,如果延長時長則增加了算法所要調節的參數,模型的處理速度便會降低。Fan 等[26]通過融合多種 CNN 模型,從短時程 ECG 數據中有效地檢測房顫。同時 ML 模型已經發展成可以進行遠程監控預測并報警的系統。臨床中患者 ECG 信號的時程不一,使機器接受不同長度的數據不僅避免了醫生來選擇,還能提高檢測的準確性。Yao 等[27]提出了一種 ATI-CNN(attention-based time-incremental convolutional neural network)新型算法,利用 CNN、長短記憶網絡和一個集中模塊綜合了 ECG 時間、空間上的信息,能夠接受不同長度 ECG 信號的輸入,并且在實時處理中減少了一半的參數,對于模型的性能和速率都有所提高,最終檢測房顫的 F1 比值達到了 0.92。
3.1.4 基于心電圖導聯
通常我們采用 8 導聯或 12 導聯 ECG 記錄心臟在各個方向上的電信號。大多數研究都是將患者 12 導聯 ECG 數據輸入模型中。但是 Chen 等[28]依然使用 CNN,經過訓練后發現使用單導聯 ECG 數據所得到的模型性能只比使用全導聯 ECG 的模型性能遜色一點。通常 aVR 導聯在臨床中容易被忽略,但是在該研究中其對心律失常的檢測綜合性能是最優的。目前很多研究采用的數據均為單導聯短時程,這不僅去除了過多干擾信號,還能夠減少機器處理的數據量,加快了機器的整體速度。從不同導聯入手,不斷試驗機器性能,或許也是行之有效的。
因此我們可以從該方面利用 ECG 數據來進行分析和預測,同時 ML 有相應的能力去處理我們想要處理的具體數據。
3.2 利用基線數據預測房顫
另外一個應用便是使用非監督式學習區分不同表型患者。臨床上很多患者術前有房顫但術后沒有,有的反之。這些情況的出現對于臨床醫生來說如若難以判斷,將影響術前術后相關的治療。非監督式學習的出現能夠很好地處理這些問題。非監督式學習在心臟病學中的一個最有前景的應用便是對心臟疾病的子分型或者是精準分型[4]。目前提出的精準醫學表示根據患者的具體情況來確定具體的疾病預防和治療方法。不同于傳統“一刀切”的治療方法,醫療人員會考慮患者基本信息的細微不同對診療手段進行適當調整和改變。心臟疾病大多是慢性、異質性、合并多種疾病,通常在疾病癥狀發生之前有很長時間的病理生理變化。許多疾病的概念如心力衰竭、冠狀動脈粥樣硬化性心臟病等大而寬泛,但是不同的分型有不同的發病機制[4]。因此,如果能將這類疾病進行具體的多種分型,不同的子型預后不同,提示風險特征不同,有利于醫生及早發現高危患者從而進行早期的特殊管理。Pimor 等[29]依靠無監督式學習中的使用密集表型數據的無偏差聚類分析算法,依據人口學統計學數據、患者的醫學背景、血流動力學狀況、治療、癥狀、手術數據和住院結局等,將 122 例因二尖瓣關閉不全行手術的患者分為 3 種不同的表型。結果表型 1 代表低風險患者(危險因素較少,心室擴張較少),主要特征與總體人群無差異;表型 2 代表中危患者,主要為慢性阻塞性肺疾病病史的吸煙男性,超聲心動圖示心臟重構更明顯;表型 3 代表高危患者,主要包括年齡較大的瘦小女性,多患有高血壓、術前房顫等合并癥患者。不同表型預后不同,提示風險特征不同。與表型 1、2 相比,表型 3 的患者更易因心血管事件再住院和發生術后長期房顫。因此依據表型不同可及早發現高危患者,改善重度二尖瓣關閉不全患者的管理;對于無癥狀的表型 3 個體在早中期進行二尖瓣手術可以降低房顫發生風險;對于陣發性房顫患者,可在瓣膜手術期間進行肺靜脈隔離以防止術后房顫。這種無監督式學習的算法有助于對術前術后房顫的預測和對異質性疾病患者的管理。Budzianowski 等[30]利用支持向量機預測肺靜脈球囊消融術后早期房顫的復發率。AI 在預測術后房顫的過程中,也可以依此來判斷術后房顫發生的危險因素,如術前房顫、糖尿病、他汀類藥物的使用等。
非監督式學習的聚類算法雖然沒有監督式學習的算法使用廣泛,但是由于現如今患者生活習慣和個體特征大相徑庭,統一模版型的治療或許不再適應每個人,更好地識別高危患者加以早期干預,或許是無監督式學習的應用所在。
4 前景
AI 在醫學的應用目前主要有兩個方面,一是發現新的臨床規律,二是促進精準醫學發展。以往醫學主要依靠統計學方法,但是樣本不同于總體,會產生偏差。可一旦引入了云計算,醫學研究進入大數據時代。巨大樣本數據支持的情況下,更容易發現其中的規律,對臨床更具有指導意義,甚至可能推翻之前的結論。隨著技術不斷更新發展,各種信息如電子病歷檔案基因組學、影像學資料、監護數據等,能夠更好地為醫生利用。數據科學與醫學的結合,可以開創全新的診療模式。不同的醫院有不同的數據庫資源,基于當前醫療資源共享平臺,醫生可及時查看患者在不同時間不同地點的就診記錄,以此全面分析患者的健康狀況。AI 將使個性化醫療-個人健康數據的使用更加廣泛,更容易為所有患者接受。個性化醫學將是未來發展的方向。目前全世界房顫患者眾多,麻省理工心律失常數據庫(MIT/BIH)、美國心臟協會(AHA)心律失常數據庫、陣發性房顫(PAF)數據庫等收集的大量 ECG 數據便是利用 AI 治療房顫的數據基礎。這些工具的應用是無限的,最終可能通過模式識別和早期診斷和干預為房顫等慢性疾病帶來更好的治療。
AI 類似技術通過移動設備進行實時決策和與患者接觸可能會帶來更好的結果,在智能手機和其它移動終端設備上使用配備 AI 的醫療應用程序和工具,可以減少對專家治療的需求,為醫療系統節省大量的成本。許多智能手表推出的 ECG 功能,可以監測用戶心率,發現某些心臟問題,如不規則的脈搏和房顫,從而提高對房顫的警惕性,做到早預防、早知曉[31]。Perez 等[32]對 Apple Watch 檢測房顫進行了研究,Apple Watch 接收到不規則脈搏信號的概率很低,在收到不規則脈搏信號的參與者中,34% 的人在隨后檢測中出現了房顫,同時后續不規則脈搏陽性預測值為 0.84。因此,移動技術時代來臨,此類電子裝置對動態人群中房顫的檢測和房顫持續時間的評估具有高度敏感性[33],可能是一種廉價的、非侵入性的長期房顫監測和管理方法。
Yan 等[34]嘗試了一種新型房顫檢測方法,該方法應用智能手機攝像頭分析無身體接觸的面部光電容積描記信號。同時使用單數碼相機和預先培訓好的深度卷積神經網絡(DCNN)分析多個患者信號,前瞻性地評估了高通量房顫檢測的可行性。此方法不僅避免了一對一篩查,而且對患者要求很低,這樣可以節約患者的時間并減少工作量。該研究為我們提供了一種全新的房顫檢測方法,人臉識別房顫。
除此之外,房顫的發生通常因為心房的異位起搏點,導管射頻消融是治療方法之一。現利用 AI 技術不僅可以識別異位起搏點,還可以在射頻消融過程中,利用 AI 三維重建技術,進行消融指數的自動化計算,實現更加充分、有效的治療。當然,房顫發生有眾多的機制,電生理機制、自主神經系統的作用、遺傳學基礎[1]等,我們期望未來可以借助 AI 更加深入地了解房顫。
5 問題和局限性
5.1 數據問題
數據是 AI 應用的基礎。數據問題包括:(1)數據質量問題。準確的數據對準確的模型來說必不可少。如果用于調整模型的數據本身就存在偏差,那么該模型就難以泛化到大眾。在國內外大多數醫院里收集到的數據或多或少質量欠佳,直接用于算法得到的準確率偏低。如 P 波通常包含有眾多的噪聲,使得基于形態學特征的房顫監控準確率下降[2]。雖然有很多特征提取步驟,如獨立成分分析、波形轉換、光譜分析和熵值,但是在特征提取過程中會產生大量不相關冗雜的特征,不僅會降低預測的準確性,還會降低模型的處理速率。況且機器訓練學習的數據種類是普遍的,占大多數的。一旦遇到少見的患者特征亦或是圖像,因為缺乏此方面的提前學習,機器是難以診斷的。(2)標注問題。原始數據的龐大使得標注的工作量難以想象,很多人認為程序工程師只是在不斷改進模型,但其實是在做數據的預處理。將 AI 應用在房顫的預測中,大多數研究需要專業的心臟病醫生對數以萬計的 ECG 數據進行標注。醫生是高度個性化的,同一個檢查結果不同醫生會給出多種診斷意見,有時候對錯難以辨別。標注需要的是金標準,如果對于數據的標注出現了錯誤,將會導致整個模型的準確率嚴重下降。(3)數據的花費問題。如此大量的數據應用花銷也是巨大的。整個模型的試驗調整也是耗費人力、物力的。
5.2 機器學習中的黑匣子
機器的不透明性和難解釋性是一個重要的問題[10]。我們輸入數據得到輸出結果,稱為預測。但是為什么機器會得到想要的結果,我們是不清楚的。盡管有許多方法技術解釋了模型的結果,通過分析具體的參數和特征之間的權重來證實其正確性,強調了每一個預測結果最具區別的部分,但是我們還是不能夠確切地知道 ML 和 DL 為何就能夠做出正確的決策。醫學領域中,疾病的診斷是有因果可循的,醫生還是更加愿意相信自己多年的臨床經驗,從臨床癥狀、直接的輔助檢查來邏輯推理出正確的結果。因為沒有生物學上的可靠依據,想要掌握推廣 AI 技術也實屬難事。
5.3 泛化問題
擬合一直是 ML 亟待解決的問題。雖然現在有很多研究都取得了不錯的結果,敏感性、特異性、準確性等都很高,但是不能夠代表此研究訓練出來的模型可以推廣。許多方法僅僅使用來自一個數據庫的數據進行訓練和測試,如 MIT/BIH 數據庫甚至更小型的數據庫。來自單個數據庫的數據可能并不能很好地全面評估一個算法的表現力[2]。診斷和監控房顫的算法需要能夠盡可能的泛化,同時還要有高特異性和高敏感性,但目前許多算法并不能滿足所有的要求。
5.4 倫理問題
倫理一直是醫學非常重視的方面。設想一個依靠 ML 診斷的患者發生了醫療事故,隨后責任歸屬便出現了分歧。除此之外,數據必然包含了患者的隱私和臨床信息。因此,合法使用這些信息也是重要的方面。盡管現在有了相應的法律法規,比如將患者的個人信息用于統計學目的是被允許的,但是出于尊重,在這些信息用于訓練診斷和決策的 AI 模型之前,患者都應該有知情權[10]。
5.5 其它
目前 AI 還處于初級階段,還有很多技術不成熟,加之基本都是程序設計師在構建模型,而臨床醫生鮮有參與。現在的 AI 是基于國際開源的一些模型,所以應用局限于語音圖像識別;整個設計依靠現代簡單的數學邏輯,難以構建遵循臨床醫學規律的具備邏輯推理能力的數據模型,因此對于房顫這類臨床疾病預測有潛在干擾。AI 應用在基層醫療理論上是可行的,但許多基層醫生對機器得出的結果有時難以抉擇,對疾病的準確診斷有一定風險。
6 結語
AI 看起來遙不可及,然而它已經滲透到醫療領域的方方面面。由于云計算、大數據的快速發展,醫學乘上時代的快車,利用 AI 來為醫務人員和患者服務。隨著 ML、DL 技術的發展和應用,患者在利用常規輔助檢查診斷時,可以考慮使用 AI 來預測和識別房顫。對于患者來說,能早期識別房顫、降低卒中等并發癥的發生率、明顯改善預后、提高生活質量;對于醫生來說,能早期識別疾病、盡早加以干預、調整治療方案,同時還能減輕工作負擔。但是,在 AI 廣泛應用到臨床實踐之前,我們還有很長的一段路要走。算法模型的各種問題亟待解決,同時也要求醫療人員去了解掌握數據科學并參與其中的構建,這樣醫生才能足夠信任機器去替代自己進行一部分工作。
利益沖突:無。
作者貢獻:何康參與文章的撰寫和修改;武忠對文章的相關內容進行指導和修正。
心房顫動(房顫)是世界上最常見的一種心律失常,約占所有住院心律失常患者的 1/3。我國房顫患者超過 1 000 萬,根據世界衛生組織(WHO)報告,全世界大約 9 000 萬人患有房顫,且隨年齡增大新發患者增多,其患病率在 50~59 歲人群中達到 5%,80~89 歲人群中甚至達到 10%。另外,房顫引起患者死亡的主要原因為進行性心力衰竭、心臟驟停及腦卒中等并發癥。房顫患者卒中總體發生風險是無房顫患者的 5 倍,1 年致殘率和死亡率超過 50%,1 年復發率超過 1/3[1]。值得注意的是,大多數患者為無癥狀或陣發性房顫,極大地增加了卒中甚至死亡的風險。因此,對房顫相關危險因素進行干預控制或者早期準確檢測房顫,能讓醫生盡早制訂抗凝、消融等治療方案,改善患者預后。
目前房顫的診斷方法有心臟觸診、光學體積描記術、血壓監測振動法、心電圖(ECG)等[2],其中金標準是 12 導聯 ECG。由于患者數量急劇增多,醫生有時不能對大量 ECG 做出準確的判斷。同一份 ECG,不同醫生有不同判斷,也影響對患者疾病的診斷。除此之外,大部分患者為無癥狀或陣發性房顫,短時間的 ECG 并不能抓取到實時的特異性波形,而 24 h 動態 ECG 需要患者一直攜帶記錄盒,對于識別房顫短暫性腦缺血發作僅有 2.4%~13.9% 的概率,延長可植入記錄器監測 36 個月也只有 30% 的概率。這種持續監視器價格昂貴,并且給患者和臨床實踐帶來了負擔。
與此同時,由于互聯網、云計算的發展[3],大數據時代使人工智能(artificial intelligence,AI)成為了可能并且迅猛發展。AI 企圖了解智能的實質,并生產出一種新的能以人類智慧相似方法做出反應的智能機器。目前醫療領域使用較多的主要是自動語音識別、決策系統、影像分析、機器人、專家系統。鑒于 AI 強大的預測潛能,我們可以將其利用在房顫識別和預測方面,能夠使臨床實踐變得更加有效、方便、個性化。
1 與傳統數據分析比較
統計學強調推斷,機器學習(machine learning,ML)強調預測[4]。統計學方法核心是依據樣本和人口學參數進行推斷總體,我們需要先假設成立,再依據 P 值和檢驗方法判斷此項是否成立而比較。然而 AI 和 ML 主要在算法的基礎上,利用數據結構進行預測和推斷。但是我們不應該將統計學和 ML 劃分明確的界限,它們都屬于同一類,只是用于處理不同的問題[4]。
2 人工智能
AI 是計算機科學的一個分支,使機器和計算機系統模仿人類智力處理問題,包括 ML、深度學習(deep learning,DL)等(圖 1)。

2.1 機器學習
ML 是聚焦計算機如何從數據中學習的科學技術[5]。它由統計學(尋找數據關系)和計算機科學(強調有效的計算機算法)的交互作用產生[6]。其研究使計算機依靠經驗學習不斷優化自身性能,達到真實模擬人類學習的目的。ML 的過程大致分為數據預處理、特征選擇、數據分類、模型訓練及優化[4]。
2.2 深度學習
DL 是 ML 中的一個新研究領域,目的在于構建類似人腦的神經網絡[7]。神經網絡含有多隱層的多層感受器,通過組合較低層輸出形成更加抽象的高層表示屬性類別或特征[8]。這種多層非線性運算模型,可采用從大量數據中學習有效的特征表示,廣泛用于分類、回歸等問題中。其包括人工神經網絡(artificial neural network,ANN)、卷積神經網絡(convolution neural network,CNN)等。
2.2.1 人工神經網絡
人腦中有大量的神經元細胞和神經纖維,一個神經元發出多根軸突連接其它多個神經元,無數神經元之間互連形成錯綜復雜的網絡。ANN 基于此基本原理,形成一種模擬人腦組合眾多信號計算單元的數學模型,對復雜信息能夠簡單統籌地處理。ANN 由大量處理單元(神經元)構成(圖 2)[9-10],這些神經元排列成多層結構,層間神經元通過一定的權值(weight)互相連接[11],輸入數據通過隱喻層的處理而產出相應結果。
2.2.2 卷積神經網絡
在眾多 DL 模型中,CNN 是應用最廣泛的一類[12]。其仿造生物的視知覺機制,通過多次卷積計算,在圖像、音頻數據集特征提取分類方面,依靠其認知模式能力得到不錯的結果。CNN 不需輸入和輸出間精確的數學表達關系,卻能有效地學習兩者間的非線性映射關系(圖 3)[13]。

Convolution:卷積層;Pooling:池化層;Fully-connected:全連接層;卷積層由多個特征面構成,每個特征面有多個神經元,每個神經元以一定的權值與上一層中的局部區域相連;池化層中的神經元與卷積層的局部區域相連,起到二次提取的作用;全連接層整合前面所有層中具有類別區分性的局部信息;最后通過輸出層得到每個類別的后驗概率
2.3 機器學習技術
盡管 ML 有很多策略和技術,但主要分為 3 種(圖 4)[4]:監督式學習(supervised learning)、無監督式學習(unsupervised learning)和強化學習(reinforcement leaning)。

2.3.1 監督式學習
監督式學習可由訓練資料中學習到或建立一個模式,并依此模式推測新的實例[4]。監督式學習的任務就是依靠正確標簽的訓練資料,得到任何可能出現的輸入值的輸出,輸出可能是預測或者是分類。比如給定一系列事先標簽好的 ECG 數據訓練,最終得到的模型便可以用來判斷新的 ECG 是否屬于正常。
2.3.2 無監督式學習
無監督式學習不需要預測結果,主要集中發現數據中不同變量之間基本的結構和關系。這種方法輸入數據是不帶標簽的,輸出數據也是未知的[14],系統也會依靠輸入數據的基礎尋找特定的模式。聚類分析是無監督式學習常用的算法,將研究對象按照一定的規則或標準分成不同的類別,每一類別都有其相應的特征。
2.3.3 強化學習
強化學習,又稱再獎勵學習,通過給定的輸入數據和結果循環試驗來學習的行為。它包括有一個可以實時作用于環境的智能體(Agent)。當環境接受一個由 Agent 發出的動作后,其狀態發生變化,同時產生一個強化信號反饋給 Agent,Agent 根據強化信號和環境當前狀態再選擇下一個動作(圖 5)[15]。

3 人工智能在房顫中的相關應用
目前 AI 在房顫方面的應用主要有兩個方面,一是利用大量 ECG 數據進行模擬醫生分類和判別房顫;二是收集患者的基線資料來預測房顫。由于無癥狀性或陣發性房顫患者日益增多,僅靠我們做短時程的 ECG 檢測已經不能夠做出最正確的判斷。因此利用數據訓練算法的研究已經呈井噴式發展。
3.1 利用心電圖檢測和預測房顫
因 CNN 在圖像處理和特征提取方面的優勢,便主要利用它來作為研究對象。絕大數研究使用監督式學習的 CNN,且其中的步驟大致相同,即 ECG 數據預處理、特征提取和分類算法模型。通過識別 ECG 信號的 ML 技術已經取得了較大的成功和進步。目前的研究一般基于以下幾點來對 ECG 特征進行提取。
3.1.1 基于心電圖波形
許多基于識別 P 波特征建立的自動化算法已經取代了耗時耗力的長時程心電記錄。現在越來越多的證據[16]表明即使是明顯正常的心臟,發展為房顫的患者有傾向于房性心律失常的結構性改變。這些改變可能是缺血性或者栓塞性卒中的重要病理改變機制[17]。在房顫發生之前心房結構就出現了如心肌肥大、纖維化、心房增大等改變,這些導致了微弱的心電改變。同時,研究[18]表明在 ECG 上的竇性心律并不能完全表明心房功能。有近 1/3 經歷了電復律的房顫患者,盡管 ECG 上顯示竇性心律,但是左心房沒有竇性收縮。另一項研究[19]中,近 1/4 行經食管超聲心動圖的患者,同樣 ECG 有竇性心律,但左心房有房顫。因此,在 ECG 上改變不明顯的 P 波可能反映的是心房局部的非竇性心電活動,雖然人眼難以發現,但是對這些細微的改變機器可以通過大量的數據訓練而找出并以此為依據進行預測。Attia 等[17]利用 CNN 建立了一個 ECG 算法模型,在竇性心律中間通過 P 波識別房顫,并且取得了很高的準確率。該研究團隊納入了 180 922 例 18 歲以上患者的649 931 份正常竇性心律 ECG(標準 12 導聯,10 s),將其按照 7∶1∶2 比例分為了訓練集、驗證集、測試集。對于無房顫患者使用的是所有收集到的 ECG 中第 1 個竇性心律波形,對于房顫患者則使用的是第 1 個房顫波形前 31 d 內的第 1 個竇性心律。最終結果為曲線下面積(AUC)0.87,敏感性 79%,特異性 79.5%,F1 比值 39.2%,準確率 79.4%。這項研究中,在正常竇性心律期間記錄的具有 AI 功能的 ECG 在確定房顫的存在方面表現良好。這種可廣泛獲得的即時檢查來識別房顫的能力具有重要的實際意義,特別是對房顫的篩查工作和對栓塞來源不明卒中患者的管理。
除了特征性的 P 波改變,對于 ECG 其它特征,例如 QRS、T 波等,也被考慮為可提取的特征供算法學習。Dai 等[20]提出了一種在提取心房活動時減少 QRS 波殘留的新型方法,在識別房顫中得到較高的準確性。Khamis 等[21]將 QRS 波、T 波形態納入學習的范圍,用 5 920 份 ECG 訓練算法,因綜合了多種特征變量,最終平均 F1 比值為 0.78。研究中所描述的特征和方法,其性能具有可比性并且未發生過擬合現象。ECG 上波形復雜,除了明顯的 PQRST 波以外,甚至可能存在人類無法察覺的不明顯波形,卻能被機器捕捉乃至成為決定性因素,這需要人們進一步的探索和驗證。
3.1.2 基于心率變異性
除了對典型波形的研究,針對心率變異性(heart rate variability,HRV)也提出了不少模型。Chesnokov 等[22]使用 51 份 ECG 樣本對 ANN 和支持向量機分類器進行了訓練測試,ANN 得到最優的結果,敏感性 76%,特異性 93%,陽性預測值 94%。該 ANN 模型能夠在陣發性房顫發生(62±21)min 之前進行實時預測。這就使得 AI 利用 HRV 這一特征提前預測房顫發生成為可能。因為該研究的模型只能提前約 60 min 進行預測,所以如果能夠將這一時間延長,對臨床實踐來說或許更有意義。Christov 等[23]設計了一個線性分類算法,提取了數據中的 44 個特征,其中包括 HRV、波形等,最終算法檢測房顫 F1 比值為 0.81。該研究人員將所有的特征進行了排序,結果為 RR 間期差異這一特征對總的 F1 比值貢獻最大。Henzel 等[24]使用 4 種基于 RR 間期的數據特征和線性分類器來自動化識別房顫和正常竇性心律。Boon 等[25]則利用 HRV 的優化算法和非主導分類遺傳算法來區分房顫信號,其主要分析了 HRV 的時域、頻域特征,準確率達到了 87.7%,并且所采用的 HRV 信號長度從 30 min 降到了 5 min。因此,HRV 作為反映心臟活動與否的重要指標,我們可以通過 AI 更加方便地分析逐次心搏之間的差異,即使是在醫生看來正常的 RR 間期。
3.1.3 基于心電圖時程
算法模型接受不同長短的 ECG 信號(幾秒到數十秒)也可以有不同的準確率。現大多數研究采用 12 導聯 10 s 的 ECG 數據,但是存在所納入的數據中信號不全的可能,這對整個模型的訓練影響較大,同時,如果延長時長則增加了算法所要調節的參數,模型的處理速度便會降低。Fan 等[26]通過融合多種 CNN 模型,從短時程 ECG 數據中有效地檢測房顫。同時 ML 模型已經發展成可以進行遠程監控預測并報警的系統。臨床中患者 ECG 信號的時程不一,使機器接受不同長度的數據不僅避免了醫生來選擇,還能提高檢測的準確性。Yao 等[27]提出了一種 ATI-CNN(attention-based time-incremental convolutional neural network)新型算法,利用 CNN、長短記憶網絡和一個集中模塊綜合了 ECG 時間、空間上的信息,能夠接受不同長度 ECG 信號的輸入,并且在實時處理中減少了一半的參數,對于模型的性能和速率都有所提高,最終檢測房顫的 F1 比值達到了 0.92。
3.1.4 基于心電圖導聯
通常我們采用 8 導聯或 12 導聯 ECG 記錄心臟在各個方向上的電信號。大多數研究都是將患者 12 導聯 ECG 數據輸入模型中。但是 Chen 等[28]依然使用 CNN,經過訓練后發現使用單導聯 ECG 數據所得到的模型性能只比使用全導聯 ECG 的模型性能遜色一點。通常 aVR 導聯在臨床中容易被忽略,但是在該研究中其對心律失常的檢測綜合性能是最優的。目前很多研究采用的數據均為單導聯短時程,這不僅去除了過多干擾信號,還能夠減少機器處理的數據量,加快了機器的整體速度。從不同導聯入手,不斷試驗機器性能,或許也是行之有效的。
因此我們可以從該方面利用 ECG 數據來進行分析和預測,同時 ML 有相應的能力去處理我們想要處理的具體數據。
3.2 利用基線數據預測房顫
另外一個應用便是使用非監督式學習區分不同表型患者。臨床上很多患者術前有房顫但術后沒有,有的反之。這些情況的出現對于臨床醫生來說如若難以判斷,將影響術前術后相關的治療。非監督式學習的出現能夠很好地處理這些問題。非監督式學習在心臟病學中的一個最有前景的應用便是對心臟疾病的子分型或者是精準分型[4]。目前提出的精準醫學表示根據患者的具體情況來確定具體的疾病預防和治療方法。不同于傳統“一刀切”的治療方法,醫療人員會考慮患者基本信息的細微不同對診療手段進行適當調整和改變。心臟疾病大多是慢性、異質性、合并多種疾病,通常在疾病癥狀發生之前有很長時間的病理生理變化。許多疾病的概念如心力衰竭、冠狀動脈粥樣硬化性心臟病等大而寬泛,但是不同的分型有不同的發病機制[4]。因此,如果能將這類疾病進行具體的多種分型,不同的子型預后不同,提示風險特征不同,有利于醫生及早發現高危患者從而進行早期的特殊管理。Pimor 等[29]依靠無監督式學習中的使用密集表型數據的無偏差聚類分析算法,依據人口學統計學數據、患者的醫學背景、血流動力學狀況、治療、癥狀、手術數據和住院結局等,將 122 例因二尖瓣關閉不全行手術的患者分為 3 種不同的表型。結果表型 1 代表低風險患者(危險因素較少,心室擴張較少),主要特征與總體人群無差異;表型 2 代表中危患者,主要為慢性阻塞性肺疾病病史的吸煙男性,超聲心動圖示心臟重構更明顯;表型 3 代表高危患者,主要包括年齡較大的瘦小女性,多患有高血壓、術前房顫等合并癥患者。不同表型預后不同,提示風險特征不同。與表型 1、2 相比,表型 3 的患者更易因心血管事件再住院和發生術后長期房顫。因此依據表型不同可及早發現高危患者,改善重度二尖瓣關閉不全患者的管理;對于無癥狀的表型 3 個體在早中期進行二尖瓣手術可以降低房顫發生風險;對于陣發性房顫患者,可在瓣膜手術期間進行肺靜脈隔離以防止術后房顫。這種無監督式學習的算法有助于對術前術后房顫的預測和對異質性疾病患者的管理。Budzianowski 等[30]利用支持向量機預測肺靜脈球囊消融術后早期房顫的復發率。AI 在預測術后房顫的過程中,也可以依此來判斷術后房顫發生的危險因素,如術前房顫、糖尿病、他汀類藥物的使用等。
非監督式學習的聚類算法雖然沒有監督式學習的算法使用廣泛,但是由于現如今患者生活習慣和個體特征大相徑庭,統一模版型的治療或許不再適應每個人,更好地識別高危患者加以早期干預,或許是無監督式學習的應用所在。
4 前景
AI 在醫學的應用目前主要有兩個方面,一是發現新的臨床規律,二是促進精準醫學發展。以往醫學主要依靠統計學方法,但是樣本不同于總體,會產生偏差。可一旦引入了云計算,醫學研究進入大數據時代。巨大樣本數據支持的情況下,更容易發現其中的規律,對臨床更具有指導意義,甚至可能推翻之前的結論。隨著技術不斷更新發展,各種信息如電子病歷檔案基因組學、影像學資料、監護數據等,能夠更好地為醫生利用。數據科學與醫學的結合,可以開創全新的診療模式。不同的醫院有不同的數據庫資源,基于當前醫療資源共享平臺,醫生可及時查看患者在不同時間不同地點的就診記錄,以此全面分析患者的健康狀況。AI 將使個性化醫療-個人健康數據的使用更加廣泛,更容易為所有患者接受。個性化醫學將是未來發展的方向。目前全世界房顫患者眾多,麻省理工心律失常數據庫(MIT/BIH)、美國心臟協會(AHA)心律失常數據庫、陣發性房顫(PAF)數據庫等收集的大量 ECG 數據便是利用 AI 治療房顫的數據基礎。這些工具的應用是無限的,最終可能通過模式識別和早期診斷和干預為房顫等慢性疾病帶來更好的治療。
AI 類似技術通過移動設備進行實時決策和與患者接觸可能會帶來更好的結果,在智能手機和其它移動終端設備上使用配備 AI 的醫療應用程序和工具,可以減少對專家治療的需求,為醫療系統節省大量的成本。許多智能手表推出的 ECG 功能,可以監測用戶心率,發現某些心臟問題,如不規則的脈搏和房顫,從而提高對房顫的警惕性,做到早預防、早知曉[31]。Perez 等[32]對 Apple Watch 檢測房顫進行了研究,Apple Watch 接收到不規則脈搏信號的概率很低,在收到不規則脈搏信號的參與者中,34% 的人在隨后檢測中出現了房顫,同時后續不規則脈搏陽性預測值為 0.84。因此,移動技術時代來臨,此類電子裝置對動態人群中房顫的檢測和房顫持續時間的評估具有高度敏感性[33],可能是一種廉價的、非侵入性的長期房顫監測和管理方法。
Yan 等[34]嘗試了一種新型房顫檢測方法,該方法應用智能手機攝像頭分析無身體接觸的面部光電容積描記信號。同時使用單數碼相機和預先培訓好的深度卷積神經網絡(DCNN)分析多個患者信號,前瞻性地評估了高通量房顫檢測的可行性。此方法不僅避免了一對一篩查,而且對患者要求很低,這樣可以節約患者的時間并減少工作量。該研究為我們提供了一種全新的房顫檢測方法,人臉識別房顫。
除此之外,房顫的發生通常因為心房的異位起搏點,導管射頻消融是治療方法之一。現利用 AI 技術不僅可以識別異位起搏點,還可以在射頻消融過程中,利用 AI 三維重建技術,進行消融指數的自動化計算,實現更加充分、有效的治療。當然,房顫發生有眾多的機制,電生理機制、自主神經系統的作用、遺傳學基礎[1]等,我們期望未來可以借助 AI 更加深入地了解房顫。
5 問題和局限性
5.1 數據問題
數據是 AI 應用的基礎。數據問題包括:(1)數據質量問題。準確的數據對準確的模型來說必不可少。如果用于調整模型的數據本身就存在偏差,那么該模型就難以泛化到大眾。在國內外大多數醫院里收集到的數據或多或少質量欠佳,直接用于算法得到的準確率偏低。如 P 波通常包含有眾多的噪聲,使得基于形態學特征的房顫監控準確率下降[2]。雖然有很多特征提取步驟,如獨立成分分析、波形轉換、光譜分析和熵值,但是在特征提取過程中會產生大量不相關冗雜的特征,不僅會降低預測的準確性,還會降低模型的處理速率。況且機器訓練學習的數據種類是普遍的,占大多數的。一旦遇到少見的患者特征亦或是圖像,因為缺乏此方面的提前學習,機器是難以診斷的。(2)標注問題。原始數據的龐大使得標注的工作量難以想象,很多人認為程序工程師只是在不斷改進模型,但其實是在做數據的預處理。將 AI 應用在房顫的預測中,大多數研究需要專業的心臟病醫生對數以萬計的 ECG 數據進行標注。醫生是高度個性化的,同一個檢查結果不同醫生會給出多種診斷意見,有時候對錯難以辨別。標注需要的是金標準,如果對于數據的標注出現了錯誤,將會導致整個模型的準確率嚴重下降。(3)數據的花費問題。如此大量的數據應用花銷也是巨大的。整個模型的試驗調整也是耗費人力、物力的。
5.2 機器學習中的黑匣子
機器的不透明性和難解釋性是一個重要的問題[10]。我們輸入數據得到輸出結果,稱為預測。但是為什么機器會得到想要的結果,我們是不清楚的。盡管有許多方法技術解釋了模型的結果,通過分析具體的參數和特征之間的權重來證實其正確性,強調了每一個預測結果最具區別的部分,但是我們還是不能夠確切地知道 ML 和 DL 為何就能夠做出正確的決策。醫學領域中,疾病的診斷是有因果可循的,醫生還是更加愿意相信自己多年的臨床經驗,從臨床癥狀、直接的輔助檢查來邏輯推理出正確的結果。因為沒有生物學上的可靠依據,想要掌握推廣 AI 技術也實屬難事。
5.3 泛化問題
擬合一直是 ML 亟待解決的問題。雖然現在有很多研究都取得了不錯的結果,敏感性、特異性、準確性等都很高,但是不能夠代表此研究訓練出來的模型可以推廣。許多方法僅僅使用來自一個數據庫的數據進行訓練和測試,如 MIT/BIH 數據庫甚至更小型的數據庫。來自單個數據庫的數據可能并不能很好地全面評估一個算法的表現力[2]。診斷和監控房顫的算法需要能夠盡可能的泛化,同時還要有高特異性和高敏感性,但目前許多算法并不能滿足所有的要求。
5.4 倫理問題
倫理一直是醫學非常重視的方面。設想一個依靠 ML 診斷的患者發生了醫療事故,隨后責任歸屬便出現了分歧。除此之外,數據必然包含了患者的隱私和臨床信息。因此,合法使用這些信息也是重要的方面。盡管現在有了相應的法律法規,比如將患者的個人信息用于統計學目的是被允許的,但是出于尊重,在這些信息用于訓練診斷和決策的 AI 模型之前,患者都應該有知情權[10]。
5.5 其它
目前 AI 還處于初級階段,還有很多技術不成熟,加之基本都是程序設計師在構建模型,而臨床醫生鮮有參與。現在的 AI 是基于國際開源的一些模型,所以應用局限于語音圖像識別;整個設計依靠現代簡單的數學邏輯,難以構建遵循臨床醫學規律的具備邏輯推理能力的數據模型,因此對于房顫這類臨床疾病預測有潛在干擾。AI 應用在基層醫療理論上是可行的,但許多基層醫生對機器得出的結果有時難以抉擇,對疾病的準確診斷有一定風險。
6 結語
AI 看起來遙不可及,然而它已經滲透到醫療領域的方方面面。由于云計算、大數據的快速發展,醫學乘上時代的快車,利用 AI 來為醫務人員和患者服務。隨著 ML、DL 技術的發展和應用,患者在利用常規輔助檢查診斷時,可以考慮使用 AI 來預測和識別房顫。對于患者來說,能早期識別房顫、降低卒中等并發癥的發生率、明顯改善預后、提高生活質量;對于醫生來說,能早期識別疾病、盡早加以干預、調整治療方案,同時還能減輕工作負擔。但是,在 AI 廣泛應用到臨床實踐之前,我們還有很長的一段路要走。算法模型的各種問題亟待解決,同時也要求醫療人員去了解掌握數據科學并參與其中的構建,這樣醫生才能足夠信任機器去替代自己進行一部分工作。
利益沖突:無。
作者貢獻:何康參與文章的撰寫和修改;武忠對文章的相關內容進行指導和修正。