引用本文: 田楚偉, 陳翔溆, 朱桓毅, 秦晟博, 石柳, 芮云峰. 機器學習在創傷骨科中的應用與展望. 中國修復重建外科雜志, 2023, 37(12): 1562-1568. doi: 10.7507/1002-1892.202308064 復制
人工智能是一門新的技術科學,包括研究、開發用于模擬、延伸和擴展人類智能的理論、方法、技術及應用系統[1]。近年來,隨著數據處理能力飛速發展、醫工交叉逐步深入,人工智能在醫學領域得到了廣泛應用[2],在各種任務中的表現與人類相當或者更好,尤其是圖像識別以及數據分析領域[3]。作為人工智能的一個分支,機器學習是一門通過編程讓計算機從數據中進行學習的科學[4],包含了深度學習和人工神經網絡等分支,在圖像處理、語言識別等領域具有廣闊應用前景[5-6]。
由于經濟飛速發展和工業化程度提高,交通事故和工程意外等創傷事件已成為危害人類健康的重要因素,美國2016年死亡原因調查報告顯示創傷是導致45歲以下人群死亡的主要原因[7]。由于創傷骨科患者的復雜性,診療過程中往往需要多學科協作,預后受到醫療資源分配的重要影響。目前,科技發展已經步入大數據時代,臨床醫學和工程科學的交叉合作日漸緊密,如何結合工程科學進一步優化創傷骨科的診療流程和醫療資源配置,成為未來研究的重中之重。現回顧機器學習概念,綜述其在創傷骨科影像識別、臨床決策及評估、圍術期與預后風險預測及數據處理中的應用進展,展望機器學習在創傷骨科的應用前景。
1 機器學習概念
機器學習作為人工智能的一個分支,旨在探討數據分析與計算機算法的交集[8]。1959年,人工智能先驅Arthur Samuel定義機器學習是一個研究領域,讓計算機無需進行明確編程就具備學習能力。該定義指出了機器學習的3個階段,即數據預處理、模型訓練和評估[9]。數據預處理階段包括研究問題的確立、數據集建立以及訓練集和測試集的劃分。模型訓練階段包括監督學習、無監督學習以及強化學習3種學習方式,其中監督學習所需要的數據量與學習時間最少[10-11]。評估階段是通過測試集驗證生成的模型來確定模型性能優劣。
近年來,許多機器學習模型在醫學數據處理、輔助診斷以及預后預測方面得到了廣泛應用。目前常見的機器學習算法包括樸素貝葉斯、決策樹、支持向量機、人工神經網絡等(圖1)。其中,決策樹能夠從一系列有特征和標簽的數據中總結出決策規則,并以樹狀圖結構呈現,可以解決分類和回歸問題[12]。隨機森林以及梯度提升器(eXtreme Gradient Boosting,XGBoot)是基于決策樹模型的兩種集成算法,通過對樹的堆疊可以大幅提升模型應用性能[13]。支持向量機是近年來最受關注的機器學習算法之一,最接近深度學習,已被廣泛應用于圖像分類以及數據識別分類[14]。此外,傳統統計學方法,例如邏輯回歸和樸素貝葉斯,在機器學習模型相關研究中也有著廣泛應用。人工神經網絡是一種模擬人類神經元處理方式的機器學習算法,這一構想由McCulloch于20世紀40年代提出[15]。2006年, Hinton等[16]在其論文中展示了以最先進的精度識別手寫數字的深度神經網絡算法,并將這種技術稱為“深度學習”。與簡單的一層或兩層神經網絡相比,深度學習復雜的網絡層次可以讓算法學習更復雜的數據模式[17-18]。卷積神經網絡是最常見的深度學習模型,其通過在圖像中搜索簡單特征并匯總,以得到更復雜的特征[19]。對于分類特征,卷積神經網絡會為圖像作出分類決策,并和已知的圖像分類進行比較來得到誤差[20]。通過這一訓練過程,卷積神經網絡可以更新其學習參數,并對新的圖像作出分類決策[20-21]。

a. 樸素貝葉斯;b. 決策樹;c. 支持向量機;d. 人工神經網絡
Figure1. Schematic diagram of common machine learning algorithmsa. Naive Bayes; b. Decision tree; c. Support vector machine; d. Artificial neural network
如今,隨著深度學習的飛速發展,這項技術已經深入人們的生活,從網絡瀏覽的智能推薦到語音識別、無人駕駛技術。近年來,其在醫療領域的應用也逐漸深入,尤其是在影像識別領域,有著廣袤的應用前景。
2 機器學習在創傷骨科影像識別與診斷中的應用
骨科疾病的診斷極其依賴影像學證據,主要包括X線片、CT以及MRI。隨著近年來深度學習算法的飛速發展,機器學習在影像識別領域展現出了廣闊應用前景[20],尤其在創傷骨科,機器學習及其衍生成像技術在協助骨折診斷方面有著極高準確率[22]。在深度學習誕生之初,Brett等[23]便探討了通過計算機影像識別技術標記椎體,并構建了識別非側凸患者T4~L4椎體骨折模型。在卷積神經網絡將ImageNet數據集120萬張高分辨率圖像準確分類之后,這一領域取得重大突破,深度學習逐漸成為最流行的機器學習技術[24]。
上肢骨折方面,Kim等[25]通過深度學習算法模型訓練了11 112張橈骨遠端骨折與正常的腕關節X線片,并進行了外部驗證,其模型診斷特異度、靈敏度以及受試者工作特征曲線下面積(area under curve,AUC)分別為0.88、0.90、0.954,這一研究展示了卷積神經網絡在識別橈骨遠端骨折方面的應用前景。對于難以診斷的隱匿性骨折,臨床醫師往往會選擇CT檢查來進行排除,而深度學習算法可以有效發現隱匿性骨折,減少漏診和過度檢查。此外,Chung等[26]開發了一個基于卷積神經網絡診斷肱骨近端骨折并識別其Neer分型的模型,結果顯示該模型檢測肱骨近端骨折準確性高,分型準確性達0.65~0.85;對于復雜的3~4部分肱骨近端骨折,其基于X線片診斷的準確性明顯優于骨科及放射科醫師。
下肢較上肢更容易發生隱匿性骨折,因此深度學習算法作為輔助診斷方式有著更大的潛在應用價值[27]。Urakawa等[28]的研究顯示隱匿性髖部骨折發生率為4%~9%,為此他們設計了一個基于卷積神經網絡診斷股骨轉子間骨折的模型,使用了1 773張骨折影像以及1 573張非骨折影像,結果顯示與矯形外科醫師相比,深度學習模型有著更準確的判別。此外,Mutasa等[3]使用深度學習算法對127張GardenⅠ、Ⅱ型,610張Garden Ⅲ、Ⅳ型股骨頸骨折以及326張正常髖關節X線片進行建模,以期識別股骨頸骨折并進行Garden分型。結果顯示,該模型識別骨折準確性為0.92、AUC為 0.92,骨折分型準確性為0.86、AUC為0.96。對于漏診率較高的脛腓骨下段骨折以及足部骨折,Kitamura等[29]通過迭代298張骨折影像和298張正常影像,采用深度學習算法檢測這些部位的隱匿性骨折,準確性達0.76~0.81。在CT識別及三維建模方面,湯小勇等[30]的研究顯示在Mimics軟件中通過人工智能輔助分割圖像,可以大幅縮短膝關節三維模型建立時間,有助于提高放射科醫師及骨科醫師的診斷效率,并且這一系統在膝關節手術術前規劃中也有著廣闊應用前景。另外,有學者通過深度學習模型輔助CT斷層影像進行跟骨骨折分型研究,同樣有著很高的準確性[31]。
此外,在椎體骨折領域,臨床醫師通過影像學資料診斷椎體壓縮性骨折的假陰性率為29.5%~46.5%[32]。Tomita等[33]使用卷積神經網絡算法來識別和定位椎體骨折情況,研究共納入1 432張CT影像進行訓練,準確性為0.89。另外,Muehlematter等[34]基于58例脊椎不全骨折患者的CT資料開發了一個骨質分析結合機器學習的診斷模型,雖然該模型可以高精度識別不全椎體骨折,但是在分析單個椎體骨折發生風險時準確性較低。未來隨著不同人群的CT影像樣本增加,以及影像資料提取精確度提升,模型預測準確性有望進一步提高。見表1。

上述研究結果顯示深度學習的影像識別性能與骨科及放射科醫師相似,但在運算效率以及識別隱匿性骨折方面效能更佳。此外,骨折分型對治療方案有著指導意義,隨著算法效率以及影像資料數據量的提升,深度學習對骨折診斷和分型的精度也將逐漸提高。人工智能輔助診斷有利于臨床醫師快速確定診療方案、進一步優化醫療資源分配,帶來巨大的社會和經濟效益。
3 機器學習在創傷骨科臨床決策及評估中的應用
與傳統邏輯回歸以及線性回歸方法相比,許多機器學習算法可以識別非線性模型,從而提高預測結果準確性[35-36]。創傷骨科的復雜性決定了其臨床治療決策存在著較大可變性,近年來越來越多學者將機器學習算法應用到臨床決策中[37-38]。機器學習算法建模以及臨床轉化流程見圖2。

長期以來,創傷事件被認為是不可預測的。隨著人工智能的飛速發展,一些模型被證明可以預測創傷事件發生概率。Dennis等[39]采用人工神經網絡成功預測了多個創傷中心的患者容量和創傷事件發生高峰期,為創傷調度系統分配醫療資源提供了數據支持。此外,Stonko等[40]納入了時間和天氣因素來構建預測創傷事件數量、創傷嚴重程度以及急診手術病例數的機器學習模型,該模型準確性高,有助于創傷管理關口前移并進一步合理分配醫療資源。
在跌倒及骨折風險評估方面,Kong等[41]比較了梯度提升算法CatBoost、支持向量機、邏輯回歸以及骨折風險評估工具(WHO Fracture Risk Assessment Tool,FRAX)在預測骨質疏松癥患者骨折風險方面的效果,結果顯示CatBoost算法在預測脆性骨折方面顯著優于FRAX(AUC 0.688 vs. 0.663,P<0.01)。此外,Forth等[42]通過機器學習算法分析了測力板所收集的老年人站立受力,通過建模得出姿勢穩定性評分(postural stability,PS)(1~10),PS分數越高,穩定性越高,跌倒風險越低,通過算法分析得出的PS分數準確性為0.78。而作者的隨訪資料表明跌倒高風險人群(PS 1~3分)在1年內跌倒的可能性是低風險人群(PS 7~10分)的3倍。通過對老年人群跌倒風險的評估,可以快速識別跌倒高危人群及危險因素,從而達到“上醫治未病”的預防效果。
創傷骨科患者治療具有緊急和復雜性的特點,往往需要醫師在急診時對患者進行預處理,而機器學習算法作為輔助手段可以提高醫師處理效率[43]。目前,這一領域的研究主要聚焦在對創傷患者病情及預后的評估。Liu等[44]開發了一種基于多參數機器學習算法和系統的模型,預測創傷患者對救生干預的需求,準確性達89.8%,為機器學習算法輔助急診評估并干預創傷患者探索了應用可能。風險評估及預后預測方面,Cardosi等[45]通過回顧美國國家創傷數據庫 2 007 485例創傷患者的臨床數據,采用機器學習算法構建了創傷預測模型,分析不同患者的并發癥風險和預后情況,模型AUC在0.85~0.87范圍。接著,作者探索了這一創傷預測模型推廣應用的可行性,認為該模型可以為醫療決策者提供決策支持。此外,Lee等[46]通過對創傷患者年齡組分類、嚴重程度選擇和創傷相關變量的評分校準,提高了XGBoost算法預測創傷患者短期及長期預后的性能,并給出了影響患者預后的高危特征。
由于創傷的復雜性,如何獲得標準化臨床數據是機器學習在創傷骨科領域臨床轉化的關鍵。面對復雜多元的臨床數據,我們可以通過機器學習算法進行數據清洗及歸一化處理,以獲得同質性數據用以建模。此外,積累大規模的臨床數據將有助于進一步發掘和總結創傷骨科的臨床規律,加速創傷骨科領域研究的進展。
4 機器學習在創傷骨科圍術期與預后風險預測中的應用
近年來,許多研究聚焦了機器學習在創傷骨科患者圍術期及術后長期并發癥風險預測中的應用。Zhao等[47]比較了機器學習算法和邏輯回歸等傳統統計學方法在預測髖部骨折患者術后譫妄發生率及其危險因素的效果,結果顯示XGBoost、支持向量機以及隨機森林算法預測準確性在0.83~0.87之間,均高于邏輯回歸。接著,作者綜合了各個模型的特征重要性,確立了術前等待時間、血管加壓藥物的使用、虛弱指數、癡呆/卒中史、手術持續時間以及麻醉方式是導致髖部骨折患者術后譫妄最主要的6個危險因素。Li等[48]開發了一種基于機器學習的預測模型,以評估髖部骨折患者術后轉入ICU、并發癥發生以及延遲出院的風險,結果顯示機器學習模型在預測術后ICU轉科(0.835 vs. 0.692,P<0.01)、并發癥發生(0.810 vs. 0.629,P<0.01)以及延遲出院(0.832 vs. 0.618,P<0.01)的準確性方面均優于美國麻醉醫師協會全身狀態分級系統(ASA-PS)。對于術后長期并發癥,Klemt等[49]采用機器學習算法評估了人工全髖關節置換患者術后二次翻修的危險因素,判別、校準及決策曲線分析顯示人工神經網絡、隨機梯度提升、隨機森林和彈性懲罰邏輯回歸 4種機器學習模型均取得了優異表現。通過機器學習方法對圍術期并發癥及其危險因素的識別,臨床醫師可以快速識別高危患者并及時處理,為優化圍術期診療流程、降低并發癥發生率提供了新的研究方向。
此外,在預測患者短期和長期預后方面,機器學習算法也有著很高的準確性。DeBaun等[50]比較了不同算法預測患者髖部骨折后30 d死亡率的性能,結果顯示人工神經網絡的AUC(0.92)最高,其次是邏輯回歸(AUC 0.87)和樸素貝葉斯(AUC 0.83)。Forssten等[51]比較了支持向量機、樸素貝葉斯、隨機森林以及邏輯回歸算法預測髖部骨折患者術后1年死亡率的性能,結果顯示前3種算法存在高估患者死亡率的可能,而邏輯回歸在預測長期預后方面性能最優,這一研究肯定了傳統統計學方法在預測預后方面的應用優勢。
5 機器學習在創傷骨科臨床應用中的挑戰
隨著科學技術的發展以及算法效率的提升,機器學習在醫療領域的應用逐漸深入[52]。在創傷骨科領域,機器學習算法作為一種輔助手段,在骨折診斷與分型、患者圍術期護理及預后分析方面都有著廣闊應用前景[53-54]。然而,在機器學習算法應用過程中仍存在一些挑戰[4]。
第一,機器學習研究及應用的倫理原則。在機器學習研究及應用過程中,如何確保數據的準確性和隱私保護是值得關注的問題[55]。現階段機器學習領域缺乏一個公認的倫理實踐指導規范,但在研究過程中仍應確保科學性服從倫理性的原則。
第二,臨床數據庫中數據的質量和數量。訓練的機器學習模型需要大量高質量數據,而創傷骨科患者的復雜性決定了收集的數據難以同時滿足同質性和多樣化兩個需求,這就需要進一步擴大臨床數據的樣本量及樣本特征數量,為模型擬合提供充足和多元的樣本支持。
第三,機器學習模型的可解釋性。機器學習模型對數據的擬合能力強于傳統統計學方法,然而其帶來的模型過擬合是一個繞不開的話題。強機器學習模型如深度神經網絡等被視為“黑盒”,往往難以解釋其結果及推理過程[56]。因此,如何評估機器學習模型的可解釋性并構建解釋性強的應用模型成為了一個亟待解決的問題。
第四,通用模型無法滿足個性化診療需求。創傷骨科領域的臨床實踐需要高度個性化的治療方案。由于臨床醫學并不是一門程序化科學,在創傷骨科領域,臨床醫師的主觀能動性以及針對性治療決策至關重要。每例患者的創傷類型、嚴重程度和生理狀況各異,通用的機器學習模型可能無法完全滿足個體化需求,開發針對個體患者的定制化算法和治療計劃將成為未來發展方向之一。
6 機器學習在創傷骨科臨床應用的展望
盡管面臨挑戰,機器學習算法在創傷骨科臨床應用中也呈現出巨大應用前景。創傷骨科的臨床應用中,創傷類型的準確分類對于制定合理的治療方案至關重要。通過對大量臨床數據和影像數據的分析,機器學習模型能夠識別和分類不同類型創傷骨折,從而幫助醫生更準確地做出診斷和治療決策,有助于縮短診斷時間,降低誤診率,提高患者的治療效果。此外,通過分析患者的臨床數據、生理指標以及影像數據,機器學習模型可以預測患者發生創傷的風險。基于這些預測結果,醫生可以采取相應干預措施,減少患者發生創傷可能性。這對于高風險患者的管理和監控具有重要意義,從而達到“治未病”的目的。
院前,通過開發區域創傷系統,根據患者分布的地理位置空間來確定創傷中心的最佳位置以及高峰期創傷急診的患者負荷,以期進一步合理配置創傷資源、降低單個創傷中心的負擔[57]。Dooley等[58]介紹了基于需求的創傷系統評估工具,這一系統采用了地理空間建模,為地方創傷中心規劃提供了證據支持,有助于評估區域內人口的創傷發生率、創傷中心覆蓋率以及潛在的經濟影響。
術前,臨床醫師可以通過機器學習模型分析患者影像數據,制定最佳手術計劃。米爾阿地力·麥麥提依明等[59]采用人工智能術前規劃系統在人工全髖關節置換術前進行假體型號預測,獲得了較高的準確性和可重復性。此外,對于發生骶骨脆性骨折的老年患者,Kamer等[60]通過基于CT的人工智能三維建模來評估骶髂關節骨性通道,并在術前用以規劃植入物位置。隨著技術的進步,通過人工智能進行術前規劃的精度也將逐漸提高,這有助于縮短手術醫師學習曲線,使手術過程更加精確和安全,從而提高手術成功率,降低手術風險。
術中,通過機器學習算法進行精確定位以及人工智能增強現實技術可以輔助手術醫師操作,降低手術難度。殷耀斌等[61]報道了1例機器人輔助四角融合經皮螺釘內固定病例,通過人工智能輔助定位實現了微創而精準的經皮四角融合,從而減少了透視次數及放射性暴露。另外,賈鵬等[62]報道了國產通用型骨科手術機器人天璣(TiRobot)在創傷骨科領域的應用,為骨盆髖臼骨折、髖部骨折、手足骨折等固定提供了微創化、智能化、精準化的解決方案。隨著增強現實技術及人工智能的飛速發展,將進一步推動手術機器人的臨床轉化。
此外,術后康復作為創傷骨科不可或缺的一環,機器學習算法可以根據患者的臨床數據和康復進展,為患者制定個性化康復方案。Santilli等[63]構建了4個基于決策樹的集成模型,用于評估骨科及神經科患者出院后的康復計劃改善患者功能的潛力。通過分析及檢測患者的康復數據,模型可以預測康復進展,幫助醫師做出及時調整,以最大程度提升康復效果。
綜上述,隨著近年來技術進步及算法效率的提升,機器學習在創傷骨科領域的應用漸廣。機器學習算法在影像資料建模(即骨折識別)、診斷與分層,以及臨床決策(包括跌倒與骨折預防、急診處理、圍術期與預后風險預測)等方面,均有著良好準確性。當前,機器學習在創傷骨科中的應用還處于研究與探索階段,隨著科技進步和數據量增長,機器學習模型的精度和應用價值將會大幅提升,在輔助診斷、指導決策、制定個性化醫療方案以及合理配置臨床資源等領域有著廣闊的應用前景。
利益沖突 在課題研究和文章撰寫過程中不存在利益沖突;經費支持沒有影響文章觀點及其報道
作者貢獻聲明 田楚偉:文章撰寫及修改;陳翔溆、朱桓毅:觀點形成與綜述構思;朱桓毅、秦晟博:文獻檢索;田楚偉、陳翔溆、石柳:文獻篩選;芮云峰:選題指導與綜述構思
人工智能是一門新的技術科學,包括研究、開發用于模擬、延伸和擴展人類智能的理論、方法、技術及應用系統[1]。近年來,隨著數據處理能力飛速發展、醫工交叉逐步深入,人工智能在醫學領域得到了廣泛應用[2],在各種任務中的表現與人類相當或者更好,尤其是圖像識別以及數據分析領域[3]。作為人工智能的一個分支,機器學習是一門通過編程讓計算機從數據中進行學習的科學[4],包含了深度學習和人工神經網絡等分支,在圖像處理、語言識別等領域具有廣闊應用前景[5-6]。
由于經濟飛速發展和工業化程度提高,交通事故和工程意外等創傷事件已成為危害人類健康的重要因素,美國2016年死亡原因調查報告顯示創傷是導致45歲以下人群死亡的主要原因[7]。由于創傷骨科患者的復雜性,診療過程中往往需要多學科協作,預后受到醫療資源分配的重要影響。目前,科技發展已經步入大數據時代,臨床醫學和工程科學的交叉合作日漸緊密,如何結合工程科學進一步優化創傷骨科的診療流程和醫療資源配置,成為未來研究的重中之重。現回顧機器學習概念,綜述其在創傷骨科影像識別、臨床決策及評估、圍術期與預后風險預測及數據處理中的應用進展,展望機器學習在創傷骨科的應用前景。
1 機器學習概念
機器學習作為人工智能的一個分支,旨在探討數據分析與計算機算法的交集[8]。1959年,人工智能先驅Arthur Samuel定義機器學習是一個研究領域,讓計算機無需進行明確編程就具備學習能力。該定義指出了機器學習的3個階段,即數據預處理、模型訓練和評估[9]。數據預處理階段包括研究問題的確立、數據集建立以及訓練集和測試集的劃分。模型訓練階段包括監督學習、無監督學習以及強化學習3種學習方式,其中監督學習所需要的數據量與學習時間最少[10-11]。評估階段是通過測試集驗證生成的模型來確定模型性能優劣。
近年來,許多機器學習模型在醫學數據處理、輔助診斷以及預后預測方面得到了廣泛應用。目前常見的機器學習算法包括樸素貝葉斯、決策樹、支持向量機、人工神經網絡等(圖1)。其中,決策樹能夠從一系列有特征和標簽的數據中總結出決策規則,并以樹狀圖結構呈現,可以解決分類和回歸問題[12]。隨機森林以及梯度提升器(eXtreme Gradient Boosting,XGBoot)是基于決策樹模型的兩種集成算法,通過對樹的堆疊可以大幅提升模型應用性能[13]。支持向量機是近年來最受關注的機器學習算法之一,最接近深度學習,已被廣泛應用于圖像分類以及數據識別分類[14]。此外,傳統統計學方法,例如邏輯回歸和樸素貝葉斯,在機器學習模型相關研究中也有著廣泛應用。人工神經網絡是一種模擬人類神經元處理方式的機器學習算法,這一構想由McCulloch于20世紀40年代提出[15]。2006年, Hinton等[16]在其論文中展示了以最先進的精度識別手寫數字的深度神經網絡算法,并將這種技術稱為“深度學習”。與簡單的一層或兩層神經網絡相比,深度學習復雜的網絡層次可以讓算法學習更復雜的數據模式[17-18]。卷積神經網絡是最常見的深度學習模型,其通過在圖像中搜索簡單特征并匯總,以得到更復雜的特征[19]。對于分類特征,卷積神經網絡會為圖像作出分類決策,并和已知的圖像分類進行比較來得到誤差[20]。通過這一訓練過程,卷積神經網絡可以更新其學習參數,并對新的圖像作出分類決策[20-21]。

a. 樸素貝葉斯;b. 決策樹;c. 支持向量機;d. 人工神經網絡
Figure1. Schematic diagram of common machine learning algorithmsa. Naive Bayes; b. Decision tree; c. Support vector machine; d. Artificial neural network
如今,隨著深度學習的飛速發展,這項技術已經深入人們的生活,從網絡瀏覽的智能推薦到語音識別、無人駕駛技術。近年來,其在醫療領域的應用也逐漸深入,尤其是在影像識別領域,有著廣袤的應用前景。
2 機器學習在創傷骨科影像識別與診斷中的應用
骨科疾病的診斷極其依賴影像學證據,主要包括X線片、CT以及MRI。隨著近年來深度學習算法的飛速發展,機器學習在影像識別領域展現出了廣闊應用前景[20],尤其在創傷骨科,機器學習及其衍生成像技術在協助骨折診斷方面有著極高準確率[22]。在深度學習誕生之初,Brett等[23]便探討了通過計算機影像識別技術標記椎體,并構建了識別非側凸患者T4~L4椎體骨折模型。在卷積神經網絡將ImageNet數據集120萬張高分辨率圖像準確分類之后,這一領域取得重大突破,深度學習逐漸成為最流行的機器學習技術[24]。
上肢骨折方面,Kim等[25]通過深度學習算法模型訓練了11 112張橈骨遠端骨折與正常的腕關節X線片,并進行了外部驗證,其模型診斷特異度、靈敏度以及受試者工作特征曲線下面積(area under curve,AUC)分別為0.88、0.90、0.954,這一研究展示了卷積神經網絡在識別橈骨遠端骨折方面的應用前景。對于難以診斷的隱匿性骨折,臨床醫師往往會選擇CT檢查來進行排除,而深度學習算法可以有效發現隱匿性骨折,減少漏診和過度檢查。此外,Chung等[26]開發了一個基于卷積神經網絡診斷肱骨近端骨折并識別其Neer分型的模型,結果顯示該模型檢測肱骨近端骨折準確性高,分型準確性達0.65~0.85;對于復雜的3~4部分肱骨近端骨折,其基于X線片診斷的準確性明顯優于骨科及放射科醫師。
下肢較上肢更容易發生隱匿性骨折,因此深度學習算法作為輔助診斷方式有著更大的潛在應用價值[27]。Urakawa等[28]的研究顯示隱匿性髖部骨折發生率為4%~9%,為此他們設計了一個基于卷積神經網絡診斷股骨轉子間骨折的模型,使用了1 773張骨折影像以及1 573張非骨折影像,結果顯示與矯形外科醫師相比,深度學習模型有著更準確的判別。此外,Mutasa等[3]使用深度學習算法對127張GardenⅠ、Ⅱ型,610張Garden Ⅲ、Ⅳ型股骨頸骨折以及326張正常髖關節X線片進行建模,以期識別股骨頸骨折并進行Garden分型。結果顯示,該模型識別骨折準確性為0.92、AUC為 0.92,骨折分型準確性為0.86、AUC為0.96。對于漏診率較高的脛腓骨下段骨折以及足部骨折,Kitamura等[29]通過迭代298張骨折影像和298張正常影像,采用深度學習算法檢測這些部位的隱匿性骨折,準確性達0.76~0.81。在CT識別及三維建模方面,湯小勇等[30]的研究顯示在Mimics軟件中通過人工智能輔助分割圖像,可以大幅縮短膝關節三維模型建立時間,有助于提高放射科醫師及骨科醫師的診斷效率,并且這一系統在膝關節手術術前規劃中也有著廣闊應用前景。另外,有學者通過深度學習模型輔助CT斷層影像進行跟骨骨折分型研究,同樣有著很高的準確性[31]。
此外,在椎體骨折領域,臨床醫師通過影像學資料診斷椎體壓縮性骨折的假陰性率為29.5%~46.5%[32]。Tomita等[33]使用卷積神經網絡算法來識別和定位椎體骨折情況,研究共納入1 432張CT影像進行訓練,準確性為0.89。另外,Muehlematter等[34]基于58例脊椎不全骨折患者的CT資料開發了一個骨質分析結合機器學習的診斷模型,雖然該模型可以高精度識別不全椎體骨折,但是在分析單個椎體骨折發生風險時準確性較低。未來隨著不同人群的CT影像樣本增加,以及影像資料提取精確度提升,模型預測準確性有望進一步提高。見表1。

上述研究結果顯示深度學習的影像識別性能與骨科及放射科醫師相似,但在運算效率以及識別隱匿性骨折方面效能更佳。此外,骨折分型對治療方案有著指導意義,隨著算法效率以及影像資料數據量的提升,深度學習對骨折診斷和分型的精度也將逐漸提高。人工智能輔助診斷有利于臨床醫師快速確定診療方案、進一步優化醫療資源分配,帶來巨大的社會和經濟效益。
3 機器學習在創傷骨科臨床決策及評估中的應用
與傳統邏輯回歸以及線性回歸方法相比,許多機器學習算法可以識別非線性模型,從而提高預測結果準確性[35-36]。創傷骨科的復雜性決定了其臨床治療決策存在著較大可變性,近年來越來越多學者將機器學習算法應用到臨床決策中[37-38]。機器學習算法建模以及臨床轉化流程見圖2。

長期以來,創傷事件被認為是不可預測的。隨著人工智能的飛速發展,一些模型被證明可以預測創傷事件發生概率。Dennis等[39]采用人工神經網絡成功預測了多個創傷中心的患者容量和創傷事件發生高峰期,為創傷調度系統分配醫療資源提供了數據支持。此外,Stonko等[40]納入了時間和天氣因素來構建預測創傷事件數量、創傷嚴重程度以及急診手術病例數的機器學習模型,該模型準確性高,有助于創傷管理關口前移并進一步合理分配醫療資源。
在跌倒及骨折風險評估方面,Kong等[41]比較了梯度提升算法CatBoost、支持向量機、邏輯回歸以及骨折風險評估工具(WHO Fracture Risk Assessment Tool,FRAX)在預測骨質疏松癥患者骨折風險方面的效果,結果顯示CatBoost算法在預測脆性骨折方面顯著優于FRAX(AUC 0.688 vs. 0.663,P<0.01)。此外,Forth等[42]通過機器學習算法分析了測力板所收集的老年人站立受力,通過建模得出姿勢穩定性評分(postural stability,PS)(1~10),PS分數越高,穩定性越高,跌倒風險越低,通過算法分析得出的PS分數準確性為0.78。而作者的隨訪資料表明跌倒高風險人群(PS 1~3分)在1年內跌倒的可能性是低風險人群(PS 7~10分)的3倍。通過對老年人群跌倒風險的評估,可以快速識別跌倒高危人群及危險因素,從而達到“上醫治未病”的預防效果。
創傷骨科患者治療具有緊急和復雜性的特點,往往需要醫師在急診時對患者進行預處理,而機器學習算法作為輔助手段可以提高醫師處理效率[43]。目前,這一領域的研究主要聚焦在對創傷患者病情及預后的評估。Liu等[44]開發了一種基于多參數機器學習算法和系統的模型,預測創傷患者對救生干預的需求,準確性達89.8%,為機器學習算法輔助急診評估并干預創傷患者探索了應用可能。風險評估及預后預測方面,Cardosi等[45]通過回顧美國國家創傷數據庫 2 007 485例創傷患者的臨床數據,采用機器學習算法構建了創傷預測模型,分析不同患者的并發癥風險和預后情況,模型AUC在0.85~0.87范圍。接著,作者探索了這一創傷預測模型推廣應用的可行性,認為該模型可以為醫療決策者提供決策支持。此外,Lee等[46]通過對創傷患者年齡組分類、嚴重程度選擇和創傷相關變量的評分校準,提高了XGBoost算法預測創傷患者短期及長期預后的性能,并給出了影響患者預后的高危特征。
由于創傷的復雜性,如何獲得標準化臨床數據是機器學習在創傷骨科領域臨床轉化的關鍵。面對復雜多元的臨床數據,我們可以通過機器學習算法進行數據清洗及歸一化處理,以獲得同質性數據用以建模。此外,積累大規模的臨床數據將有助于進一步發掘和總結創傷骨科的臨床規律,加速創傷骨科領域研究的進展。
4 機器學習在創傷骨科圍術期與預后風險預測中的應用
近年來,許多研究聚焦了機器學習在創傷骨科患者圍術期及術后長期并發癥風險預測中的應用。Zhao等[47]比較了機器學習算法和邏輯回歸等傳統統計學方法在預測髖部骨折患者術后譫妄發生率及其危險因素的效果,結果顯示XGBoost、支持向量機以及隨機森林算法預測準確性在0.83~0.87之間,均高于邏輯回歸。接著,作者綜合了各個模型的特征重要性,確立了術前等待時間、血管加壓藥物的使用、虛弱指數、癡呆/卒中史、手術持續時間以及麻醉方式是導致髖部骨折患者術后譫妄最主要的6個危險因素。Li等[48]開發了一種基于機器學習的預測模型,以評估髖部骨折患者術后轉入ICU、并發癥發生以及延遲出院的風險,結果顯示機器學習模型在預測術后ICU轉科(0.835 vs. 0.692,P<0.01)、并發癥發生(0.810 vs. 0.629,P<0.01)以及延遲出院(0.832 vs. 0.618,P<0.01)的準確性方面均優于美國麻醉醫師協會全身狀態分級系統(ASA-PS)。對于術后長期并發癥,Klemt等[49]采用機器學習算法評估了人工全髖關節置換患者術后二次翻修的危險因素,判別、校準及決策曲線分析顯示人工神經網絡、隨機梯度提升、隨機森林和彈性懲罰邏輯回歸 4種機器學習模型均取得了優異表現。通過機器學習方法對圍術期并發癥及其危險因素的識別,臨床醫師可以快速識別高危患者并及時處理,為優化圍術期診療流程、降低并發癥發生率提供了新的研究方向。
此外,在預測患者短期和長期預后方面,機器學習算法也有著很高的準確性。DeBaun等[50]比較了不同算法預測患者髖部骨折后30 d死亡率的性能,結果顯示人工神經網絡的AUC(0.92)最高,其次是邏輯回歸(AUC 0.87)和樸素貝葉斯(AUC 0.83)。Forssten等[51]比較了支持向量機、樸素貝葉斯、隨機森林以及邏輯回歸算法預測髖部骨折患者術后1年死亡率的性能,結果顯示前3種算法存在高估患者死亡率的可能,而邏輯回歸在預測長期預后方面性能最優,這一研究肯定了傳統統計學方法在預測預后方面的應用優勢。
5 機器學習在創傷骨科臨床應用中的挑戰
隨著科學技術的發展以及算法效率的提升,機器學習在醫療領域的應用逐漸深入[52]。在創傷骨科領域,機器學習算法作為一種輔助手段,在骨折診斷與分型、患者圍術期護理及預后分析方面都有著廣闊應用前景[53-54]。然而,在機器學習算法應用過程中仍存在一些挑戰[4]。
第一,機器學習研究及應用的倫理原則。在機器學習研究及應用過程中,如何確保數據的準確性和隱私保護是值得關注的問題[55]。現階段機器學習領域缺乏一個公認的倫理實踐指導規范,但在研究過程中仍應確保科學性服從倫理性的原則。
第二,臨床數據庫中數據的質量和數量。訓練的機器學習模型需要大量高質量數據,而創傷骨科患者的復雜性決定了收集的數據難以同時滿足同質性和多樣化兩個需求,這就需要進一步擴大臨床數據的樣本量及樣本特征數量,為模型擬合提供充足和多元的樣本支持。
第三,機器學習模型的可解釋性。機器學習模型對數據的擬合能力強于傳統統計學方法,然而其帶來的模型過擬合是一個繞不開的話題。強機器學習模型如深度神經網絡等被視為“黑盒”,往往難以解釋其結果及推理過程[56]。因此,如何評估機器學習模型的可解釋性并構建解釋性強的應用模型成為了一個亟待解決的問題。
第四,通用模型無法滿足個性化診療需求。創傷骨科領域的臨床實踐需要高度個性化的治療方案。由于臨床醫學并不是一門程序化科學,在創傷骨科領域,臨床醫師的主觀能動性以及針對性治療決策至關重要。每例患者的創傷類型、嚴重程度和生理狀況各異,通用的機器學習模型可能無法完全滿足個體化需求,開發針對個體患者的定制化算法和治療計劃將成為未來發展方向之一。
6 機器學習在創傷骨科臨床應用的展望
盡管面臨挑戰,機器學習算法在創傷骨科臨床應用中也呈現出巨大應用前景。創傷骨科的臨床應用中,創傷類型的準確分類對于制定合理的治療方案至關重要。通過對大量臨床數據和影像數據的分析,機器學習模型能夠識別和分類不同類型創傷骨折,從而幫助醫生更準確地做出診斷和治療決策,有助于縮短診斷時間,降低誤診率,提高患者的治療效果。此外,通過分析患者的臨床數據、生理指標以及影像數據,機器學習模型可以預測患者發生創傷的風險。基于這些預測結果,醫生可以采取相應干預措施,減少患者發生創傷可能性。這對于高風險患者的管理和監控具有重要意義,從而達到“治未病”的目的。
院前,通過開發區域創傷系統,根據患者分布的地理位置空間來確定創傷中心的最佳位置以及高峰期創傷急診的患者負荷,以期進一步合理配置創傷資源、降低單個創傷中心的負擔[57]。Dooley等[58]介紹了基于需求的創傷系統評估工具,這一系統采用了地理空間建模,為地方創傷中心規劃提供了證據支持,有助于評估區域內人口的創傷發生率、創傷中心覆蓋率以及潛在的經濟影響。
術前,臨床醫師可以通過機器學習模型分析患者影像數據,制定最佳手術計劃。米爾阿地力·麥麥提依明等[59]采用人工智能術前規劃系統在人工全髖關節置換術前進行假體型號預測,獲得了較高的準確性和可重復性。此外,對于發生骶骨脆性骨折的老年患者,Kamer等[60]通過基于CT的人工智能三維建模來評估骶髂關節骨性通道,并在術前用以規劃植入物位置。隨著技術的進步,通過人工智能進行術前規劃的精度也將逐漸提高,這有助于縮短手術醫師學習曲線,使手術過程更加精確和安全,從而提高手術成功率,降低手術風險。
術中,通過機器學習算法進行精確定位以及人工智能增強現實技術可以輔助手術醫師操作,降低手術難度。殷耀斌等[61]報道了1例機器人輔助四角融合經皮螺釘內固定病例,通過人工智能輔助定位實現了微創而精準的經皮四角融合,從而減少了透視次數及放射性暴露。另外,賈鵬等[62]報道了國產通用型骨科手術機器人天璣(TiRobot)在創傷骨科領域的應用,為骨盆髖臼骨折、髖部骨折、手足骨折等固定提供了微創化、智能化、精準化的解決方案。隨著增強現實技術及人工智能的飛速發展,將進一步推動手術機器人的臨床轉化。
此外,術后康復作為創傷骨科不可或缺的一環,機器學習算法可以根據患者的臨床數據和康復進展,為患者制定個性化康復方案。Santilli等[63]構建了4個基于決策樹的集成模型,用于評估骨科及神經科患者出院后的康復計劃改善患者功能的潛力。通過分析及檢測患者的康復數據,模型可以預測康復進展,幫助醫師做出及時調整,以最大程度提升康復效果。
綜上述,隨著近年來技術進步及算法效率的提升,機器學習在創傷骨科領域的應用漸廣。機器學習算法在影像資料建模(即骨折識別)、診斷與分層,以及臨床決策(包括跌倒與骨折預防、急診處理、圍術期與預后風險預測)等方面,均有著良好準確性。當前,機器學習在創傷骨科中的應用還處于研究與探索階段,隨著科技進步和數據量增長,機器學習模型的精度和應用價值將會大幅提升,在輔助診斷、指導決策、制定個性化醫療方案以及合理配置臨床資源等領域有著廣闊的應用前景。
利益沖突 在課題研究和文章撰寫過程中不存在利益沖突;經費支持沒有影響文章觀點及其報道
作者貢獻聲明 田楚偉:文章撰寫及修改;陳翔溆、朱桓毅:觀點形成與綜述構思;朱桓毅、秦晟博:文獻檢索;田楚偉、陳翔溆、石柳:文獻篩選;芮云峰:選題指導與綜述構思