引用本文: 胡海, 胥伶杰, 曹鈺. 展望急診醫學的大數據時代. 華西醫學, 2015, 30(6): 1001-1002. doi: 10.7507/1002-0179.20150288 復制
在過去的20年中,各行業、各領域的數據,包括醫療保健、用戶生成數據、互聯網、金融公司和供應鏈系統等,都出現大規模增長[1]。隨著以智能手機和可穿戴設備為代表的各種隨身電子儀器的出現,人們的日常活動、生理變化隨時都可能成為可被記錄和分析的海量數據,一個大規模產生、挖掘和分析應用大數據的時代正在到來[2]。
1 大數據的概念
“大數據”的概念產生在全球數據呈現“爆炸式”增長的背景下,指超乎單臺計算機處置能力的巨大數據集合。與傳統的數據集合相比,大數據不僅僅包括結構化數據,即可通過數據庫或數據表錄入而形成行列表的數據,還包括大量的非結構化數據,如微博、音頻、視頻等無法成為行列表的海量數據[3]。這些非結構數據所含信息量巨大,和結構數據在一起可以對我們認知的整個世界進行更符合現實的數據描述。此外,我們還可能從大數據中挖掘出更多未知的價值。因此,如何有效識別、組織管理、分析利用這些數據也給我們帶來新的挑戰[2]。
“大數據”目前并無統一的定義,呈現模糊狀態。目前將“大數據”定義為一個容量和數據類別均巨大的數據集合,而且此數據集合無法用傳統數據庫工具對其內容進行抓取、管理和處理。其特點有4“V”,即:①數據多(volumes),一般在10 TB大小,但在實際應用中,許多企業用戶已經建立了PB級(1 PB=1 024 TB)的數據量;②數據類別多(variety),數據來自多種數據源,數據種類和格式日趨增多,不僅包括結構化數據,還包括非結構化數據;③數據處理速度快(velocity),即使如此龐大的數據,也能夠做到數據的實時處理,得出實時結論;④數據真實性高(veracity),隨著新數據源的興起,傳統數據源的局限被打破,數據源之間相互印證,得到準確性高的數據[2]。
2 大數據的常用分析方法
傳統數據分析是指用各種統計方法對各種結構化數據資料進行分析,將看似雜亂無章的數據中的信息提煉出來,找出研究對象的內在規律,開發數據資料的功能,體現數據的價值。雖然一些傳統數據分析方法也可用于大數據分析[1],如聚類分析、因子分析、主成分分析、相關分析、回歸分析[4-5]等,但上述分析方法難于同時完成非結構化數據與結構化數據的快速分析,因此許多新型分析方法脫穎而出。
目前一些大數據具體處理方法主要有:Bloom Filter法、Hash法、Trie樹、并行計算法等[1]。傳統數據分析方法大多數都是通過對原始數據集進行抽樣,然后對收集到的數據樣本進行統計分析,通過復雜的算法從有限的樣本空間中獲取盡可能多的信息,從而推斷總體。隨著互聯網、云計算技術的開展,數據計算能力和存儲能力已經大幅度提升,可以支持整體數據運算而非樣本運算。因此大數據分析方法與傳統分析方法的最大區別在于分析的對象是盡可能得到的整體數據,而非數據樣本,因此大數據分析在于不追求算法的復雜性和精確性,而是追求可以高效地對所能得到的全體數據集的分析。總之,傳統數據方法從有限的樣本數據集合中獲取信息以推斷總體情況,其更加追求準確性;大數據分析方法則是通過高效的算法、模式,對整體數據進行分析。
3 急診醫學發展需要大數據分析和應用
急診醫學是一門研究如何更迅速、更有效、更協調地救治急性病和危重病的學科。目前在國內,常將急診醫學分為院前急救、緊急醫學救援、危重病、心肺復蘇、創傷、中毒、小兒急診等亞專業[6],在國外還會包含“胸痛中心”、“國際急診醫學”、“觀察醫學”等內容,而延伸出來的“分檢”、“轉運”、“預防決策”以及“急診醫學教學和管理”等方面也是急診同行常常關注的問題。此時,各亞專業的發展就需要預測其專業組的危急重癥的死亡風險[7],需要通過盡量多地了解患者的數據信息,制定周密的診療方案,給予生命支持措施,進一步明確診斷,這些過程都需要進行快速、動態、充分的評估,明確下一步使用某種方式的效益與風險,再有的放矢。
急診科病種的多樣性和病情的復雜性為急診醫學實踐的時效性、準確性增加了更大的難度。本期專題就有應用傳統數據分析對心肺復蘇、地震傷員、蜂螫傷、休克指數、胸痛患者進行評估的文獻。在傳統的急診醫學的研究過程中,尤其是臨床資料的分析處理,我們會使用數據樣本收集、數據描述和統計推斷等方法對臨床數據進行分析,得到研究結果。這種研究方法無法實時對正在處理的患者進行臨床指導。然而,試想如果我們能夠通過音頻、視頻等收集基于患者的面色、形態、聲音、行動的非結構數據,再結合監測報告和檢查結果,使用計算機完成高效快速分析,我們將會得到關于此例患者的更精確而快速的計算機建議,提高我們醫學判斷的精準性。
急診病種的多樣性、病情的復雜性使得急診醫護人員必須擁有豐富的醫學知識和準確的判斷能力,這對于急診醫學專業人員來說,意味著需要豐富的臨床經驗和長時間不間斷的技術訓練,本期專題中就有一篇應用醫學模擬聯合病案教學對急診醫生進行培訓的文獻。而在大數據背景下,只要收集到足夠多的數據,建立相關計算方法,醫學人員就可以在大數據的幫助下,借助計算機得到在人類相當認知水平條件下較為精確的判斷,就可以直接指導臨床實踐,實現急診醫學的人工智能。
急診管理也是急診醫學學科發展的重要組成部分,本期專題中有文獻分析醫療糾紛產生的原因及防范,但如果能夠依托大數據平臺,得到資源與資源配置等的實時數據,以及基于大數據挖掘分析得出的結果,直接指導資源調配、風險管理等,使管理更加精細,急診程序更加優化,減少安全風險事件的發生。
4 急診醫學大數據時代的阻力
4.1 各醫院的信息孤島形成信息壁壘
大數據收集是整體數據收集,非既往的樣本收集,因此大數據挖掘的前提是盡量收集到整體的數據,美國的醫療已經實現數據共享,因此可以使用海量數據指導實踐。但我國在當前的醫療體制下,各個醫院的各種信息常常為“孤島”信息,無法達到信息共享,這也成為大數據收集的阻力之一。本期文獻中,有蜂螫傷的文獻和地震一線醫院的文獻的資料為多家醫院共享的資料,收集數據量明顯較單家醫院資料多,更具有指導意義。只有突破醫院間的壁壘,真正做到信息共享,急診醫學的大數據時代才會真正來臨[8]。
4.2 急診醫學大數據挖掘和分析方法尚有待進一步研究
目前各個行業均在應用大數據進行數據分析、決策制定、風險管理等。但醫學與人的生命相關,要求更高的精確性。目前能夠廣泛用于醫學決策的大數據挖掘和分析方法尚不成熟,需要在實踐中進一步完善[9]。
5 展望
大數據由于其數據的整體性、快速性、準確性和多樣性,在當前的各行各業的實踐中已經開始帶來新的一輪信息革命。雖然目前在我國的急診醫學實踐和研究中尚不能很好地進行大數據收集和分析,但隨著大數據挖掘和分析技術的發展和我國醫療體制的改革,以大數據分析指導急診醫學的研究與臨床實踐的推進必將在不遠的未來帶給我們急診醫學臨床模式的重大變革[10]。
在過去的20年中,各行業、各領域的數據,包括醫療保健、用戶生成數據、互聯網、金融公司和供應鏈系統等,都出現大規模增長[1]。隨著以智能手機和可穿戴設備為代表的各種隨身電子儀器的出現,人們的日常活動、生理變化隨時都可能成為可被記錄和分析的海量數據,一個大規模產生、挖掘和分析應用大數據的時代正在到來[2]。
1 大數據的概念
“大數據”的概念產生在全球數據呈現“爆炸式”增長的背景下,指超乎單臺計算機處置能力的巨大數據集合。與傳統的數據集合相比,大數據不僅僅包括結構化數據,即可通過數據庫或數據表錄入而形成行列表的數據,還包括大量的非結構化數據,如微博、音頻、視頻等無法成為行列表的海量數據[3]。這些非結構數據所含信息量巨大,和結構數據在一起可以對我們認知的整個世界進行更符合現實的數據描述。此外,我們還可能從大數據中挖掘出更多未知的價值。因此,如何有效識別、組織管理、分析利用這些數據也給我們帶來新的挑戰[2]。
“大數據”目前并無統一的定義,呈現模糊狀態。目前將“大數據”定義為一個容量和數據類別均巨大的數據集合,而且此數據集合無法用傳統數據庫工具對其內容進行抓取、管理和處理。其特點有4“V”,即:①數據多(volumes),一般在10 TB大小,但在實際應用中,許多企業用戶已經建立了PB級(1 PB=1 024 TB)的數據量;②數據類別多(variety),數據來自多種數據源,數據種類和格式日趨增多,不僅包括結構化數據,還包括非結構化數據;③數據處理速度快(velocity),即使如此龐大的數據,也能夠做到數據的實時處理,得出實時結論;④數據真實性高(veracity),隨著新數據源的興起,傳統數據源的局限被打破,數據源之間相互印證,得到準確性高的數據[2]。
2 大數據的常用分析方法
傳統數據分析是指用各種統計方法對各種結構化數據資料進行分析,將看似雜亂無章的數據中的信息提煉出來,找出研究對象的內在規律,開發數據資料的功能,體現數據的價值。雖然一些傳統數據分析方法也可用于大數據分析[1],如聚類分析、因子分析、主成分分析、相關分析、回歸分析[4-5]等,但上述分析方法難于同時完成非結構化數據與結構化數據的快速分析,因此許多新型分析方法脫穎而出。
目前一些大數據具體處理方法主要有:Bloom Filter法、Hash法、Trie樹、并行計算法等[1]。傳統數據分析方法大多數都是通過對原始數據集進行抽樣,然后對收集到的數據樣本進行統計分析,通過復雜的算法從有限的樣本空間中獲取盡可能多的信息,從而推斷總體。隨著互聯網、云計算技術的開展,數據計算能力和存儲能力已經大幅度提升,可以支持整體數據運算而非樣本運算。因此大數據分析方法與傳統分析方法的最大區別在于分析的對象是盡可能得到的整體數據,而非數據樣本,因此大數據分析在于不追求算法的復雜性和精確性,而是追求可以高效地對所能得到的全體數據集的分析。總之,傳統數據方法從有限的樣本數據集合中獲取信息以推斷總體情況,其更加追求準確性;大數據分析方法則是通過高效的算法、模式,對整體數據進行分析。
3 急診醫學發展需要大數據分析和應用
急診醫學是一門研究如何更迅速、更有效、更協調地救治急性病和危重病的學科。目前在國內,常將急診醫學分為院前急救、緊急醫學救援、危重病、心肺復蘇、創傷、中毒、小兒急診等亞專業[6],在國外還會包含“胸痛中心”、“國際急診醫學”、“觀察醫學”等內容,而延伸出來的“分檢”、“轉運”、“預防決策”以及“急診醫學教學和管理”等方面也是急診同行常常關注的問題。此時,各亞專業的發展就需要預測其專業組的危急重癥的死亡風險[7],需要通過盡量多地了解患者的數據信息,制定周密的診療方案,給予生命支持措施,進一步明確診斷,這些過程都需要進行快速、動態、充分的評估,明確下一步使用某種方式的效益與風險,再有的放矢。
急診科病種的多樣性和病情的復雜性為急診醫學實踐的時效性、準確性增加了更大的難度。本期專題就有應用傳統數據分析對心肺復蘇、地震傷員、蜂螫傷、休克指數、胸痛患者進行評估的文獻。在傳統的急診醫學的研究過程中,尤其是臨床資料的分析處理,我們會使用數據樣本收集、數據描述和統計推斷等方法對臨床數據進行分析,得到研究結果。這種研究方法無法實時對正在處理的患者進行臨床指導。然而,試想如果我們能夠通過音頻、視頻等收集基于患者的面色、形態、聲音、行動的非結構數據,再結合監測報告和檢查結果,使用計算機完成高效快速分析,我們將會得到關于此例患者的更精確而快速的計算機建議,提高我們醫學判斷的精準性。
急診病種的多樣性、病情的復雜性使得急診醫護人員必須擁有豐富的醫學知識和準確的判斷能力,這對于急診醫學專業人員來說,意味著需要豐富的臨床經驗和長時間不間斷的技術訓練,本期專題中就有一篇應用醫學模擬聯合病案教學對急診醫生進行培訓的文獻。而在大數據背景下,只要收集到足夠多的數據,建立相關計算方法,醫學人員就可以在大數據的幫助下,借助計算機得到在人類相當認知水平條件下較為精確的判斷,就可以直接指導臨床實踐,實現急診醫學的人工智能。
急診管理也是急診醫學學科發展的重要組成部分,本期專題中有文獻分析醫療糾紛產生的原因及防范,但如果能夠依托大數據平臺,得到資源與資源配置等的實時數據,以及基于大數據挖掘分析得出的結果,直接指導資源調配、風險管理等,使管理更加精細,急診程序更加優化,減少安全風險事件的發生。
4 急診醫學大數據時代的阻力
4.1 各醫院的信息孤島形成信息壁壘
大數據收集是整體數據收集,非既往的樣本收集,因此大數據挖掘的前提是盡量收集到整體的數據,美國的醫療已經實現數據共享,因此可以使用海量數據指導實踐。但我國在當前的醫療體制下,各個醫院的各種信息常常為“孤島”信息,無法達到信息共享,這也成為大數據收集的阻力之一。本期文獻中,有蜂螫傷的文獻和地震一線醫院的文獻的資料為多家醫院共享的資料,收集數據量明顯較單家醫院資料多,更具有指導意義。只有突破醫院間的壁壘,真正做到信息共享,急診醫學的大數據時代才會真正來臨[8]。
4.2 急診醫學大數據挖掘和分析方法尚有待進一步研究
目前各個行業均在應用大數據進行數據分析、決策制定、風險管理等。但醫學與人的生命相關,要求更高的精確性。目前能夠廣泛用于醫學決策的大數據挖掘和分析方法尚不成熟,需要在實踐中進一步完善[9]。
5 展望
大數據由于其數據的整體性、快速性、準確性和多樣性,在當前的各行各業的實踐中已經開始帶來新的一輪信息革命。雖然目前在我國的急診醫學實踐和研究中尚不能很好地進行大數據收集和分析,但隨著大數據挖掘和分析技術的發展和我國醫療體制的改革,以大數據分析指導急診醫學的研究與臨床實踐的推進必將在不遠的未來帶給我們急診醫學臨床模式的重大變革[10]。