本研究旨在梳理疾病負擔相關指標的應用場景和條件,介紹國內外與疾病監測相關的調查數據庫和華盛頓大學健康測量評估中心(IHME)的全球疾病負擔研究。對文獻資料進行收集,歸納五個健康大數據的疾病負擔應用實例,并基于不同類型的數據庫詳細描述其構建模式。指出目前健康數據應用所面臨的問題與挑戰,對疾病負擔健康大數據應用的未來研究提出一些想法和展望。
引用本文: 黎倩欣, 周智華, 梁珊珊, 李成程, 周尚成. 大數據技術背景下疾病負擔應用分析. 中國循證醫學雜志, 2023, 23(3): 351-356. doi: 10.7507/1672-2531.202210140 復制
1 疾病負擔與大數據
疾病負擔是指疾病、傷殘和早死對整個社會經濟及健康的壓力,一般包括流行病學視角的疾病負擔和經濟學視角的疾病經濟負擔。前者主要為率的指標和一系列壽命指標,后者主要為直接經濟負擔、間接經濟負擔和無形經濟負擔,通常用貨幣來衡量[1]。常用的流行病學疾病負擔測量指標包括發病率、患病率、死亡率等,以及潛在減壽年數(potential years of life lost,PYLL)、質量調整生命年(quality-adjusted life years,QALYs)、傷殘調整生命年(disability adjusted life year,DALY)和健康壽命年(healthy life expectancy,HLE)等。其中,DALY被廣泛應用于疾病負擔的研究,它由早逝所致壽命損失(years of Life Lost,YLL)和傷殘所致壽命損失(years lived with disability,YLD)兩部分組成[2-4]。疾病負擔相關指標的應用場景和條件介紹見表1。

一般來說,了解疾病流行情況方法包括隨機抽樣調查、疾病監測和大數據技術等方法。常用隨機抽樣調查的方法現場組織難度大、費時又費力,數據收集缺點明顯。隨著信息技術的更新和大數據技術的發展,通過疾病監測和大數據技術的方法獲得疾病負擔的數據已成為主流。國際上,隨機抽樣調查和疾病監測中比較經典且具有規模性、代表性的調查有美國行為危險因素系統、美國國民健康訪問調查、美國營養與健康調查、加拿大慢病監測系統、中國疾病預防控制中心(Center for Disease Control,CDC)死因監測和中國CDC慢性病及其危險因素監測等(表2)。

在國際上,華盛頓大學健康測量評估中心自90年代初開展全球疾病負擔研究(global burden of disease,GBD),通過采集如疾病監測系統、死亡監測系統和傷害監測系統等結構化數據和衛星遙感數據、社會經濟調查等非結構化數據[5],目前已產出疾病負擔和疾病監測的一系列研究成果,且研究具有明顯的大數據特征。2020年10月17日, The Lancet發布了2019 GBD專題報告,計算并報道全球204個國家或地區369種疾病和傷害的疾病負擔以及87種危險因素的疾病負擔數據,并公開了生育率、死亡率、健康期望壽命和人口估計等數據[6]。基于云計算的大數據技術加速了GBD研究結果的產出,現已對世界各國衛生政策產生了深遠的影響。因此,國內應該要主動開展相類似的健康大數據應用分析,抓住現有的數據利用價值,將大數據與疾病負擔相結合,產出有利于衛生管理和決策的關鍵指征和數據,進一步推動國內衛生事業和健康中國的發展。
2 大數據與疾病負擔應用實例
2.1 醫療臨床大數據與疾病負擔
醫療大數據和臨床研究大數據的產生場景為醫療機構,能夠很好地展現就醫人群的患病現狀以及疾病譜情況。近年來,醫院在推進信息化建設管理過程中,積累了海量數據資源,醫療臨床大數據如何為疾病診療助力,如何通過數據元的統一標準化實現不同臨床研究數據庫的管理,進而加速疾病負擔研究的相關成果產出,成為值得探討和關注的課題。
目前,中國北京天壇醫院已經建立了多個腦血管病臨床研究數據庫,其中包括社區人群隊列、全國腦血管病流行病學調查數據和慢病監測行政數據庫等以人群為基礎的數據,以及醫院臨床研究數據、醫院病歷數據、生物樣本數據和病人隨訪數據等。數據庫涵蓋多維度信息,包括人口社會學基本信息,行為飲食、疾病治療、血液樣本、基因、生物標志物、影像、病史與體檢、隨訪信息和認知信息等。同時,該數據庫還建立了腦重大疾病數據元字典,與國際神經系統疾病的數據接軌互認,實現國內國際數據互聯互通,最大限度地發揮數據庫的價值。在此基礎上,利用現已完備的腦血管病大數據平臺,即可產出大量權威的疾病負擔和腦血管病疾病監測相關數據,為科學研究和政府決策提供依據[7](圖1)。

2.2 醫院電子病歷大數據與疾病負擔
2022年11月9日,國家衛生健康委頒布《“十四五”全民健康信息化規劃》,其中明確指出要強化統計數據共享應用,積極推動統計信息共享、交換和應用研究[8]。在醫療系統中,電子病歷、病案首頁等數據是醫院管理的基礎,不僅用于醫院管理,也可用于衛生統計和疾病負擔分析。如北京地區重大慢性病發病監測平臺,利用全市的病案首頁數據與死因行政數據庫,收集每年全市心腦血管發病人數,為政府決策提供依據。國家神經系統疾病質控中心,通過采集全國31個省份三級醫院病案首頁信息,統計19種神經系統重點疾病,每年更新并動態展示全國各省神經系統的疾病負擔與醫療服務質量質控數據,如全國卒中中心建設醫院數量、腦血管病病種分類、腦血管病平均住院日、次均費用、住院病死率等。2021年,來自重慶市的一個研究團隊基于人工智能和大數據方法,從衛生健康系統獲取人口信息、死亡數據以及病案首頁和電子病歷數據,結合自然語言識別分析技術,提取病案首頁和電子病歷中的診斷編碼和主訴,進行疾病的映射和分類,產出患病率、死亡率、疾病負擔和健康預期壽命等結果[9]。由于各城市健康狀況評估的復雜性,以及缺乏資源進行大規模人口調查,目前健康預期壽命測算少有在城市級別的研究。全國大型調查通常每五年進行一次,但基于電子病歷數據的人工智能方法可進行季節性或年度的疾病負擔和健康預期壽命估計,其可作為一種新工具,提供更可靠、更有效、更具靈活性的數據測量(圖2)。

因此,大量未使用的電子病歷數據、病案首頁數據可作為疾病負擔測算的一種替代數據源,通過大數據、人工智能和自然語言識別技術,自動提取和分析豐富的特定疾病信息。
2.3 醫保報銷大數據與疾病負擔
大數據技術的應用,能夠推動現有疾病監測模式的創新,讓疾病監測覆蓋到更大范圍的人群。從宏觀角度來看,實時而準確的全人群疾病監測可為揭示疾病病因、疾病流行趨勢和疾病負擔現狀,評價各類疾病預防和臨床診療效果等方面提供關鍵的基礎數據與科學依據,更是國家和地方政府科學配置醫療衛生資源、精準制訂疾病防控和健康管理規劃的根本所在。從微觀角度來看,豐富而詳實的疾病監測數據能夠指導各級醫療衛生機構和有關社區采取積極應對措施,及時調整診療供給,規范醫院診療行為,強化大眾的健康意識理念,科學宣傳疾病預防知識和健康生活方式。
過去十余年,北京大學腫瘤醫院柯楊教授團隊在我國太行山食管癌高發地區開展了多項大規模人群前瞻性研究。在長期的隊列隨訪工作中,探索出利用醫保報銷數據識別腫瘤新發病例的工作模式,即MIS-CASS(medical-insurance-system-based cancer surveillance system)模式[10]。經比較性研究評估,該模式對新發癌癥病例識別的靈敏度高達96%,特異度接近100%,能有效降低大眾整體癌癥發病風險,減輕人群癌癥負擔,提高癌癥患者的生存水平與生活質量。近期,該團隊進一步利用河南省滑縣醫保系統與死因監測系統大數據,首次報告了該地區上消化道惡性腫瘤等主要腫瘤種類的人群現患率(患病率、流行率)及癌癥患者生存率,為明確當地惡性腫瘤負擔及患者預后、建立健全癌癥防控工作提供了基礎數據[11]。此項研究充分利用了醫保報銷數據,基于診斷文本和ICD-10編碼,構建識別疾病的所有關鍵詞,形成疾病字典庫,統計相關疾病病例數量,計算發病率等相關疾病負擔指標,構建了基于醫療報銷數據的癌癥“現患及生存監測”新模式,大大豐富了MIS-CASS的科學內涵與實際應用場景,同時也豐富了患病率和流行率的監測和測算方式,豐富了與疾病負擔相關的患病人群的測算數據來源(圖3)。

2.4 互聯網大數據與疾病危險因素監測
互聯網和信息行業的快速發展使公共衛生領域具備了新的內涵。大數據可將其精準、客觀、科學的價值轉化為一種生產元素,滲透到醫療和公共衛生領域的各個環節中去,從而帶來一些本質上的變革。通過深度的數據采集、數據存取管理、數據處理、數據分析等手段,挖掘互聯網大數據中的有效信息,分析數據內涵,可以對疾病和公共衛生事件起到預測、預警和指引等作用。目前,聚焦于公共衛生領域的大數據應用包括疾病監測、疾病危險因素監測、疾病負擔測算等,現可以利用互聯網大數據、覆蓋全國的各類型數據庫以及模型方法實時開展公共衛生傳染病監測和趨勢模擬,如通過監測社交媒體或頻繁檢索的詞條來預測某些傳染病的流行情況,通過監測移動設備的定位數據來追蹤某些傳染病的傳播路徑和傳播范圍。此外,針對慢性和非傳染性疾病也可以開展健康及相關危險因素監測,如智能佩戴設備的健康數據云分析、群體心理健康網絡云監測等。
2.5 全人群全生命周期超大規模人群隊列研究
山東省于2018年12月25日發布全省全人群全生命周期健康狀況和衛生服務保障研究報告,該報告展現了全省人群的健康危險暴露,疾病分布、死亡模式和疾病負擔等主要健康問題和情況。研究依托山東大學健康醫療大數據研究院的健康醫療大數據云技術平臺,首次啟用大數據手段,通過省域全民健康信息平臺匯聚醫療衛生及相關行業的全員人口健康信息,構建了大型健康醫療數據庫,獲得了能代表山東省的491萬超大規模人群隊列,融合了包含基因組/暴露組組學、居民健康檔案、健康體檢、臨床診療、健康/疾病監測、基本公共衛生、移動健康/醫療檢測、健康保險以及死因數據等155個數據庫的健康醫療數據,對山東省居民主要健康危險因素、面臨的主要疾病負擔等進行了全方位的透視,構建了山東省全人群全生命周期的健康譜圖。該研究對省級全人群衛生政策規劃、衛生體制改革、醫學研究和醫藥產業布局調整都具有重要的指導意義[12](圖4)。

3 健康大數據應用的問題與挑戰
醫療健康數據類型具有復雜性和多樣性,常規軟件工具難以在合理的時間內從健康大數據中獲取有價值的信息,因此迫切需要創新性地利用大數據技術來解決問題[13]。但一方面,我國有關人口健康的數據類型繁雜多樣,數據之間的復雜關聯以及伴隨時間空間發生的演變對人口健康研究提出了挑戰和機遇。另一方面,現無全國統一的疾病負擔信息標準,無論是疾病負擔統計所需的人口數據、死亡數據還是患病數據,都需要采用統一的疾病負擔數據模型,它包括統計元數據框架和統計元數據的描述內容等。
近幾年,國內雖常有疾病負擔的研究和文獻資料發布,但研究樣本和研究范圍偏小,很難做到省級或國家級精準的疾病負擔測算。同時,疾病負擔研究也缺乏規范性,數據來源大都是基于現有可及的幾種監測數據,方法學也多借用國外標準。因此,充分借助大數據技術的特長,將可開展更大范圍的疾病負擔分析,將推動我國本土化的疾病負擔測算研究再上一臺階。未來,海量數據的聚集也會對傳統的統計方法提出挑戰,同時也為大數據技術在該領域的應用提供重大機遇,未來疾病負擔分析研究與大數據技術應用將會互相支撐,互促發展。
4 健康大數據應用的展望和未來
基于大數據技術的革新發展,疾病監測和疾病負擔測算領域得到拓寬,內涵也得以更加豐富。醫療衛生系統正產生大量的醫療信息數據,醫療衛生大數據系統也正處于建設和發展當中,目前很多大型醫院已經開始著手建設臨床醫學大數據采集系統[14]。為獲得可靠的決策依據,人們對人群健康綜合測量方法越加重視,相關人群健康及疾病監測數據可為衛生技術評估、藥物經濟學等研究方向提供循證研究證據和流行病學信息。與醫學信息進行深度整合、在真實世界證據及統計學體系的支持下產生新的知識是公共衛生大數據應用的主要方向[15]。隨著大數據時代的到來,更應充分利用這種發展契機,搭建基于云計算的疾病負擔研究大數據技術平臺,研究適合我國的疾病負擔測算及應用方法體系,加強大數據分析人才培養、推動多學科合作,實現公共衛生數據收集、整理、挖掘、分析、決策、共享一體化解決方案,使我國成為公共衛生大數據挖掘、分析和應用的強國。
1 疾病負擔與大數據
疾病負擔是指疾病、傷殘和早死對整個社會經濟及健康的壓力,一般包括流行病學視角的疾病負擔和經濟學視角的疾病經濟負擔。前者主要為率的指標和一系列壽命指標,后者主要為直接經濟負擔、間接經濟負擔和無形經濟負擔,通常用貨幣來衡量[1]。常用的流行病學疾病負擔測量指標包括發病率、患病率、死亡率等,以及潛在減壽年數(potential years of life lost,PYLL)、質量調整生命年(quality-adjusted life years,QALYs)、傷殘調整生命年(disability adjusted life year,DALY)和健康壽命年(healthy life expectancy,HLE)等。其中,DALY被廣泛應用于疾病負擔的研究,它由早逝所致壽命損失(years of Life Lost,YLL)和傷殘所致壽命損失(years lived with disability,YLD)兩部分組成[2-4]。疾病負擔相關指標的應用場景和條件介紹見表1。

一般來說,了解疾病流行情況方法包括隨機抽樣調查、疾病監測和大數據技術等方法。常用隨機抽樣調查的方法現場組織難度大、費時又費力,數據收集缺點明顯。隨著信息技術的更新和大數據技術的發展,通過疾病監測和大數據技術的方法獲得疾病負擔的數據已成為主流。國際上,隨機抽樣調查和疾病監測中比較經典且具有規模性、代表性的調查有美國行為危險因素系統、美國國民健康訪問調查、美國營養與健康調查、加拿大慢病監測系統、中國疾病預防控制中心(Center for Disease Control,CDC)死因監測和中國CDC慢性病及其危險因素監測等(表2)。

在國際上,華盛頓大學健康測量評估中心自90年代初開展全球疾病負擔研究(global burden of disease,GBD),通過采集如疾病監測系統、死亡監測系統和傷害監測系統等結構化數據和衛星遙感數據、社會經濟調查等非結構化數據[5],目前已產出疾病負擔和疾病監測的一系列研究成果,且研究具有明顯的大數據特征。2020年10月17日, The Lancet發布了2019 GBD專題報告,計算并報道全球204個國家或地區369種疾病和傷害的疾病負擔以及87種危險因素的疾病負擔數據,并公開了生育率、死亡率、健康期望壽命和人口估計等數據[6]。基于云計算的大數據技術加速了GBD研究結果的產出,現已對世界各國衛生政策產生了深遠的影響。因此,國內應該要主動開展相類似的健康大數據應用分析,抓住現有的數據利用價值,將大數據與疾病負擔相結合,產出有利于衛生管理和決策的關鍵指征和數據,進一步推動國內衛生事業和健康中國的發展。
2 大數據與疾病負擔應用實例
2.1 醫療臨床大數據與疾病負擔
醫療大數據和臨床研究大數據的產生場景為醫療機構,能夠很好地展現就醫人群的患病現狀以及疾病譜情況。近年來,醫院在推進信息化建設管理過程中,積累了海量數據資源,醫療臨床大數據如何為疾病診療助力,如何通過數據元的統一標準化實現不同臨床研究數據庫的管理,進而加速疾病負擔研究的相關成果產出,成為值得探討和關注的課題。
目前,中國北京天壇醫院已經建立了多個腦血管病臨床研究數據庫,其中包括社區人群隊列、全國腦血管病流行病學調查數據和慢病監測行政數據庫等以人群為基礎的數據,以及醫院臨床研究數據、醫院病歷數據、生物樣本數據和病人隨訪數據等。數據庫涵蓋多維度信息,包括人口社會學基本信息,行為飲食、疾病治療、血液樣本、基因、生物標志物、影像、病史與體檢、隨訪信息和認知信息等。同時,該數據庫還建立了腦重大疾病數據元字典,與國際神經系統疾病的數據接軌互認,實現國內國際數據互聯互通,最大限度地發揮數據庫的價值。在此基礎上,利用現已完備的腦血管病大數據平臺,即可產出大量權威的疾病負擔和腦血管病疾病監測相關數據,為科學研究和政府決策提供依據[7](圖1)。

2.2 醫院電子病歷大數據與疾病負擔
2022年11月9日,國家衛生健康委頒布《“十四五”全民健康信息化規劃》,其中明確指出要強化統計數據共享應用,積極推動統計信息共享、交換和應用研究[8]。在醫療系統中,電子病歷、病案首頁等數據是醫院管理的基礎,不僅用于醫院管理,也可用于衛生統計和疾病負擔分析。如北京地區重大慢性病發病監測平臺,利用全市的病案首頁數據與死因行政數據庫,收集每年全市心腦血管發病人數,為政府決策提供依據。國家神經系統疾病質控中心,通過采集全國31個省份三級醫院病案首頁信息,統計19種神經系統重點疾病,每年更新并動態展示全國各省神經系統的疾病負擔與醫療服務質量質控數據,如全國卒中中心建設醫院數量、腦血管病病種分類、腦血管病平均住院日、次均費用、住院病死率等。2021年,來自重慶市的一個研究團隊基于人工智能和大數據方法,從衛生健康系統獲取人口信息、死亡數據以及病案首頁和電子病歷數據,結合自然語言識別分析技術,提取病案首頁和電子病歷中的診斷編碼和主訴,進行疾病的映射和分類,產出患病率、死亡率、疾病負擔和健康預期壽命等結果[9]。由于各城市健康狀況評估的復雜性,以及缺乏資源進行大規模人口調查,目前健康預期壽命測算少有在城市級別的研究。全國大型調查通常每五年進行一次,但基于電子病歷數據的人工智能方法可進行季節性或年度的疾病負擔和健康預期壽命估計,其可作為一種新工具,提供更可靠、更有效、更具靈活性的數據測量(圖2)。

因此,大量未使用的電子病歷數據、病案首頁數據可作為疾病負擔測算的一種替代數據源,通過大數據、人工智能和自然語言識別技術,自動提取和分析豐富的特定疾病信息。
2.3 醫保報銷大數據與疾病負擔
大數據技術的應用,能夠推動現有疾病監測模式的創新,讓疾病監測覆蓋到更大范圍的人群。從宏觀角度來看,實時而準確的全人群疾病監測可為揭示疾病病因、疾病流行趨勢和疾病負擔現狀,評價各類疾病預防和臨床診療效果等方面提供關鍵的基礎數據與科學依據,更是國家和地方政府科學配置醫療衛生資源、精準制訂疾病防控和健康管理規劃的根本所在。從微觀角度來看,豐富而詳實的疾病監測數據能夠指導各級醫療衛生機構和有關社區采取積極應對措施,及時調整診療供給,規范醫院診療行為,強化大眾的健康意識理念,科學宣傳疾病預防知識和健康生活方式。
過去十余年,北京大學腫瘤醫院柯楊教授團隊在我國太行山食管癌高發地區開展了多項大規模人群前瞻性研究。在長期的隊列隨訪工作中,探索出利用醫保報銷數據識別腫瘤新發病例的工作模式,即MIS-CASS(medical-insurance-system-based cancer surveillance system)模式[10]。經比較性研究評估,該模式對新發癌癥病例識別的靈敏度高達96%,特異度接近100%,能有效降低大眾整體癌癥發病風險,減輕人群癌癥負擔,提高癌癥患者的生存水平與生活質量。近期,該團隊進一步利用河南省滑縣醫保系統與死因監測系統大數據,首次報告了該地區上消化道惡性腫瘤等主要腫瘤種類的人群現患率(患病率、流行率)及癌癥患者生存率,為明確當地惡性腫瘤負擔及患者預后、建立健全癌癥防控工作提供了基礎數據[11]。此項研究充分利用了醫保報銷數據,基于診斷文本和ICD-10編碼,構建識別疾病的所有關鍵詞,形成疾病字典庫,統計相關疾病病例數量,計算發病率等相關疾病負擔指標,構建了基于醫療報銷數據的癌癥“現患及生存監測”新模式,大大豐富了MIS-CASS的科學內涵與實際應用場景,同時也豐富了患病率和流行率的監測和測算方式,豐富了與疾病負擔相關的患病人群的測算數據來源(圖3)。

2.4 互聯網大數據與疾病危險因素監測
互聯網和信息行業的快速發展使公共衛生領域具備了新的內涵。大數據可將其精準、客觀、科學的價值轉化為一種生產元素,滲透到醫療和公共衛生領域的各個環節中去,從而帶來一些本質上的變革。通過深度的數據采集、數據存取管理、數據處理、數據分析等手段,挖掘互聯網大數據中的有效信息,分析數據內涵,可以對疾病和公共衛生事件起到預測、預警和指引等作用。目前,聚焦于公共衛生領域的大數據應用包括疾病監測、疾病危險因素監測、疾病負擔測算等,現可以利用互聯網大數據、覆蓋全國的各類型數據庫以及模型方法實時開展公共衛生傳染病監測和趨勢模擬,如通過監測社交媒體或頻繁檢索的詞條來預測某些傳染病的流行情況,通過監測移動設備的定位數據來追蹤某些傳染病的傳播路徑和傳播范圍。此外,針對慢性和非傳染性疾病也可以開展健康及相關危險因素監測,如智能佩戴設備的健康數據云分析、群體心理健康網絡云監測等。
2.5 全人群全生命周期超大規模人群隊列研究
山東省于2018年12月25日發布全省全人群全生命周期健康狀況和衛生服務保障研究報告,該報告展現了全省人群的健康危險暴露,疾病分布、死亡模式和疾病負擔等主要健康問題和情況。研究依托山東大學健康醫療大數據研究院的健康醫療大數據云技術平臺,首次啟用大數據手段,通過省域全民健康信息平臺匯聚醫療衛生及相關行業的全員人口健康信息,構建了大型健康醫療數據庫,獲得了能代表山東省的491萬超大規模人群隊列,融合了包含基因組/暴露組組學、居民健康檔案、健康體檢、臨床診療、健康/疾病監測、基本公共衛生、移動健康/醫療檢測、健康保險以及死因數據等155個數據庫的健康醫療數據,對山東省居民主要健康危險因素、面臨的主要疾病負擔等進行了全方位的透視,構建了山東省全人群全生命周期的健康譜圖。該研究對省級全人群衛生政策規劃、衛生體制改革、醫學研究和醫藥產業布局調整都具有重要的指導意義[12](圖4)。

3 健康大數據應用的問題與挑戰
醫療健康數據類型具有復雜性和多樣性,常規軟件工具難以在合理的時間內從健康大數據中獲取有價值的信息,因此迫切需要創新性地利用大數據技術來解決問題[13]。但一方面,我國有關人口健康的數據類型繁雜多樣,數據之間的復雜關聯以及伴隨時間空間發生的演變對人口健康研究提出了挑戰和機遇。另一方面,現無全國統一的疾病負擔信息標準,無論是疾病負擔統計所需的人口數據、死亡數據還是患病數據,都需要采用統一的疾病負擔數據模型,它包括統計元數據框架和統計元數據的描述內容等。
近幾年,國內雖常有疾病負擔的研究和文獻資料發布,但研究樣本和研究范圍偏小,很難做到省級或國家級精準的疾病負擔測算。同時,疾病負擔研究也缺乏規范性,數據來源大都是基于現有可及的幾種監測數據,方法學也多借用國外標準。因此,充分借助大數據技術的特長,將可開展更大范圍的疾病負擔分析,將推動我國本土化的疾病負擔測算研究再上一臺階。未來,海量數據的聚集也會對傳統的統計方法提出挑戰,同時也為大數據技術在該領域的應用提供重大機遇,未來疾病負擔分析研究與大數據技術應用將會互相支撐,互促發展。
4 健康大數據應用的展望和未來
基于大數據技術的革新發展,疾病監測和疾病負擔測算領域得到拓寬,內涵也得以更加豐富。醫療衛生系統正產生大量的醫療信息數據,醫療衛生大數據系統也正處于建設和發展當中,目前很多大型醫院已經開始著手建設臨床醫學大數據采集系統[14]。為獲得可靠的決策依據,人們對人群健康綜合測量方法越加重視,相關人群健康及疾病監測數據可為衛生技術評估、藥物經濟學等研究方向提供循證研究證據和流行病學信息。與醫學信息進行深度整合、在真實世界證據及統計學體系的支持下產生新的知識是公共衛生大數據應用的主要方向[15]。隨著大數據時代的到來,更應充分利用這種發展契機,搭建基于云計算的疾病負擔研究大數據技術平臺,研究適合我國的疾病負擔測算及應用方法體系,加強大數據分析人才培養、推動多學科合作,實現公共衛生數據收集、整理、挖掘、分析、決策、共享一體化解決方案,使我國成為公共衛生大數據挖掘、分析和應用的強國。