循證醫學作為一門研究證據的科學,其證據決策思想在大數據時代迎來了發展的契機,研究起點從證據前移至數據。大數據在生產證據、總結加工整合證據、應用證據三個階段發揮積極作用,可更加便捷地獲得證據并不再稀缺,證據將更加客觀、公正、可靠、透明并得到全新的應用。因此,在大數據時代下開展循證醫學研究,積極構建循證醫學智能服務平臺,需要制定大數據時代循證醫學研究戰略,全面提高證據質量;完善大數據基礎設施,制定結構化臨床數據標準,推動臨床研究數據全面公開;大力發展便攜式、可穿戴健康監測設備,打通院外隨訪數據收集和訪問通道;建立數據使用規范,規避循證醫學研究應用大數據的風險。
引用本文: 閻小妍, 董沖亞, 姚晨. 大數據時代的循證醫學研究. 中國循證醫學雜志, 2017, 17(3): 249-254. doi: 10.7507/1672-2531.201701099 復制
循證醫學(evidence-based medicine,EBM)是一門研究證據的科學,其核心思想是依靠證據進行決策,涵蓋生產證據、評價證據、利用證據進行決策的一系列方法學內容。證據產生于臨床診療和臨床研究活動中獲得的各種數據,并依靠統計學方法完成數據的總結加工整合,轉化后的證據可以被研究者根據需求分別加以利用,應用于醫療決策等工作實踐。近年來,大數據(Big data)已經成為世界范圍內的“網紅”詞匯,大數據時代是“用數據說話”的時代。循證醫學和大數據分析同樣高度重視、重點研究“數據”的天然屬性,使二者有著很高的契合度,循證醫學研究與大數據分析技術的融合已是大勢所趨,需要所有的醫療衛生工作者和研究者以新的思維方式去探索和解決醫學問題。
1 循證醫學研究的證據決策思想
現有最佳的臨床研究結論是醫療決策的主要依據[1],結論來源于證據,其中包括了電子病歷、醫學影像、實驗室檢測、藥物療效及不良反應等大量的結構化和非結構化數據[2]。Brian 教授總結的“5S”等級構架精煉描繪從證據到決策的全過程(圖 1),由原始研究(Studies)出發,證據進行逐級的歸納匯總提煉,最終獲得一個集合了全部最佳證據,以及進行決策所需的其他信息的具有計算機決策支持的證據系統(System)。

“5S”最頂端的證據系統是一個理想狀態,其整合了疾病診治的臨床路徑以及相關證據,并能夠在實踐中結合患者的個人信息在短時間內迅速針對該患者的個人情況產生診治建議。英國國家醫療衛生服務信息工程產生的“醫學地圖(Map of Medicine)”以及 IBM 公司認知技術平臺“Watson”均具備一定程度的證據系統特征。前者著重在臨床路徑規劃及轉診決策推薦上,后者已在一些特定醫療領域(如腫瘤)做出了結合病患數據、醫療文獻、臨床指南及專家經驗為個體患者規劃最高效的治療方案的嘗試。
盡管初具雛形的證據系統已經出現,但迄今為止,設計完善并可廣泛推廣的具備智能決策功能的證據系統仍未建立。一方面,“5S”證據演進的過程是漫長的,盡管互聯網時代的到來,使得證據的收集產生了巨大便利,但后續證據的加工、整合、形成綜合證據仍需要大量的人力工作和時間。另一方面,決策作為循證醫學最終落腳點,理想化的循證決策應是個體化的,而受限于證據的局限和逐層提煉的進程,往往獲得的“最佳證據”是基于群體觀察的結果,而臨床指南也很難做到足夠“精準”。突破第一條局限,需要更智能、便利、快捷的證據轉化工具,突破第二條局限,需要更大量、更詳盡的個體化證據。
2 大數據時代證據決策思想的發展
傳統循證醫學起點于原始研究所產生的證據,獲得途徑主要來自于發表的醫學科研文獻,而這類證據往往是針對于群體的研究結論。當證據應用于個體時,缺乏更好的個體化依據指導個體化決策。大數據時代下,循證醫學的起點應前移至數據階段(圖 2)。而傳統循證醫學中的文獻獲得的證據,以及證據進一步總結加工整合的高級證據,其實也相當于“數據”,或者說,大數據時代下,個體化的“數據”也是循證醫學“證據”的一部分,且是十分重要的一部分。在這種思維模式下,數據、證據本身通過邏輯相關串聯至一起,指導醫療決策。由于有大量的個體化數據的存在,將可產生更偏向個體化的決策,同時針對該決策還能依托于新的個體化數據進行驗證。伴隨大數據時代的到來,先進的互聯網技術、數據整合技術將為智能的證據收集、加工、整合提供技術上的條件。同時,海量的日常診療中產生的醫療大數據以及新技術(物聯網、可穿戴設備、移動醫療等)收集的個體化大數據將為獲得更精準的證據以及產生個體化的決策提供條件。在此基礎上,將逐漸建立和完善基于醫療大數據的循證醫學證據決策智能輔助系統。

3 大數據時代證據決策思想發展的機遇
循證醫學研究同大數據融合后,其數據資源體現出大價值(Value)、大體量(Volume)、多樣性(Variety)、準確性(Veracity)和時效性(Velocity)的 5V 特點,妥善應對了循證醫學研究發展中的難題,為循證醫學研究帶來了前所未有的發展機遇。
3.1 生產證據:證據可更加便捷地獲得且不再稀缺
日常診療活動中產生的大數據是當前循證醫學最亟需利用的一塊證據資源,其來源是醫院五大典型系統即臨床信息系統(CIS)、實驗室信息系統(LIS)、醫學影像信息系統(PACS)、放射信息系統(RIS)和醫院信息系統(HIS)等。這些系統時刻產生海量的臨床大數據(醫囑、病程記錄、護理記錄、檢驗報告、各種醫學影像數據等)。此外,物聯網、可穿戴設備、移動醫療等技術的成熟使得醫療大數據不再局限于診療過程中產生,實時成像、單點護理設備以及可穿戴的智能移動健康技術的發展也極大加速了大數據的生產[3]。手機、健康手環、智能血壓計、體重秤等設備使得醫療大數據在個體化維度上也發展成了大數據,且越來越多的被應用到醫學研究中。蘋果公司于 2015 年 3 月發布的 ResearchKit 系列 APP,用在心血管疾病,糖尿病,乳腺癌等領域的科學研究。隨后 IBM 與蘋果公司也達成了合作,ResearchKit 中的數據也被整合至 Watson 的智能決策系統中。新的數據收集手段為循證醫學研究提供了新的視角,伴隨大數據出現的數據融合技術能將不同源頭的數據進行整合,大大減少了數據的整理、借閱和采集時間,這不僅對患者的疾病診斷和預警監控更加有利,同時也對醫生的臨床及醫學研究更有幫助。由于大數據樣本量巨大且為個體化數據(individual participant data,IPD),各種證據隨時客觀存在,并即時更新。因此,困擾傳統循證醫學研究的個體證據稀缺問題將獲得大幅改善。個體化大數據不但可以作為產生更精準證據的資源,也不必耗費大量時間和精力來“產生證據”,極大提高研究者的研究效率,可以作為評估個體化決策的依據。
3.2 總結加工整合證據:證據將更加客觀、公正、可靠、透明
在循證醫學研究中,從大量的臨床數據出發,總結加工整合證據是關鍵的一環。鑒于現有大數據雜亂無章、臨床試驗方法不足等問題,有學者系統總結了利用統計學方法分析大數據時應該考慮的要點和需注意的問題[4,5],幫助研究者更有效提取高質量的數據、保證數據被客觀合理的利用并公正可靠的應用數據評價結局信息。隨機對照試驗(randomized control trial,RCT)在過去占主導作用,但有研究表明,大數據時代 RCT 的主導地位可能會被大數據臨床研究所顛覆[6,7],當數據挖掘技術能夠充分滿足對大數據的統計分析時,就可直接對總體樣本(全集)進行分析,得出相應的結論。已有研究利用機器學習技術進行系統綜述中文獻篩選與閱讀工作。Iain 的研究中嘗試比較“機器人閱讀”和“人工閱讀”的評閱臨床試驗類文章偏倚程度,分別評估了來自 The Cochrane Library 的 12 808 個研究的 PDF 文稿數據,結論是文獻偏倚評估質量接近,并且可以節約大量工作量和時間。利用語義技術結合機器學習、人工智能技術,可以使循證醫學證據準確的獲得、迅速轉化并實時更新成為了可能。將來在大數據巨量樣本量環境下,直接降低統計分析過程中Ⅰ類錯誤和Ⅱ類錯誤發生概率,提高臨床試驗結論的可靠性。大數據分析需要臨床醫生、生物統計專家、數據處理專家以及衛生決策者共同參與實現應用和轉化,并且廣泛匯集醫生及病人評價。整個過程中,可隨時采集數據進行分析處理,也可對分析得到的結果馬上進行驗證,從而能夠保證醫學證據的可靠與可信。此外,面對大數據,證據的采集、整合、分析、處理、研究完全靠個人電腦完成已極其困難,沒有利用云計算的統計分析軟件也難于完成大數據的分析和處理,必須依靠研究開發諸如基于大數據的智能機器人自主學習等技術完成大數據的分析和挖掘。研究者也必須掌握新的數據分析方法,借助更為先進的分析工具和軟件,促進循證醫學進一步的變革和發展。
3.3 應用證據:證據將得到全新的應用
基于大數據的臨床決策是當前階段循證醫學發展的主要內容,相應地,海量數據的出現及對它的統計分析也推動了循證醫學的二次發展。臨床決策支持系統(CDSS)就是典型的基于海量的臨床信息資源來為疾病的診斷和治療提供科學決策的系統,是總結各種醫療方案療效,更好地服務于臨床醫療決策的大數據系統[8]。基于大數據的個體化醫療是目前逐步普及和飛速發展的新領域,其理念和目的是以每位患者的海量數據信息為基礎,制定出適合每位患者的獨特的、最佳的治療和預防方案,提高治療的針對性,從而取得最優的療效[9]。精準醫學的成功實踐與應用離不開大數據的發展,將推進傳統醫學實踐從關注疾病到關注個體健康的轉化。基于大數據的計算機輔助藥效分析形成的數據信息和經驗能夠實現智能輔助給藥系統,進而為臨床診療提供病癥用藥參考。此外,大數據在病因發現和篩查、臨床醫學影像分析、公共衛生領域、遠程醫療、臨床科研和醫院服務[10,11]中都得到了應用,不斷推動循證醫學研究全方位發展。
4 大數據時代循證醫學智能服務平臺建設構想
傳統循證醫學從證據的采集、轉化、評價是一套嚴謹且科學的流程。大數據時代要求我們重新梳理循證醫學研究流程,重新確定研究手段、工具、方法,使其適應標準化、自動化和智能化的發展趨勢。
4.1 制定大數據時代循證醫學研究戰略,加強頂層規劃和設計,全面提高證據決策質量
大數據將成為引領未來科技和社會進步的重要載體。循證醫學研究必須緊跟時代的腳步,從全局的高度來規劃、設計、制定大數據時代循證醫學研究發展戰略,引導和推動循證醫學研究對大數據的研究和利用,從循證醫學研究的三個階段入手,全面提高數據證據質量。在“生產證據”階段整合資源,整合醫療機構內部數據,將醫院內 HIS、LIS、PACS 等醫療數據、單病種登記數據、生物樣本庫和研究者感興趣的其他數據進行系統梳理整合。收集醫院外人群數據,針對研究者需求開發新的登記系統、向患者提供植有數據傳輸芯片的可穿戴設備、接入醫保數據、大健康數據等。在“總結加整合證據”階段推廣應用新的研究方法,針對于個體病例數據的 Meta 分析(IPD Meta 分析)的優勢在大數據時代將更加明顯,數據共享、實時更新、突破地域限制等便利將推動 IPD Meta 分析更好更快的使用和普及。在“應用證據”階段開發新的技術和手段,利用動態網頁技術,提供在線分析工具和隨機化等統計分析工具;利用智能半自動化機器人服務技術,提供在線交互和人工智能語義回答;依托循證醫學專家庫資源,提供人工服務支持等專家服務等。
4.2 完善大數據基礎設施,依托市場化資源建設臨床數據中心,研發基于海量數據的便捷研究工具
我國龐大的就醫人群為開展“低”等級臨床觀察性研究提供了重要資源,日常的診療數據是巨大且寶貴的,有待進一步發掘和利用,其中最重要、最基本、最核心的資源就是電子病歷數據庫。因此,大數據基礎設施的建設必須要充分調動醫療機構的主動性,以醫療機構作為數據庫平臺建設的“主戰場”。2016 年 6 月,國務院頒布了《關于促進和規范健康大數據應用發展的指導意見》[12],相信這將極大推動大數據基礎設施建設的進程,提高大數據在循證醫學研究中應用的有效性,同時加快電子病歷的普及。受資金、技術等現有條件制約,大數據基礎設施的建設可以依托市場化資源完成,醫療機構在建設過程中堅持主導、管理定位,目前已有一些知名大型三甲醫院開展了臨床數據中心的建設[13]。現有條件下,各醫療機構的電子病歷數據仍屬于碎片化狀態,臨床研究所需信息處于非結構化的電子病歷中,研究者仍然需要耗費大量的時間和精力提取、整理研究中所需的信息,所以目前將電子化的臨床診療數據應用于臨床研究仍面臨重大挑戰。研究者需要更加便捷的研究工具,方便在海量數據中快捷、準確的獲得其臨床研究所需要收集的資料,以便高效開展循證醫學研究,特別是“低”等級證據的研究。
4.3 制定結構化臨床數據標準,推動臨床研究數據全面公開,打破機構壁壘,徹底解決“數據孤島”難題
目前,大數據在源頭上即存在難題,主要表現為“數據孤島”,大量患者信息數據存在于一個個 HIS、LIS、EMR 等系統中,即使是建立了臨床數據中心(CDR)的醫療機構也是各自為政。只有電子病歷數據達到準確性、完整性、關聯性和統一性后[14],才能使破碎的數據集進行整合分析,為循證醫學研究服務[15]。因此,循證醫學研究未來必須重視數據的標準化工作,采用結構化參數設計來實現數據的互聯互通,構建滿足循證醫學專業要求的元數據標準體系,避免數據“打架”。標準化的目的是獲取的數據、證據可被機器準確識別,理解和推理。Web3.0 的技術體系包括:資源描述框架、Web3.0 本體語言、基于語義的數據查詢語言、元數據詞典、鏈式數據、知識圖等,非常適合于循證醫學大數據時代的應用要求,其可以精確描述一條知識,包括一條證據的語義和屬性,適用于機器理解和推理。因此可利用 Web3.0 元數據標準作為大數據時代循證醫學元數據標準的基礎,并在此技術體系基礎上建立起我們自己的標準系統,最終實現數據庫中的定量數據、定性數據和交換數據都可按照醫生和研究者的需要,方便的進行數據抽取、數據轉換和數據合并的目標。同時,積極向政府呼吁,參考美國陰性結果也需要公開的強制性法令[16]、在期刊發表的臨床試驗必須事先進行注冊的強制要求、對發表研究的原始數據共享做強制性要求[17],通過立法或行業規范的形式推動臨床研究原始數據全面公開。凡是政府設立的研究項目和關系民生的臨床研究項目,所有數據和報告都必須無償對全社會公開,并在各級醫療衛生機構間建立統一的研究數據共享平臺,促使臨床研究打破空間地理的束縛,實現多中心研究。因此,要積極建立數據庫資源的共享和開放利用機制,打破醫療機構間的壁壘,加強政府間、醫療機構間合作,增加與患者的互動反饋,不斷擴大大數據的應用范圍。
4.4 大力發展便攜式、可穿戴健康監測設備,打通院外隨訪數據收集和訪問通道
大數據應用可分為對傳統醫療的優化、對傳統醫療的補充兩大方向,一方面改善和解決傳統醫療服務的問題和弊端,另一方面滿足傳統醫療服務未覆蓋到的市場需求。隨著便攜式、可穿戴健康監測智能終端的發展,院外隨訪數據收集和訪問通道將隨之打通,實現“全人、全程、全方位”移動健康服務[18],健康數據特別是終點數據實現自動采集,長期持續采集治療證據及療效證據也將不再困難。對于中醫等治療康復過程較長的學科來說,可解決臨床研究中證據采集及療效評估的難題,非常有助于循證醫學研究在中醫等領域的發展壯大。此外,通過智能手機 APP、可視眼鏡等數據瀏覽設備,醫生可隨時方便的獲取患者病史資料、監控院外患者生命體征變化和用藥情況,及時指導藥物使用,給予臨床診療建議。
4.5 建立數據使用規范,規避循證醫學研究應用大數據的風險
大數據的收集過程中,將不可避免的涉及到國民健康信息等國家基礎安全數據和公民隱私、商業秘密等不適宜公開的信息。因此,循證醫學研究應用大數據時,必須采取必要措施,規避相關法律和倫理風險。立法層面上,要明確大數據采集和使用的原則。行政層面上,需要國家相關部門制定大數據技術標準和運營規范,重視大數據及信息安全體系建設,加強對重點領域敏感數據的監管。技術層面上,重點是確保數據脫敏、物理隔離、授權使用。使用的數據是經過同態加密,清洗過的信息摘要類數據,并且數據附加時間戳,可進行溯源,采取授權方式保證數據難以篡改及永久溯源。通過各方面的積極努力,構建大數據收集和使用的良性生態環境,確保有序運用大數據開展循證醫學研究。
5 總結
大數據時代已經來臨,結合云計算和元數據標準的循證醫學研究,將極大拓展研究視角、提高研究效率。大數據時代帶來的海量數據以及更先進的互聯網技術使得構建循證醫學智能服務平臺,指導臨床決策的計算機決策支持證據系統不再停留在設想階段。大數據時代的循證醫學研究,更多的將是圍繞該平臺、系統開展工作,如何利用醫療大數據證據;如何使證據獲取、總結、加工更加自動、準確智能;如何結合證據及個體化數據產生個體化決策建議等。平臺、系統的建設需要一個長期的過程,不僅需要循證醫學方法學領域提供理論方法支持,互聯網大數據技術領域提供技術支持,還需要臨床醫生、衛生工作者實際去生產、共享基礎數據,并作為該系統的服務對象實際應用、體驗、改進該系統。未來平臺、系統的成功建立,將為個體化決策產生更精準更豐富的證據及決策建議,機器學習、人工智能可以簡化證據獲取的流程。需要指出的是,無論循證醫學研究如何發展,都必須“不忘初心”,技術不能取代人腦的決策工作,仍需要臨床醫生結合證據、臨床經驗與患者價值三者共同做出最終決策。
循證醫學(evidence-based medicine,EBM)是一門研究證據的科學,其核心思想是依靠證據進行決策,涵蓋生產證據、評價證據、利用證據進行決策的一系列方法學內容。證據產生于臨床診療和臨床研究活動中獲得的各種數據,并依靠統計學方法完成數據的總結加工整合,轉化后的證據可以被研究者根據需求分別加以利用,應用于醫療決策等工作實踐。近年來,大數據(Big data)已經成為世界范圍內的“網紅”詞匯,大數據時代是“用數據說話”的時代。循證醫學和大數據分析同樣高度重視、重點研究“數據”的天然屬性,使二者有著很高的契合度,循證醫學研究與大數據分析技術的融合已是大勢所趨,需要所有的醫療衛生工作者和研究者以新的思維方式去探索和解決醫學問題。
1 循證醫學研究的證據決策思想
現有最佳的臨床研究結論是醫療決策的主要依據[1],結論來源于證據,其中包括了電子病歷、醫學影像、實驗室檢測、藥物療效及不良反應等大量的結構化和非結構化數據[2]。Brian 教授總結的“5S”等級構架精煉描繪從證據到決策的全過程(圖 1),由原始研究(Studies)出發,證據進行逐級的歸納匯總提煉,最終獲得一個集合了全部最佳證據,以及進行決策所需的其他信息的具有計算機決策支持的證據系統(System)。

“5S”最頂端的證據系統是一個理想狀態,其整合了疾病診治的臨床路徑以及相關證據,并能夠在實踐中結合患者的個人信息在短時間內迅速針對該患者的個人情況產生診治建議。英國國家醫療衛生服務信息工程產生的“醫學地圖(Map of Medicine)”以及 IBM 公司認知技術平臺“Watson”均具備一定程度的證據系統特征。前者著重在臨床路徑規劃及轉診決策推薦上,后者已在一些特定醫療領域(如腫瘤)做出了結合病患數據、醫療文獻、臨床指南及專家經驗為個體患者規劃最高效的治療方案的嘗試。
盡管初具雛形的證據系統已經出現,但迄今為止,設計完善并可廣泛推廣的具備智能決策功能的證據系統仍未建立。一方面,“5S”證據演進的過程是漫長的,盡管互聯網時代的到來,使得證據的收集產生了巨大便利,但后續證據的加工、整合、形成綜合證據仍需要大量的人力工作和時間。另一方面,決策作為循證醫學最終落腳點,理想化的循證決策應是個體化的,而受限于證據的局限和逐層提煉的進程,往往獲得的“最佳證據”是基于群體觀察的結果,而臨床指南也很難做到足夠“精準”。突破第一條局限,需要更智能、便利、快捷的證據轉化工具,突破第二條局限,需要更大量、更詳盡的個體化證據。
2 大數據時代證據決策思想的發展
傳統循證醫學起點于原始研究所產生的證據,獲得途徑主要來自于發表的醫學科研文獻,而這類證據往往是針對于群體的研究結論。當證據應用于個體時,缺乏更好的個體化依據指導個體化決策。大數據時代下,循證醫學的起點應前移至數據階段(圖 2)。而傳統循證醫學中的文獻獲得的證據,以及證據進一步總結加工整合的高級證據,其實也相當于“數據”,或者說,大數據時代下,個體化的“數據”也是循證醫學“證據”的一部分,且是十分重要的一部分。在這種思維模式下,數據、證據本身通過邏輯相關串聯至一起,指導醫療決策。由于有大量的個體化數據的存在,將可產生更偏向個體化的決策,同時針對該決策還能依托于新的個體化數據進行驗證。伴隨大數據時代的到來,先進的互聯網技術、數據整合技術將為智能的證據收集、加工、整合提供技術上的條件。同時,海量的日常診療中產生的醫療大數據以及新技術(物聯網、可穿戴設備、移動醫療等)收集的個體化大數據將為獲得更精準的證據以及產生個體化的決策提供條件。在此基礎上,將逐漸建立和完善基于醫療大數據的循證醫學證據決策智能輔助系統。

3 大數據時代證據決策思想發展的機遇
循證醫學研究同大數據融合后,其數據資源體現出大價值(Value)、大體量(Volume)、多樣性(Variety)、準確性(Veracity)和時效性(Velocity)的 5V 特點,妥善應對了循證醫學研究發展中的難題,為循證醫學研究帶來了前所未有的發展機遇。
3.1 生產證據:證據可更加便捷地獲得且不再稀缺
日常診療活動中產生的大數據是當前循證醫學最亟需利用的一塊證據資源,其來源是醫院五大典型系統即臨床信息系統(CIS)、實驗室信息系統(LIS)、醫學影像信息系統(PACS)、放射信息系統(RIS)和醫院信息系統(HIS)等。這些系統時刻產生海量的臨床大數據(醫囑、病程記錄、護理記錄、檢驗報告、各種醫學影像數據等)。此外,物聯網、可穿戴設備、移動醫療等技術的成熟使得醫療大數據不再局限于診療過程中產生,實時成像、單點護理設備以及可穿戴的智能移動健康技術的發展也極大加速了大數據的生產[3]。手機、健康手環、智能血壓計、體重秤等設備使得醫療大數據在個體化維度上也發展成了大數據,且越來越多的被應用到醫學研究中。蘋果公司于 2015 年 3 月發布的 ResearchKit 系列 APP,用在心血管疾病,糖尿病,乳腺癌等領域的科學研究。隨后 IBM 與蘋果公司也達成了合作,ResearchKit 中的數據也被整合至 Watson 的智能決策系統中。新的數據收集手段為循證醫學研究提供了新的視角,伴隨大數據出現的數據融合技術能將不同源頭的數據進行整合,大大減少了數據的整理、借閱和采集時間,這不僅對患者的疾病診斷和預警監控更加有利,同時也對醫生的臨床及醫學研究更有幫助。由于大數據樣本量巨大且為個體化數據(individual participant data,IPD),各種證據隨時客觀存在,并即時更新。因此,困擾傳統循證醫學研究的個體證據稀缺問題將獲得大幅改善。個體化大數據不但可以作為產生更精準證據的資源,也不必耗費大量時間和精力來“產生證據”,極大提高研究者的研究效率,可以作為評估個體化決策的依據。
3.2 總結加工整合證據:證據將更加客觀、公正、可靠、透明
在循證醫學研究中,從大量的臨床數據出發,總結加工整合證據是關鍵的一環。鑒于現有大數據雜亂無章、臨床試驗方法不足等問題,有學者系統總結了利用統計學方法分析大數據時應該考慮的要點和需注意的問題[4,5],幫助研究者更有效提取高質量的數據、保證數據被客觀合理的利用并公正可靠的應用數據評價結局信息。隨機對照試驗(randomized control trial,RCT)在過去占主導作用,但有研究表明,大數據時代 RCT 的主導地位可能會被大數據臨床研究所顛覆[6,7],當數據挖掘技術能夠充分滿足對大數據的統計分析時,就可直接對總體樣本(全集)進行分析,得出相應的結論。已有研究利用機器學習技術進行系統綜述中文獻篩選與閱讀工作。Iain 的研究中嘗試比較“機器人閱讀”和“人工閱讀”的評閱臨床試驗類文章偏倚程度,分別評估了來自 The Cochrane Library 的 12 808 個研究的 PDF 文稿數據,結論是文獻偏倚評估質量接近,并且可以節約大量工作量和時間。利用語義技術結合機器學習、人工智能技術,可以使循證醫學證據準確的獲得、迅速轉化并實時更新成為了可能。將來在大數據巨量樣本量環境下,直接降低統計分析過程中Ⅰ類錯誤和Ⅱ類錯誤發生概率,提高臨床試驗結論的可靠性。大數據分析需要臨床醫生、生物統計專家、數據處理專家以及衛生決策者共同參與實現應用和轉化,并且廣泛匯集醫生及病人評價。整個過程中,可隨時采集數據進行分析處理,也可對分析得到的結果馬上進行驗證,從而能夠保證醫學證據的可靠與可信。此外,面對大數據,證據的采集、整合、分析、處理、研究完全靠個人電腦完成已極其困難,沒有利用云計算的統計分析軟件也難于完成大數據的分析和處理,必須依靠研究開發諸如基于大數據的智能機器人自主學習等技術完成大數據的分析和挖掘。研究者也必須掌握新的數據分析方法,借助更為先進的分析工具和軟件,促進循證醫學進一步的變革和發展。
3.3 應用證據:證據將得到全新的應用
基于大數據的臨床決策是當前階段循證醫學發展的主要內容,相應地,海量數據的出現及對它的統計分析也推動了循證醫學的二次發展。臨床決策支持系統(CDSS)就是典型的基于海量的臨床信息資源來為疾病的診斷和治療提供科學決策的系統,是總結各種醫療方案療效,更好地服務于臨床醫療決策的大數據系統[8]。基于大數據的個體化醫療是目前逐步普及和飛速發展的新領域,其理念和目的是以每位患者的海量數據信息為基礎,制定出適合每位患者的獨特的、最佳的治療和預防方案,提高治療的針對性,從而取得最優的療效[9]。精準醫學的成功實踐與應用離不開大數據的發展,將推進傳統醫學實踐從關注疾病到關注個體健康的轉化。基于大數據的計算機輔助藥效分析形成的數據信息和經驗能夠實現智能輔助給藥系統,進而為臨床診療提供病癥用藥參考。此外,大數據在病因發現和篩查、臨床醫學影像分析、公共衛生領域、遠程醫療、臨床科研和醫院服務[10,11]中都得到了應用,不斷推動循證醫學研究全方位發展。
4 大數據時代循證醫學智能服務平臺建設構想
傳統循證醫學從證據的采集、轉化、評價是一套嚴謹且科學的流程。大數據時代要求我們重新梳理循證醫學研究流程,重新確定研究手段、工具、方法,使其適應標準化、自動化和智能化的發展趨勢。
4.1 制定大數據時代循證醫學研究戰略,加強頂層規劃和設計,全面提高證據決策質量
大數據將成為引領未來科技和社會進步的重要載體。循證醫學研究必須緊跟時代的腳步,從全局的高度來規劃、設計、制定大數據時代循證醫學研究發展戰略,引導和推動循證醫學研究對大數據的研究和利用,從循證醫學研究的三個階段入手,全面提高數據證據質量。在“生產證據”階段整合資源,整合醫療機構內部數據,將醫院內 HIS、LIS、PACS 等醫療數據、單病種登記數據、生物樣本庫和研究者感興趣的其他數據進行系統梳理整合。收集醫院外人群數據,針對研究者需求開發新的登記系統、向患者提供植有數據傳輸芯片的可穿戴設備、接入醫保數據、大健康數據等。在“總結加整合證據”階段推廣應用新的研究方法,針對于個體病例數據的 Meta 分析(IPD Meta 分析)的優勢在大數據時代將更加明顯,數據共享、實時更新、突破地域限制等便利將推動 IPD Meta 分析更好更快的使用和普及。在“應用證據”階段開發新的技術和手段,利用動態網頁技術,提供在線分析工具和隨機化等統計分析工具;利用智能半自動化機器人服務技術,提供在線交互和人工智能語義回答;依托循證醫學專家庫資源,提供人工服務支持等專家服務等。
4.2 完善大數據基礎設施,依托市場化資源建設臨床數據中心,研發基于海量數據的便捷研究工具
我國龐大的就醫人群為開展“低”等級臨床觀察性研究提供了重要資源,日常的診療數據是巨大且寶貴的,有待進一步發掘和利用,其中最重要、最基本、最核心的資源就是電子病歷數據庫。因此,大數據基礎設施的建設必須要充分調動醫療機構的主動性,以醫療機構作為數據庫平臺建設的“主戰場”。2016 年 6 月,國務院頒布了《關于促進和規范健康大數據應用發展的指導意見》[12],相信這將極大推動大數據基礎設施建設的進程,提高大數據在循證醫學研究中應用的有效性,同時加快電子病歷的普及。受資金、技術等現有條件制約,大數據基礎設施的建設可以依托市場化資源完成,醫療機構在建設過程中堅持主導、管理定位,目前已有一些知名大型三甲醫院開展了臨床數據中心的建設[13]。現有條件下,各醫療機構的電子病歷數據仍屬于碎片化狀態,臨床研究所需信息處于非結構化的電子病歷中,研究者仍然需要耗費大量的時間和精力提取、整理研究中所需的信息,所以目前將電子化的臨床診療數據應用于臨床研究仍面臨重大挑戰。研究者需要更加便捷的研究工具,方便在海量數據中快捷、準確的獲得其臨床研究所需要收集的資料,以便高效開展循證醫學研究,特別是“低”等級證據的研究。
4.3 制定結構化臨床數據標準,推動臨床研究數據全面公開,打破機構壁壘,徹底解決“數據孤島”難題
目前,大數據在源頭上即存在難題,主要表現為“數據孤島”,大量患者信息數據存在于一個個 HIS、LIS、EMR 等系統中,即使是建立了臨床數據中心(CDR)的醫療機構也是各自為政。只有電子病歷數據達到準確性、完整性、關聯性和統一性后[14],才能使破碎的數據集進行整合分析,為循證醫學研究服務[15]。因此,循證醫學研究未來必須重視數據的標準化工作,采用結構化參數設計來實現數據的互聯互通,構建滿足循證醫學專業要求的元數據標準體系,避免數據“打架”。標準化的目的是獲取的數據、證據可被機器準確識別,理解和推理。Web3.0 的技術體系包括:資源描述框架、Web3.0 本體語言、基于語義的數據查詢語言、元數據詞典、鏈式數據、知識圖等,非常適合于循證醫學大數據時代的應用要求,其可以精確描述一條知識,包括一條證據的語義和屬性,適用于機器理解和推理。因此可利用 Web3.0 元數據標準作為大數據時代循證醫學元數據標準的基礎,并在此技術體系基礎上建立起我們自己的標準系統,最終實現數據庫中的定量數據、定性數據和交換數據都可按照醫生和研究者的需要,方便的進行數據抽取、數據轉換和數據合并的目標。同時,積極向政府呼吁,參考美國陰性結果也需要公開的強制性法令[16]、在期刊發表的臨床試驗必須事先進行注冊的強制要求、對發表研究的原始數據共享做強制性要求[17],通過立法或行業規范的形式推動臨床研究原始數據全面公開。凡是政府設立的研究項目和關系民生的臨床研究項目,所有數據和報告都必須無償對全社會公開,并在各級醫療衛生機構間建立統一的研究數據共享平臺,促使臨床研究打破空間地理的束縛,實現多中心研究。因此,要積極建立數據庫資源的共享和開放利用機制,打破醫療機構間的壁壘,加強政府間、醫療機構間合作,增加與患者的互動反饋,不斷擴大大數據的應用范圍。
4.4 大力發展便攜式、可穿戴健康監測設備,打通院外隨訪數據收集和訪問通道
大數據應用可分為對傳統醫療的優化、對傳統醫療的補充兩大方向,一方面改善和解決傳統醫療服務的問題和弊端,另一方面滿足傳統醫療服務未覆蓋到的市場需求。隨著便攜式、可穿戴健康監測智能終端的發展,院外隨訪數據收集和訪問通道將隨之打通,實現“全人、全程、全方位”移動健康服務[18],健康數據特別是終點數據實現自動采集,長期持續采集治療證據及療效證據也將不再困難。對于中醫等治療康復過程較長的學科來說,可解決臨床研究中證據采集及療效評估的難題,非常有助于循證醫學研究在中醫等領域的發展壯大。此外,通過智能手機 APP、可視眼鏡等數據瀏覽設備,醫生可隨時方便的獲取患者病史資料、監控院外患者生命體征變化和用藥情況,及時指導藥物使用,給予臨床診療建議。
4.5 建立數據使用規范,規避循證醫學研究應用大數據的風險
大數據的收集過程中,將不可避免的涉及到國民健康信息等國家基礎安全數據和公民隱私、商業秘密等不適宜公開的信息。因此,循證醫學研究應用大數據時,必須采取必要措施,規避相關法律和倫理風險。立法層面上,要明確大數據采集和使用的原則。行政層面上,需要國家相關部門制定大數據技術標準和運營規范,重視大數據及信息安全體系建設,加強對重點領域敏感數據的監管。技術層面上,重點是確保數據脫敏、物理隔離、授權使用。使用的數據是經過同態加密,清洗過的信息摘要類數據,并且數據附加時間戳,可進行溯源,采取授權方式保證數據難以篡改及永久溯源。通過各方面的積極努力,構建大數據收集和使用的良性生態環境,確保有序運用大數據開展循證醫學研究。
5 總結
大數據時代已經來臨,結合云計算和元數據標準的循證醫學研究,將極大拓展研究視角、提高研究效率。大數據時代帶來的海量數據以及更先進的互聯網技術使得構建循證醫學智能服務平臺,指導臨床決策的計算機決策支持證據系統不再停留在設想階段。大數據時代的循證醫學研究,更多的將是圍繞該平臺、系統開展工作,如何利用醫療大數據證據;如何使證據獲取、總結、加工更加自動、準確智能;如何結合證據及個體化數據產生個體化決策建議等。平臺、系統的建設需要一個長期的過程,不僅需要循證醫學方法學領域提供理論方法支持,互聯網大數據技術領域提供技術支持,還需要臨床醫生、衛生工作者實際去生產、共享基礎數據,并作為該系統的服務對象實際應用、體驗、改進該系統。未來平臺、系統的成功建立,將為個體化決策產生更精準更豐富的證據及決策建議,機器學習、人工智能可以簡化證據獲取的流程。需要指出的是,無論循證醫學研究如何發展,都必須“不忘初心”,技術不能取代人腦的決策工作,仍需要臨床醫生結合證據、臨床經驗與患者價值三者共同做出最終決策。