為了滿足海量的異構腫瘤臨床數據處理和腫瘤疾病的多中心協作診療需求,利用網格平臺建立腫瘤數據互聯系統(TDIS),實現虛擬化的腫瘤診斷服務平臺,實時共享并規范化管理腫瘤信息。該系統采用Globus Toolkit 4.0開發工具搭建開放式網格服務框架,基于Web服務資源框架(WSRF)封裝數據資源,利用中間件技術為異構數據交互提供統一的訪問接口,以虛擬化服務優化互聯交互過程并靈活查詢、調用腫瘤信息資源。針對海量異構腫瘤數據,采用聯邦存儲及多種授權模式的安全服務機制,實時監測及平衡負載。該系統可協同管理多中心的異構腫瘤數據,實現腫瘤患者數據的查詢、共享及分析,對比匹配典型病例庫或各服務節點的病例信息庫資源,協助醫生查閱相似病例資料并制定綜合的腫瘤治療方案,有效地提高腫瘤診治效率,并促進腫瘤協同診療模式的發展。
引用本文: 劉穎, 曹佳佶, 章浩偉, 張可. 基于網格平臺的腫瘤數據互聯系統設計. 生物醫學工程學雜志, 2016, 33(3): 473-480. doi: 10.7507/1001-5515.20160080 復制
引言
腫瘤信息的共享與統一的互聯管理是實現腫瘤疾病的協同治療與臨床診治工作的關鍵。但由于海量的腫瘤數據分布存放于不同醫療科室及機構,且以電子病歷文檔、醫技報告、病理切片、檢驗結果、影像數據等各類多維異構數據形式存儲,所以,集成、分析及互聯管理多維異構腫瘤數據信息已成為醫學信息領域的研究熱點及難點。
國內外在腫瘤信息系統管理上均嘗試了多種類的技術運用,其中基于網格環境的醫學信息系統技術已成為當今最新興的研究方向,國外研究已開發了一些利用網格技術的數字化醫療數據決策共享分析平臺,而國內相關系統卻不多見[1]。國外研究已致力于開發網格化腫瘤系統,如由美國賓夕法尼亞大學領導研發的計算網格項目“國家數字乳房X線照相檔案”(National Digital Mammography Archive,NDMA),借助計算網格工具分析分布式的海量信息,實現個別病例診斷與乳腺癌多發人群界定[2]。歐洲也先后建立了具有影響力的DataGrid數據網格計劃,項目開發了根據組織紋理信息對乳腺癌自動分類和識別的計算機輔助診斷工具,識別結果接近醫務人員的診斷,能在乳腺疾病的分類中起輔助作用[3]。當前國內的大型醫院已逐步完善建立了醫院信息管理系統(Hospital Information System,HIS)、影像歸檔和通信系統(Picture Archiving and Communication System,PACS)和放射信息系統(Radiology Information System,RIS)等醫療信息系統,但由于缺少統一的規劃,各系統均采用不同的技術,建立在不同操作平臺上的醫療信息系統之間不能進行診療資源共享和協同工作,形成了資源壁壘。國內也已開發諸多具有腫瘤專業特色的數據庫系統,如余江等建立的大腸癌專科數據庫,以及張仕義等建立的乳腺癌患者臨床資料數據庫[4],但由于此類系統收集的信息必須物理存放在某個中心數據庫,容易造成數據冗余、推廣范圍受限及維護難度較大等弊端。此外,專科腫瘤數據庫通常集中存儲于醫院內某個專科使用的病患資料信息化管理系統,無法進一步滿足區域內多中心協同診治平臺的要求,與國外的網格化醫療信息系統相比,仍存在較大差距。
本文構建的腫瘤數據互聯系統(Tumor Data Interacted System,TDIS)以網格平臺為依托[5],打破合作醫療單位之間醫院信息系統(HIS、RIS、PACS等)的各異性,實現醫院信息系統間的有效交互,消除不同信息系統間或者相同系統下不同版本間造成的信息互聯壁壘[6],屏蔽底層硬件及軟件環境和醫學數據自身的異構性,以期實現醫療單位間數據庫資源的遠程訪問及共享,進一步提高腫瘤的多中心協同治療的效率及質量[7],提供一個實時的腫瘤信息共享協作平臺并通過網格安全基礎設施[8],使授權醫護人員可隨時調用所需的病歷記錄及各種檢驗報告,確保病患可在轉診過程中得到完善、一致的醫療服務。最終,實現最大化的腫瘤信息資源共享和區域醫療協同診治,達到提升整體醫療服務水平和腫瘤診治效率的目標。
1 腫瘤數據互聯系統設計
針對具有跨科室、跨地域、跨平臺特點的多維異構腫瘤數據,構建TDIS以克服醫療信息系統在特定醫院環境的應用限制,打破獨立開發的系統間數據共享壁壘,實現腫瘤診治相關科室及醫療機構間腫瘤數據庫資源的互聯及共享,規范腫瘤患者的診斷流程,為醫生提供優化的輔助決策方案,推進協作式腫瘤診治模式的發展。
本文采用Globus Toolkit 4.0開發工具[9]搭建基于開放式網格服務框架(Open Grid Service Architecture,OGSA)標準的網格平臺,以Web服務資源框架(Web Services Resource Framework,WSRF)為網格服務規范[10],通過基于Web服務的接口提供數據資源并支持各類異構數據庫,整合TDIS內的腫瘤信息資源,聯合腫瘤專家、醫學信息系統以及軟件分析工具等,加速腫瘤數據的查詢與調用,實現多中心的腫瘤協作診治機制,包括社區首診、雙向轉診、專家會診等。較傳統的分布式數據系統而言,TDIS具有以下特點:
(1) 兼容性:集成來源于不同科室及醫院醫學信息系統的異構腫瘤數據,提供統一接口標準支持不同信息系統的應用,統一不同醫院間的臨床信息描述,為腫瘤診治構建統一的信息協作平臺,最大程度上發揮臨床信息共享及診療效率。
(2) 高性能:腫瘤數據量巨大,以電子病歷文檔、超聲報告、病理切片、檢驗結果、影像數據等各類多維異構數據形式存儲,包括結構化及非結構化的數據,TDIS通過網格中心與分布式的服務節點建立網狀結構的全局索引,并充分利用閑置狀態資源形成高性能的虛擬互聯系統,滿足海量數據、高傳輸性能的要求,提高實時數據訪問的效率和可靠度。
(3) 安全性:在構建一個無縫的互聯式腫瘤數據庫系統時,通過網格平臺范圍內合作醫療機構間的統一可信認證及相關醫生資質的身份驗證登錄,為動態用戶和醫療機構資源的變化、病患信息及隱私的保護,提供靈活的、不同級別的安全認證機制。
(4) 擴展性:系統在現有的功能模塊上具有靈活的可擴展性,為用戶提供更新功能的模塊,避免系統的重新開發和系統結構重構,不斷地根據臨床診治需求來完善系統功能。當新增的協作診療醫院加入TDIS時,為其分配邏輯位置接近的服務節點,可快速滿足動態網格資源的擴張。
1.1 腫瘤數據互聯系統的體系結構
TDIS系統可實現對分布于各醫院、各醫療信息系統的異構病患數據、腫瘤病例影像、腫瘤病理學分期庫等信息資源的交互與協作,為用戶提供病患腫瘤病歷記錄和醫技報告檢索,并提供基于特征匹配的相似病例檢索與臨床輔助診斷等功能以進一步完善腫瘤診療的規范控制。
TDIS以網格技術為依托,實現虛擬化服務平臺,本系統具有層次性的體系架構如圖 1所示。底層異構資源可分為硬件資源和軟件資源兩大類,包括計算機資源、存儲資源、網絡資源、醫療設備和人工資源等。其中,計算機資源、存儲資源、網絡資源為通用資源。醫療設備系統分布于不同醫療機構并存儲各類信息系統的腫瘤數據資料。人工資源是由具備豐富經驗的醫技專家、科室主任、臨床專家組成專家庫,以提供多中心的腫瘤診治方案及遠程協同指導。

在數據層中基于WSRF框架對網格平臺提供的資源描述進行資源封裝[11],生成資源屬性文檔,生成網絡服務描述語言(Web Services Description Language,WSDL)文檔,提供Web Services交互和操作接口,將醫療信息資源調用服務發布到服務目錄中,實現各類腫瘤數據的跨科室、跨醫院共享,為用戶提供目錄服務、資源調度服務、信息復制服務等,使得醫生可對患者的病歷記錄、化驗報告、影像數據和診斷結果等進行實時檢索及更新。
選用開放網格服務體系結構數據訪問和集成(Open Grid Service Architecture-Data Access and Integration,OGSA-DAI)為網格中間件[12],通過網格節點部署與管理服務調度、異構數據集成為海量醫學數據提供統一的服務接口,調用不同的Activity并加入到工作流中,為用戶屏蔽動態的異構底層資源。OGSA-DAI網格組件定義網格數據服務(Gird Data Service,GDS),為新增的數據庫資源定義對應的網格數據服務形成可擴展系統架構[13],執行工作流實現訪問數據層中不同醫療信息系統的數據資源(關系數據庫、XML數據庫、面向對象數據庫等)。
利用Java客戶端工具實現數據交互服務的應用層,醫生可以通過可視化的系統平臺隨時檢索腫瘤患者的腫瘤診療信息、影像報告,根據相似病例資料庫和腫瘤專家建議及系統提示的臨床輔助診斷,協助醫生在腫瘤診療規范下為病患提供更準確的診斷結果和高效的診療服務。
由于醫療信息屬于敏感、隱私的信息,在滿足合法用戶的需求下,系統靈活提供不同層次、不同級別的安全服務保障[14],主要分為角色驗證授權的單點登錄、網格安全基礎設施動態授權訪問機制、聯邦證書服務器的安全認證簽發等。根據醫生的身份提供相應的權限,實現授權訪問和認證的安全服務。
1.2 虛擬化服務的互聯交互
利用虛擬化服務以實現調用服務的優化、可控和有序的信息交互,使資源虛擬化[15],并建立跨越數據、系統等鴻溝的業務服務模型,通過中間件層的虛擬化機制靈活地查詢、調用具體的醫療信息資源。虛擬化服務互聯交互過程如圖 2所示:①用戶首先通過服務組注冊器查詢注冊的元數據信息;②同時向系統請求安全認證,訪問本地用戶集群檢索用戶權限并驗證。③當用戶身份認證通過后,定位并訪問符合要求的網格數據服務工廠。④請求訪問服務節點中的動態資源目錄。⑤定位檢索的目標數據庫,向用戶返回動態資源目錄的定位信息。⑥通過認證的用戶請求調用腫瘤病患相關的各類信息資料時,⑦創建一個網格數據服務檢索信息資源的分布和負載情況。⑧當本地服務器目錄滿足調用要求時,將調用請求調度給本地醫療信息系統的服務器;⑨當本地服務器目錄不能滿足調用要求時,調度程序從服務節點獲取存儲位置的目標數據庫信息及系統中各個服務器的負載情況[16]。最終向用戶返回查詢信息并完成互聯服務,使用戶如同在一個大型的“本地”虛擬化平臺中完成數據的查詢、調用、傳輸等操作,整個互聯交互過程中分流調用本地及服務節點中的資源,避免因就診量過大而造成系統超載,實時監控及平衡各服務器的負載。

2 腫瘤數據互聯系統的服務機制
2.1 腫瘤數據互聯系統的搭建
TDIS系統的建立是利用醫療機構現有的醫療信息基礎設施,通過網格協議規范將分布于不同科室、不同醫療機構上的各種資源互聯成為一個邏輯整體,有效提高醫療數據的集成性,形成一個大型的虛擬服務平臺,并實現在虛擬化服務下的資源共享和協同診治工作,促進腫瘤科、放療科、檢驗科、病理科、影像科等多學科腫瘤診療模式下臨床信息的一體化,為臨床專家提供遠程會診和科研交流的有效途徑。
2.1.1 多維異構腫瘤數據的存儲模式
針對多維異構腫瘤數據的海量且訪問量大的特點,TDIS系統采用聯邦存儲模式,將高調用頻率的醫療信息(如近期確診患者病歷信息、腫瘤疾病關鍵字、腫瘤數據分期字典等)備份存放于虛擬主機的數據中心,而將低調用頻率且數據容量大的數據(如醫學影像數據,長期備份醫療信息)仍分布存儲于各醫療機構的醫療機構服務節點,由虛擬主機提供全局查詢索引和定位信息。聯邦存儲模式融合了集中式和分布式存儲的優勢,提高信息調閱的效率,避免了高訪問期間的數據存儲堵塞和數據中心負載超荷運作,減緩了網絡帶寬的壓力,增強了系統的擴展性和靈活性。
TDIS采用聯邦存儲模式形成一種樹形和聯邦式分布相結合的拓撲結構,如圖 3所示。不同醫療機構的網格服務節點組成各自的服務域,與虛擬主機提供的中心節點和網格服務節點形成樹形邏輯結構,實行多領域資源管理。同時,同一節點域內的資源互聯形成網狀結構,有利于同域節點內的互相調用,減緩了中心節點的查詢、調用負擔,提高了數據檢索及傳輸的效率。

中心節點建立全局索引來管理域內各網格服務節點的服務器,實現各服務節點之間的相互訪問。當網格服務節點有序地加入或退出中心節點服務域時,中心節點相應新增或刪除索引,新加入的網格服務節點根據就近的服務節點分配邏輯位置。在此拓撲架構下,若某個網格服務節點在特殊情況下失效不會影響其他服務節點的運行,為系統提供了良好的穩定度。
2.1.2 安全服務機制
在異構腫瘤數據的聯邦存儲模式下,參與腫瘤診斷業務的合作醫療機構之間組成動態的協作平臺。為了確保數據互聯共享的安全通信,利用網格安全基礎設施,部署基于Web服務標準的單點登錄、信任委托和授權代理等多種授權模式,支持各服務層的安全訪問策略[17],在保護病患隱私和醫院知識產權的前提下,共享域間的信息和分析工具等資源。
由圖 3可見,TDIS的安全機制主要由本地認證服務器、合作醫療機構的醫學信息系統的數據資源、代理證書服務器及匹配聯邦存儲模式的聯邦證書服務器等組成。TDIS安全通信過程中:①當用戶需要查詢一位腫瘤病患的病歷資料時,使用所屬醫院為其注冊的用戶名及密碼通過本地認證服務器進行單點登錄;②用戶通過驗證委托后向代理證書服務器發送證書簽發請求,擁有可信任身份的用戶獲得代理證書認證;③此時,虛擬主機的中心節點將為用戶提供目標信息所在服務節點的網格服務器發送服務請求;④該網格服務器通過聯邦證書服務器驗證代理證書是否由可信合作機構安全委托;⑤通過聯邦證書服務器完成認證后,用戶最終可以訪問目標HIS系統數據庫的病歷資料,完成查詢及調用服務過程中的安全服務機制。
協同合作的醫院機構的本地認證服務器生成的證書簽發請求中包含代理的公鑰,代理證書服務器同意授權后使用自己的私有密鑰簽發代理證書。而聯邦證書服務器根據可信用戶列表同步管理各服務節點上代理證書服務器的CA證書授權中心,統一整個互聯系統的可信委托關系。網格安全構架通過驗證提供的身份證書是否由可信的CA簽發來認證用戶。聯邦認證服務可使持有與可信聯邦認證服務同步的其他CA機構簽發的可信證書的用戶訪問所有網格資源,實現全網格范圍內協作醫院不同醫學信息系統的安全認證及單點登錄,同時還實現了數量眾多的用戶證書的動態自動管理,根據最新的證書信息準確實施認證服務。系統管理員可根據醫生科室業務的需求分配角色權限,系統根據醫生的角色權限判斷用戶對訪問數據是否具有查詢及相關操作權限。如圖 4所示,當用戶完成驗證登錄系統后,系統根據用戶的角色權限跳轉不同的系統模塊并對數據庫實現相應的數據調用,不僅可提高用戶的工作效率,同時保護了病患隱私和醫療機構的知識產權。

當醫療機構間的合作關系發生變化,新加入或撤離醫院的代理證書服務器需及時更改授權信息,聯邦證書服務器同步更新與代理證書服務器間的委托關系。而醫生的轉職或離職,在醫院的本地認證服務器注銷和注冊用戶身份即可,無需進一步更改代理證書服務器和聯邦證書服務器,進一步體現了安全服務機制的動態性和可擴展性。如圖 5所示,當某新協作醫院A加入網格時,其代理認證服務器向聯邦證書服務器發送添加CA請求,聯邦證書服務器更新CA目錄并發送可信證書目錄的同步服務請求,通過證書目錄同步服務將更新的CA目錄信息傳送給另一家協作醫院的代理證書服務器B,完成CA目錄同步。如圖 6所示,當某協作醫院的代理證書服務器A簽發的用戶證書失效時,代理認證服務器A向聯邦證書服務器發送用戶證書失效消息,代理證書服務器更新CRL列表并啟動可信證書目錄同步服務請求,將更新的CRL列表信息發送到另一家醫院的代理證書服務器B,立即更新CRL列表信息。


此外,系統安全服務通過證書目錄同步服務實現本地認證服務器的最新可信證書目錄更新,如圖 7所示,醫院的代理證書服務器調用服務接口定期更新本地認證服務器的可信證書目錄,可依據網格實施環境的具體情況設置同步間隔時間。通過證書目錄同步服務,使得TDIS系統中任何一家醫院可根據本地代理證書服務器中已同步的可信CA目錄與CRL列表,實現全網格平臺內的安全認證。

2.1.3 動態調節的負載平衡設計
系統中設計并加入動態調節的負載平衡模塊,監測各個服務節點的負載情況,實時調節負載優化系統性能,有效地提高系統的可靠性和檢索效率。該負載平衡模塊由虛擬主機、醫學信息數據庫和服務節點三大部分組成。當用戶發送數據檢索、病患數據分析、相似病歷篩選等請求時,虛擬主機定時監測服務節點的負載信息,包括CPU占有率、進程數目、內存利用率等。當測定的負載量高于設定值時調低節點現有的調用頻率并不再接受新的網格任務請求,進而調用CPU和內存利用率最低的服務節點或進入屏保狀態的計算機等閑置資源。若收集節點的信息失敗時,及時記錄并報告壞節點所在位置。
2.2 腫瘤輔助治療模塊
TDIS系統為多學科腫瘤診治提供了以患者為中心的數據共享與協同管理模式,系統根據患者信息、病癥特性以及臨床診斷自動生成相似病歷查詢結果和輔助診斷報告,協助醫生制定最優化的治療方案。
腫瘤輔助治療模塊的功能流程如圖 8所示,醫生查詢某病患信息的臨床資料,請求系統自動生成診療方案。系統根據病癥檢驗數據及影像資料,快速匹配典型病例庫進行病例數據分析,并向各服務節點通過關鍵字及特征值提取醫學信息系統的病例信息庫檢索相似病例信息。系統調用臨床輔助診斷模塊結合病例數據分析結果和相似病例信息,對臨床化驗數據、腫瘤病理信息、影像特征值進行數據分析比對和特征相似度匹配,最終向用戶返回腫瘤疾病診斷結果,若確診為腫瘤患者則判定其腫瘤TNM分期,為醫生提供綜合的腫瘤診療方案,提高腫瘤疾病的診斷效率與準確度。

2.3 TDIS系統應用
國內現有的醫療信息數據庫系統的設計主要針對單一醫院、某科室或是某部門,但對于需要多專家和醫療資源支持的腫瘤診治,無法滿足海量的腫瘤病例匯總整理以及綜合、長期跟蹤治療的需求,本文建立基于網格技術的TDIS系統可有效整合分散于不同醫療機構的多維異構的腫瘤病患數據,為醫護人員提供所需的臨床資料,對分布存儲的海量數據實現交互與查詢。將腫瘤患者的臨床資料作為診斷依據,并結合腫瘤病理學分期庫、治療規范及健康指南匹配等自動生成綜合治療方案。在病患的治療過程中,實現電子醫學信息實時跟蹤,將腫瘤病患的多次治療資料通過病歷信息系統完成數據自動關聯,結合計算機輔助診斷系統進行疑似病例篩查,提醒醫生對病患的綜合治療方案進行調整,更新調整后的綜合治療方案,并存入資料庫便于后期使用。
TDIS系統在上海市市東醫院腫瘤診治中心的乳腺外科試運行以來,通過安全服務策略確保訪問用戶的可靠性,用戶登錄TDIS系統的界面如圖 9所示。建立TDIS系統為醫院提供了協同管理的多中心腫瘤診治平臺,協助醫生確診乳腺癌患者,明確腫瘤分期情況,并制定出共同認可的乳腺癌治療指南實施細則。系統根據患者病歷、臨床依據、病理信息進行對比分析,自動化制定綜合的腫瘤診療方案。醫生根據實際病患情況選擇性執行診療方案,如遇特殊病征可調用專家庫資料,申請雙向轉診、專家遠程會診。在整體治療過程中,向診療協作組實時反饋腫瘤患者數據,并在系統中更新及同步共享。

TDIS系統為多中心協作組提供了互聯診療、科研統計、專家討論的腫瘤診治及研究平臺,已錄入近年來腫瘤病患7 921例,分析并整理具備腫瘤科研價值的病例327例,系統根據TNM、國際婦產科協會(Federation International of Gynecology and Obstetrics,FIGO)、世界衛生組織(World Health Organization,WHO)等多項腫瘤分期指標實現自動化分期判定,實現了腫瘤分期的自動計算與轉換,為腫瘤疾病規范化診療、協作式診斷及科研臨床研究提供可靠的數據資料,輔助診療過程中的腫瘤分期功能界面如圖 10所示。TDIS系統可有效地提高腫瘤診斷準確率和診療效率,促進腫瘤協同診療模式的發展,并提高治療規范率及患者的生存率和滿意度。

在接下來的研究工作中,TDIS系統將進一步整合網格平臺內腫瘤疾病的多樣本數據,包括腫瘤病理學信息、DNA和RNA數據、蛋白質表達水平及以患者為對象的臨床試驗數據,通過TDIS對數據在語法、語義的一致性與互操作的支持及元數據服務,實現多樣本臨床數據在網格平臺內資源共享;并通過部署的安全機制對新增的分布式存儲數據實現安全訪問策略。此外,進一步提升TDIS系統對現有各種醫療輔助軟件、工具的關聯集成,為醫療科研機構提供更完善的一體化腫瘤信息平臺。
3 總結
基于網格技術構建的TDIS系統,利用Globus Toolkit 4.0開發工具搭建開放式網格服務框架,充分利用現有醫療信息資源互聯集成至一體化信息平臺,有效整合分散于不同醫療機構的多維異構腫瘤信息,通過WSRF框架封裝數據資源及中間件技術為異構數據提供統一訪問標準,以實現虛擬化服務的信息交互,為腫瘤數據的互聯共享提供支持。對于聯邦存儲模式的異構數據,部署網格安全基礎設施提供多種授權模式的安全服務機制,并實時調節各服務節點負載,有效提高系統的安全性和可靠性。TDIS系統在數據共享與協同管理模式的基礎上,實現腫瘤患者數據的篩選、分析及挖掘,快速檢索并分析比對典型病例庫和各服務節點的病例信息庫資源,為用戶提供綜合的腫瘤診療方案。TDIS系統的建立不僅能夠促進跨平臺、跨科室腫瘤數據的有效利用,實現腫瘤疾病的多中心協作診療,而且為腫瘤疾病的遠程會診、醫療設備及腫瘤專家等資源的共享與調用奠定了基礎。
引言
腫瘤信息的共享與統一的互聯管理是實現腫瘤疾病的協同治療與臨床診治工作的關鍵。但由于海量的腫瘤數據分布存放于不同醫療科室及機構,且以電子病歷文檔、醫技報告、病理切片、檢驗結果、影像數據等各類多維異構數據形式存儲,所以,集成、分析及互聯管理多維異構腫瘤數據信息已成為醫學信息領域的研究熱點及難點。
國內外在腫瘤信息系統管理上均嘗試了多種類的技術運用,其中基于網格環境的醫學信息系統技術已成為當今最新興的研究方向,國外研究已開發了一些利用網格技術的數字化醫療數據決策共享分析平臺,而國內相關系統卻不多見[1]。國外研究已致力于開發網格化腫瘤系統,如由美國賓夕法尼亞大學領導研發的計算網格項目“國家數字乳房X線照相檔案”(National Digital Mammography Archive,NDMA),借助計算網格工具分析分布式的海量信息,實現個別病例診斷與乳腺癌多發人群界定[2]。歐洲也先后建立了具有影響力的DataGrid數據網格計劃,項目開發了根據組織紋理信息對乳腺癌自動分類和識別的計算機輔助診斷工具,識別結果接近醫務人員的診斷,能在乳腺疾病的分類中起輔助作用[3]。當前國內的大型醫院已逐步完善建立了醫院信息管理系統(Hospital Information System,HIS)、影像歸檔和通信系統(Picture Archiving and Communication System,PACS)和放射信息系統(Radiology Information System,RIS)等醫療信息系統,但由于缺少統一的規劃,各系統均采用不同的技術,建立在不同操作平臺上的醫療信息系統之間不能進行診療資源共享和協同工作,形成了資源壁壘。國內也已開發諸多具有腫瘤專業特色的數據庫系統,如余江等建立的大腸癌專科數據庫,以及張仕義等建立的乳腺癌患者臨床資料數據庫[4],但由于此類系統收集的信息必須物理存放在某個中心數據庫,容易造成數據冗余、推廣范圍受限及維護難度較大等弊端。此外,專科腫瘤數據庫通常集中存儲于醫院內某個專科使用的病患資料信息化管理系統,無法進一步滿足區域內多中心協同診治平臺的要求,與國外的網格化醫療信息系統相比,仍存在較大差距。
本文構建的腫瘤數據互聯系統(Tumor Data Interacted System,TDIS)以網格平臺為依托[5],打破合作醫療單位之間醫院信息系統(HIS、RIS、PACS等)的各異性,實現醫院信息系統間的有效交互,消除不同信息系統間或者相同系統下不同版本間造成的信息互聯壁壘[6],屏蔽底層硬件及軟件環境和醫學數據自身的異構性,以期實現醫療單位間數據庫資源的遠程訪問及共享,進一步提高腫瘤的多中心協同治療的效率及質量[7],提供一個實時的腫瘤信息共享協作平臺并通過網格安全基礎設施[8],使授權醫護人員可隨時調用所需的病歷記錄及各種檢驗報告,確保病患可在轉診過程中得到完善、一致的醫療服務。最終,實現最大化的腫瘤信息資源共享和區域醫療協同診治,達到提升整體醫療服務水平和腫瘤診治效率的目標。
1 腫瘤數據互聯系統設計
針對具有跨科室、跨地域、跨平臺特點的多維異構腫瘤數據,構建TDIS以克服醫療信息系統在特定醫院環境的應用限制,打破獨立開發的系統間數據共享壁壘,實現腫瘤診治相關科室及醫療機構間腫瘤數據庫資源的互聯及共享,規范腫瘤患者的診斷流程,為醫生提供優化的輔助決策方案,推進協作式腫瘤診治模式的發展。
本文采用Globus Toolkit 4.0開發工具[9]搭建基于開放式網格服務框架(Open Grid Service Architecture,OGSA)標準的網格平臺,以Web服務資源框架(Web Services Resource Framework,WSRF)為網格服務規范[10],通過基于Web服務的接口提供數據資源并支持各類異構數據庫,整合TDIS內的腫瘤信息資源,聯合腫瘤專家、醫學信息系統以及軟件分析工具等,加速腫瘤數據的查詢與調用,實現多中心的腫瘤協作診治機制,包括社區首診、雙向轉診、專家會診等。較傳統的分布式數據系統而言,TDIS具有以下特點:
(1) 兼容性:集成來源于不同科室及醫院醫學信息系統的異構腫瘤數據,提供統一接口標準支持不同信息系統的應用,統一不同醫院間的臨床信息描述,為腫瘤診治構建統一的信息協作平臺,最大程度上發揮臨床信息共享及診療效率。
(2) 高性能:腫瘤數據量巨大,以電子病歷文檔、超聲報告、病理切片、檢驗結果、影像數據等各類多維異構數據形式存儲,包括結構化及非結構化的數據,TDIS通過網格中心與分布式的服務節點建立網狀結構的全局索引,并充分利用閑置狀態資源形成高性能的虛擬互聯系統,滿足海量數據、高傳輸性能的要求,提高實時數據訪問的效率和可靠度。
(3) 安全性:在構建一個無縫的互聯式腫瘤數據庫系統時,通過網格平臺范圍內合作醫療機構間的統一可信認證及相關醫生資質的身份驗證登錄,為動態用戶和醫療機構資源的變化、病患信息及隱私的保護,提供靈活的、不同級別的安全認證機制。
(4) 擴展性:系統在現有的功能模塊上具有靈活的可擴展性,為用戶提供更新功能的模塊,避免系統的重新開發和系統結構重構,不斷地根據臨床診治需求來完善系統功能。當新增的協作診療醫院加入TDIS時,為其分配邏輯位置接近的服務節點,可快速滿足動態網格資源的擴張。
1.1 腫瘤數據互聯系統的體系結構
TDIS系統可實現對分布于各醫院、各醫療信息系統的異構病患數據、腫瘤病例影像、腫瘤病理學分期庫等信息資源的交互與協作,為用戶提供病患腫瘤病歷記錄和醫技報告檢索,并提供基于特征匹配的相似病例檢索與臨床輔助診斷等功能以進一步完善腫瘤診療的規范控制。
TDIS以網格技術為依托,實現虛擬化服務平臺,本系統具有層次性的體系架構如圖 1所示。底層異構資源可分為硬件資源和軟件資源兩大類,包括計算機資源、存儲資源、網絡資源、醫療設備和人工資源等。其中,計算機資源、存儲資源、網絡資源為通用資源。醫療設備系統分布于不同醫療機構并存儲各類信息系統的腫瘤數據資料。人工資源是由具備豐富經驗的醫技專家、科室主任、臨床專家組成專家庫,以提供多中心的腫瘤診治方案及遠程協同指導。

在數據層中基于WSRF框架對網格平臺提供的資源描述進行資源封裝[11],生成資源屬性文檔,生成網絡服務描述語言(Web Services Description Language,WSDL)文檔,提供Web Services交互和操作接口,將醫療信息資源調用服務發布到服務目錄中,實現各類腫瘤數據的跨科室、跨醫院共享,為用戶提供目錄服務、資源調度服務、信息復制服務等,使得醫生可對患者的病歷記錄、化驗報告、影像數據和診斷結果等進行實時檢索及更新。
選用開放網格服務體系結構數據訪問和集成(Open Grid Service Architecture-Data Access and Integration,OGSA-DAI)為網格中間件[12],通過網格節點部署與管理服務調度、異構數據集成為海量醫學數據提供統一的服務接口,調用不同的Activity并加入到工作流中,為用戶屏蔽動態的異構底層資源。OGSA-DAI網格組件定義網格數據服務(Gird Data Service,GDS),為新增的數據庫資源定義對應的網格數據服務形成可擴展系統架構[13],執行工作流實現訪問數據層中不同醫療信息系統的數據資源(關系數據庫、XML數據庫、面向對象數據庫等)。
利用Java客戶端工具實現數據交互服務的應用層,醫生可以通過可視化的系統平臺隨時檢索腫瘤患者的腫瘤診療信息、影像報告,根據相似病例資料庫和腫瘤專家建議及系統提示的臨床輔助診斷,協助醫生在腫瘤診療規范下為病患提供更準確的診斷結果和高效的診療服務。
由于醫療信息屬于敏感、隱私的信息,在滿足合法用戶的需求下,系統靈活提供不同層次、不同級別的安全服務保障[14],主要分為角色驗證授權的單點登錄、網格安全基礎設施動態授權訪問機制、聯邦證書服務器的安全認證簽發等。根據醫生的身份提供相應的權限,實現授權訪問和認證的安全服務。
1.2 虛擬化服務的互聯交互
利用虛擬化服務以實現調用服務的優化、可控和有序的信息交互,使資源虛擬化[15],并建立跨越數據、系統等鴻溝的業務服務模型,通過中間件層的虛擬化機制靈活地查詢、調用具體的醫療信息資源。虛擬化服務互聯交互過程如圖 2所示:①用戶首先通過服務組注冊器查詢注冊的元數據信息;②同時向系統請求安全認證,訪問本地用戶集群檢索用戶權限并驗證。③當用戶身份認證通過后,定位并訪問符合要求的網格數據服務工廠。④請求訪問服務節點中的動態資源目錄。⑤定位檢索的目標數據庫,向用戶返回動態資源目錄的定位信息。⑥通過認證的用戶請求調用腫瘤病患相關的各類信息資料時,⑦創建一個網格數據服務檢索信息資源的分布和負載情況。⑧當本地服務器目錄滿足調用要求時,將調用請求調度給本地醫療信息系統的服務器;⑨當本地服務器目錄不能滿足調用要求時,調度程序從服務節點獲取存儲位置的目標數據庫信息及系統中各個服務器的負載情況[16]。最終向用戶返回查詢信息并完成互聯服務,使用戶如同在一個大型的“本地”虛擬化平臺中完成數據的查詢、調用、傳輸等操作,整個互聯交互過程中分流調用本地及服務節點中的資源,避免因就診量過大而造成系統超載,實時監控及平衡各服務器的負載。

2 腫瘤數據互聯系統的服務機制
2.1 腫瘤數據互聯系統的搭建
TDIS系統的建立是利用醫療機構現有的醫療信息基礎設施,通過網格協議規范將分布于不同科室、不同醫療機構上的各種資源互聯成為一個邏輯整體,有效提高醫療數據的集成性,形成一個大型的虛擬服務平臺,并實現在虛擬化服務下的資源共享和協同診治工作,促進腫瘤科、放療科、檢驗科、病理科、影像科等多學科腫瘤診療模式下臨床信息的一體化,為臨床專家提供遠程會診和科研交流的有效途徑。
2.1.1 多維異構腫瘤數據的存儲模式
針對多維異構腫瘤數據的海量且訪問量大的特點,TDIS系統采用聯邦存儲模式,將高調用頻率的醫療信息(如近期確診患者病歷信息、腫瘤疾病關鍵字、腫瘤數據分期字典等)備份存放于虛擬主機的數據中心,而將低調用頻率且數據容量大的數據(如醫學影像數據,長期備份醫療信息)仍分布存儲于各醫療機構的醫療機構服務節點,由虛擬主機提供全局查詢索引和定位信息。聯邦存儲模式融合了集中式和分布式存儲的優勢,提高信息調閱的效率,避免了高訪問期間的數據存儲堵塞和數據中心負載超荷運作,減緩了網絡帶寬的壓力,增強了系統的擴展性和靈活性。
TDIS采用聯邦存儲模式形成一種樹形和聯邦式分布相結合的拓撲結構,如圖 3所示。不同醫療機構的網格服務節點組成各自的服務域,與虛擬主機提供的中心節點和網格服務節點形成樹形邏輯結構,實行多領域資源管理。同時,同一節點域內的資源互聯形成網狀結構,有利于同域節點內的互相調用,減緩了中心節點的查詢、調用負擔,提高了數據檢索及傳輸的效率。

中心節點建立全局索引來管理域內各網格服務節點的服務器,實現各服務節點之間的相互訪問。當網格服務節點有序地加入或退出中心節點服務域時,中心節點相應新增或刪除索引,新加入的網格服務節點根據就近的服務節點分配邏輯位置。在此拓撲架構下,若某個網格服務節點在特殊情況下失效不會影響其他服務節點的運行,為系統提供了良好的穩定度。
2.1.2 安全服務機制
在異構腫瘤數據的聯邦存儲模式下,參與腫瘤診斷業務的合作醫療機構之間組成動態的協作平臺。為了確保數據互聯共享的安全通信,利用網格安全基礎設施,部署基于Web服務標準的單點登錄、信任委托和授權代理等多種授權模式,支持各服務層的安全訪問策略[17],在保護病患隱私和醫院知識產權的前提下,共享域間的信息和分析工具等資源。
由圖 3可見,TDIS的安全機制主要由本地認證服務器、合作醫療機構的醫學信息系統的數據資源、代理證書服務器及匹配聯邦存儲模式的聯邦證書服務器等組成。TDIS安全通信過程中:①當用戶需要查詢一位腫瘤病患的病歷資料時,使用所屬醫院為其注冊的用戶名及密碼通過本地認證服務器進行單點登錄;②用戶通過驗證委托后向代理證書服務器發送證書簽發請求,擁有可信任身份的用戶獲得代理證書認證;③此時,虛擬主機的中心節點將為用戶提供目標信息所在服務節點的網格服務器發送服務請求;④該網格服務器通過聯邦證書服務器驗證代理證書是否由可信合作機構安全委托;⑤通過聯邦證書服務器完成認證后,用戶最終可以訪問目標HIS系統數據庫的病歷資料,完成查詢及調用服務過程中的安全服務機制。
協同合作的醫院機構的本地認證服務器生成的證書簽發請求中包含代理的公鑰,代理證書服務器同意授權后使用自己的私有密鑰簽發代理證書。而聯邦證書服務器根據可信用戶列表同步管理各服務節點上代理證書服務器的CA證書授權中心,統一整個互聯系統的可信委托關系。網格安全構架通過驗證提供的身份證書是否由可信的CA簽發來認證用戶。聯邦認證服務可使持有與可信聯邦認證服務同步的其他CA機構簽發的可信證書的用戶訪問所有網格資源,實現全網格范圍內協作醫院不同醫學信息系統的安全認證及單點登錄,同時還實現了數量眾多的用戶證書的動態自動管理,根據最新的證書信息準確實施認證服務。系統管理員可根據醫生科室業務的需求分配角色權限,系統根據醫生的角色權限判斷用戶對訪問數據是否具有查詢及相關操作權限。如圖 4所示,當用戶完成驗證登錄系統后,系統根據用戶的角色權限跳轉不同的系統模塊并對數據庫實現相應的數據調用,不僅可提高用戶的工作效率,同時保護了病患隱私和醫療機構的知識產權。

當醫療機構間的合作關系發生變化,新加入或撤離醫院的代理證書服務器需及時更改授權信息,聯邦證書服務器同步更新與代理證書服務器間的委托關系。而醫生的轉職或離職,在醫院的本地認證服務器注銷和注冊用戶身份即可,無需進一步更改代理證書服務器和聯邦證書服務器,進一步體現了安全服務機制的動態性和可擴展性。如圖 5所示,當某新協作醫院A加入網格時,其代理認證服務器向聯邦證書服務器發送添加CA請求,聯邦證書服務器更新CA目錄并發送可信證書目錄的同步服務請求,通過證書目錄同步服務將更新的CA目錄信息傳送給另一家協作醫院的代理證書服務器B,完成CA目錄同步。如圖 6所示,當某協作醫院的代理證書服務器A簽發的用戶證書失效時,代理認證服務器A向聯邦證書服務器發送用戶證書失效消息,代理證書服務器更新CRL列表并啟動可信證書目錄同步服務請求,將更新的CRL列表信息發送到另一家醫院的代理證書服務器B,立即更新CRL列表信息。


此外,系統安全服務通過證書目錄同步服務實現本地認證服務器的最新可信證書目錄更新,如圖 7所示,醫院的代理證書服務器調用服務接口定期更新本地認證服務器的可信證書目錄,可依據網格實施環境的具體情況設置同步間隔時間。通過證書目錄同步服務,使得TDIS系統中任何一家醫院可根據本地代理證書服務器中已同步的可信CA目錄與CRL列表,實現全網格平臺內的安全認證。

2.1.3 動態調節的負載平衡設計
系統中設計并加入動態調節的負載平衡模塊,監測各個服務節點的負載情況,實時調節負載優化系統性能,有效地提高系統的可靠性和檢索效率。該負載平衡模塊由虛擬主機、醫學信息數據庫和服務節點三大部分組成。當用戶發送數據檢索、病患數據分析、相似病歷篩選等請求時,虛擬主機定時監測服務節點的負載信息,包括CPU占有率、進程數目、內存利用率等。當測定的負載量高于設定值時調低節點現有的調用頻率并不再接受新的網格任務請求,進而調用CPU和內存利用率最低的服務節點或進入屏保狀態的計算機等閑置資源。若收集節點的信息失敗時,及時記錄并報告壞節點所在位置。
2.2 腫瘤輔助治療模塊
TDIS系統為多學科腫瘤診治提供了以患者為中心的數據共享與協同管理模式,系統根據患者信息、病癥特性以及臨床診斷自動生成相似病歷查詢結果和輔助診斷報告,協助醫生制定最優化的治療方案。
腫瘤輔助治療模塊的功能流程如圖 8所示,醫生查詢某病患信息的臨床資料,請求系統自動生成診療方案。系統根據病癥檢驗數據及影像資料,快速匹配典型病例庫進行病例數據分析,并向各服務節點通過關鍵字及特征值提取醫學信息系統的病例信息庫檢索相似病例信息。系統調用臨床輔助診斷模塊結合病例數據分析結果和相似病例信息,對臨床化驗數據、腫瘤病理信息、影像特征值進行數據分析比對和特征相似度匹配,最終向用戶返回腫瘤疾病診斷結果,若確診為腫瘤患者則判定其腫瘤TNM分期,為醫生提供綜合的腫瘤診療方案,提高腫瘤疾病的診斷效率與準確度。

2.3 TDIS系統應用
國內現有的醫療信息數據庫系統的設計主要針對單一醫院、某科室或是某部門,但對于需要多專家和醫療資源支持的腫瘤診治,無法滿足海量的腫瘤病例匯總整理以及綜合、長期跟蹤治療的需求,本文建立基于網格技術的TDIS系統可有效整合分散于不同醫療機構的多維異構的腫瘤病患數據,為醫護人員提供所需的臨床資料,對分布存儲的海量數據實現交互與查詢。將腫瘤患者的臨床資料作為診斷依據,并結合腫瘤病理學分期庫、治療規范及健康指南匹配等自動生成綜合治療方案。在病患的治療過程中,實現電子醫學信息實時跟蹤,將腫瘤病患的多次治療資料通過病歷信息系統完成數據自動關聯,結合計算機輔助診斷系統進行疑似病例篩查,提醒醫生對病患的綜合治療方案進行調整,更新調整后的綜合治療方案,并存入資料庫便于后期使用。
TDIS系統在上海市市東醫院腫瘤診治中心的乳腺外科試運行以來,通過安全服務策略確保訪問用戶的可靠性,用戶登錄TDIS系統的界面如圖 9所示。建立TDIS系統為醫院提供了協同管理的多中心腫瘤診治平臺,協助醫生確診乳腺癌患者,明確腫瘤分期情況,并制定出共同認可的乳腺癌治療指南實施細則。系統根據患者病歷、臨床依據、病理信息進行對比分析,自動化制定綜合的腫瘤診療方案。醫生根據實際病患情況選擇性執行診療方案,如遇特殊病征可調用專家庫資料,申請雙向轉診、專家遠程會診。在整體治療過程中,向診療協作組實時反饋腫瘤患者數據,并在系統中更新及同步共享。

TDIS系統為多中心協作組提供了互聯診療、科研統計、專家討論的腫瘤診治及研究平臺,已錄入近年來腫瘤病患7 921例,分析并整理具備腫瘤科研價值的病例327例,系統根據TNM、國際婦產科協會(Federation International of Gynecology and Obstetrics,FIGO)、世界衛生組織(World Health Organization,WHO)等多項腫瘤分期指標實現自動化分期判定,實現了腫瘤分期的自動計算與轉換,為腫瘤疾病規范化診療、協作式診斷及科研臨床研究提供可靠的數據資料,輔助診療過程中的腫瘤分期功能界面如圖 10所示。TDIS系統可有效地提高腫瘤診斷準確率和診療效率,促進腫瘤協同診療模式的發展,并提高治療規范率及患者的生存率和滿意度。

在接下來的研究工作中,TDIS系統將進一步整合網格平臺內腫瘤疾病的多樣本數據,包括腫瘤病理學信息、DNA和RNA數據、蛋白質表達水平及以患者為對象的臨床試驗數據,通過TDIS對數據在語法、語義的一致性與互操作的支持及元數據服務,實現多樣本臨床數據在網格平臺內資源共享;并通過部署的安全機制對新增的分布式存儲數據實現安全訪問策略。此外,進一步提升TDIS系統對現有各種醫療輔助軟件、工具的關聯集成,為醫療科研機構提供更完善的一體化腫瘤信息平臺。
3 總結
基于網格技術構建的TDIS系統,利用Globus Toolkit 4.0開發工具搭建開放式網格服務框架,充分利用現有醫療信息資源互聯集成至一體化信息平臺,有效整合分散于不同醫療機構的多維異構腫瘤信息,通過WSRF框架封裝數據資源及中間件技術為異構數據提供統一訪問標準,以實現虛擬化服務的信息交互,為腫瘤數據的互聯共享提供支持。對于聯邦存儲模式的異構數據,部署網格安全基礎設施提供多種授權模式的安全服務機制,并實時調節各服務節點負載,有效提高系統的安全性和可靠性。TDIS系統在數據共享與協同管理模式的基礎上,實現腫瘤患者數據的篩選、分析及挖掘,快速檢索并分析比對典型病例庫和各服務節點的病例信息庫資源,為用戶提供綜合的腫瘤診療方案。TDIS系統的建立不僅能夠促進跨平臺、跨科室腫瘤數據的有效利用,實現腫瘤疾病的多中心協作診療,而且為腫瘤疾病的遠程會診、醫療設備及腫瘤專家等資源的共享與調用奠定了基礎。