為快速了解新型冠狀病毒肺炎診斷和治療方法的演化情況及其規律,為醫務人員在實際診療中提供便利,本文以 2020-01-16 至 2020-08-19 期間國家衛生健康委員會相繼發布的 9 版新型冠狀病毒肺炎診療方案文本為研究數據,借助文本挖掘相關方法對新型冠狀病毒肺炎診療方案整體及相同模塊進行表示及相似度度量,并對其進行對比性分析與可視化分析,得到不同版本診療方案整體及相應模塊的文本相似度,歸納總結其演化規律,為臨床診療實踐及其他診療方案的制定提供參考。
引用本文: 郭崇慧, 徐良辰, 魏偉, 陳靜鋒. 基于文本挖掘的新型冠狀病毒肺炎診療方案演化分析. 生物醫學工程學雜志, 2021, 38(2): 197-209. doi: 10.7507/1001-5515.202011079 復制
引言
2019 年 12 月在湖北省武漢市首次報道了新型冠狀病毒肺炎(corona virus disease 2019,COVID-19)病例。新型冠狀病毒肺炎是指新型冠狀病毒(2019-nCoV)感染導致的肺炎,患病后以血管緊張素轉化酶域作為受體侵入細胞導致肺損傷。新型冠狀病毒肺炎傳染性強,重癥患者會出現急性呼吸窘迫綜合征和感染性休克,最終出現多器官功能衰竭[1]。隨著疫情的全球蔓延,世界衛生組織于 2020 年 1 月 31 日將新型冠狀病毒肺炎疫情列為突發公共衛生事件,引起了廣泛關注[2],相關的臨床研究迅速展開[3-4]。為有效抑制疫情的發展,指導全國科學規范地做好新型冠狀病毒肺炎病例診斷和醫療救治工作,2020 年 1 月 16 日至 2020 年 8 月 19 日,國家衛生健康委員會相繼發布了 9 版新型冠狀病毒肺炎診療方案,具體包括 1 月 16 日的第一版(V1)、1 月 18 日的第二版(V2)、1 月 22 日的第三版(V3)、1 月 27 日的第四版(V4)、2 月 4 日的第五版(V5)、2 月 8 日的第五版修訂版(V5_1)、2 月 19 日的第六版(V6)、3 月 4 日的第七版(V7)和 8 月 19 日的第八版(V8)[5]。
新型冠狀病毒肺炎診療方案的完善過程是人們對新型冠狀病毒認識不斷加深的體現,也是人們對新型冠狀病毒肺炎的診斷和治療方法的研究更科學、更高效、更深入的體現。分析新型冠狀病毒肺炎診療方案的演化可以總結新型冠狀病毒肺炎診療經驗,將有助于促進新型冠狀病毒肺炎醫療救治工作。當前國內疫情雖得到有效的控制,但是國外疫情形勢不容樂觀,對我國新型冠狀病毒肺炎診療方案演化的分析也可為全球抗擊疫情提供參考。
眾多研究者對診療方案的不同方面展開精細化研究。如車坷科等[6]從臨床藥學角度對最新診療方案中所涉及的抗病毒藥物進行回顧分析,并提出藥學監護的重點。趙建平[7]在《新型冠狀病毒肺炎診療方案(試行第六版)》及《“新型冠狀病毒感染的肺炎”重型及危重型診療方案(試行第一版)》的基礎上,對重癥及危重癥患者的診斷標準、臨床預警指標、診療流程及護理方案等進行了詳細的闡述。丁寧等[8]從疫情暴發地定點醫院的視角對新型冠狀病毒肺炎的防治實踐進行分析,并給出相關建議。蔣倩等[9]基于循證醫學視角對新型冠狀病毒肺炎的診療方案進行比較。同時,關于診療方案中醫治療的研究較多[10-11]。楊晨等[12]、李凌濤等[13]以及李思聰等[14]基于新型冠狀病毒肺炎診療方案對中成藥的合理使用、藥學監護、選用依據等進行了探討。宋斌[15]基于診療方案從中醫分期與西醫分型基本情況、分離現狀、原因分析及其不利影響等方面進行探討。任偉鈺等[16]對新型冠狀病毒肺炎的中醫藥用藥方案進行系統分析,為中藥處方治療的合理性提供參考。于明坤等[17]對中醫診療方案進行匯總分析,得出不同診療方案的異同,同時指出中醫在新型冠狀病毒肺炎防治過程中的積極參與、中醫治療的整體觀念及同病異治的理念。已有的診療方案分析大多基于特定版本或者特定部分,以人工總結、定性分析為主,可能導致分析不全面和不細致。
目前,文本挖掘的理論與技術發展迅速,為文本分析挖掘提供了強有力的支持。基于文本挖掘的新型冠狀病毒肺炎診療方案的分析融合了定量方法,更加快速和全面,為新型冠狀病毒肺炎診療方案演化的研究提供新的思路。文本挖掘于 1995 年 Feldman 等[18]首次提出以來,已被廣泛運用到各個領域[19-20],并展現了巨大的優勢和作用[21]。張寶建等[22]基于文本挖掘對國家科技創新政策的主題分析與演化過程進行研究,根據挖掘結果凝練出政策演化規律。吳江等[23]基于文本挖掘技術對在線醫療健康研究的研究熱點、主題演化等內容進行研究,基于關鍵詞的聚類分析,分析出文獻的主題分布和演化。魏偉等[24]基于文本挖掘技術對歷年國務院政府工作報告進行多粒度、多層次的綜合定量分析,探討了報告中的共性問題、熱點問題及其演化規律。多領域學者基于領域文本數據及文本挖掘技術對領域問題演化進行了探討。蒲曉蓉等[25]通過對文本主題進行無監督學習,實現新型冠狀病毒肺炎診療方案的計算機自動智能解讀。已有研究顯示基于文本挖掘的演化分析已被應用到多個領域并取得較好結果,證明了采用文本挖掘分析新型冠狀病毒肺炎診療方案演化的可行性。
本文將在已有研究的基礎上,基于新型冠狀病毒肺炎診療方案文本數據,借助文本挖掘相關理論方法,對新型冠狀病毒肺炎診療方案的演化進行歸納分析,以期為新型冠狀病毒肺炎的診療提供參考。
1 研究方法
1.1 研究框架
新型冠狀病毒肺炎診療方案模塊化程度高,每個版本的診療方案主要包括 11 個部分,即病原學特點、流行病學特點、臨床特點、診斷標準、臨床分型、鑒別診斷、病例的發現與報告、治療、解除隔離和出院后注意事項、轉運原則以及醫療機構內感染預防與控制。據此,本文擬對 9 版新型冠狀病毒肺炎診療方案整體及相應模塊的演化進行分析,整體研究框架如圖 1 所示。

1.2 研究數據選取
本文選取 2020 年 1 月 16 日至 2020 年 8 月 19 日期間國家衛生健康委員會相繼發布的 9 版新型冠狀病毒肺炎診療方案作為基礎研究數據,通過對相關模塊的提取,形成整體文本和分模塊文本,構成本文的研究數據。
1.3 文本預處理
文本預處理作為自然語言處理的重要過程,可以減少文本中的噪聲,有助于提高最終挖掘結果。文本預處理過程主要包括文本分詞技術、新詞發現技術等,文本預處理后續階段主要包括詞性篩選(本文主要選取名詞、具有名詞功能的動詞、具有名詞功能的形容詞、動詞性慣用語)和去停用詞等操作[24]。
1.3.1 基于信息熵的文本分詞
本文主要借助中科院開發的 ICTCLAS 分詞工具進行分詞操作[26]。由于該工具為通用分詞工具,不能夠保留較長的語義單元短語,提供的分詞結果以較短詞語為主,一定程度上破壞了原始語義結構。本文在 ICTCLAS 分詞工具基礎之上,基于信息熵并人機結合進行分詞。首先基于新詞發現和人工構建初步的領域詞典,對診療方案進行初步分詞,然后基于信息熵的方法對分詞結果進行合并處理。兩詞合并需要滿足相鄰和頻繁共線兩個條件,計算方法如下:
![]() |
其中, 表示詞
在文檔中出現的頻率,
表示詞
和詞
在文檔中連續出現的頻率。
當 滿足一定閾值(本文為 0.5),將該兩詞進行合并得到較長的語義單元短語,再經過人工篩選后添加到領域詞典中對原文檔進行進一步分詞,循環多次,直至穩定。
1.3.2 詞性篩選
由于診療方案是文件類型材料,名詞更能代表原文檔的語義信息。在分詞結果基礎之上,本文選擇名詞或與名詞相近的詞(如具有名詞功能的動詞等)作為研究對象。
1.3.3 去停用詞
基于詞性篩選后的結果,對領域背景下相對較弱的詞進行去除,減少干擾。本文在通用停用詞詞典的基礎之上,構建特定領域的停用詞詞典來輔助去除停用詞。
1.4 診療方案文檔表示及相似度度量
1.4.1 診療方案表示
鑒于診療方案是指導和說明性文件,語言簡潔凝練,大部分詞語只出現一次,故本文選取基于詞頻的向量空間模型文本表示方法[27]。研究文本集 D 中有 n 個文檔,經過預處理后確定每個文檔 d 有 m 個特征項,第 i 文檔 第 k 個特征項
權重為
,則第 i 文檔
可以表示為:
![]() |
本文以 9 版診療方案為基礎,并按照模塊分為多個研究文本集,每個文本集中有 9 個文檔。將詞頻作為特征項權重,將文檔表示為向量。
1.4.2 相似度度量
文本之間的相似度采用標準化的余弦距離[28],第 i 文檔 和第 j 文檔
相似度
計算如下:
![]() |
1.4.3 中藥材轉移度
中藥藥方包含多種藥材,演化有一定繼承性,本文用轉移度來分析中藥藥方的演化。不同版本間兩個處方的轉移度用兩個處方相同藥品數與上一版本處方中藥品數的比值來衡量。中藥材轉移度強調前一分期(或證候)中的藥材在下一分期(或證候)仍被繼續使用的比例,可以為新處方的設計提供參考。本文定義轉移度(T)計算如下:
![]() |
其中 E 表示前一分期(或證候)的某一藥方,具體是該藥方中藥材的集合,即 ;
表示后一分期(或證候)的某一藥方,具體是該藥方中藥材的集合,即
。
2 新型冠狀病毒肺炎診療方案演化分析
2.1 診療方案的整體對比
本文對 9 個版本診療方案進行預處理后,每個方案表示為 1*1 176 維的向量。對診療方案進行兩兩關聯性分析,結果如圖 2 所示。

V1 到 V7 與 V8 的相似度分別為 0.61、0.63、0.68、0.76、0.76、0.77、0.85 和 0.94,數值呈現遞增趨勢,反映到圖中,表現為圖 2 中第一行顏色逐漸變深、餅狀陰影占比越來越大,說明從第一版到第七版,整體上對新型冠狀病毒肺炎診療方案的認識在逐步地成熟。此外,從診療方案內容豐富程度的角度看,V1 到 V8 的字符數逐步攀升,分別為 3 682、3 458、3 473、3 726、4 675、4 653、6 903、9 638 和 11 560,說明人們對肺炎診療方案具有越來越明確的認識和說明。
將圖 2 中相鄰版本間的文本相似度值以及發布間隔時間單獨抽取出來,形成如圖 3 所示的折線圖,整體相似度呈上升趨勢,進一步驗證了針對新型冠狀病毒肺炎的診療方案正日趨成熟。V5 與 V5_1 的相似度為 0.98,說明從 V5 到 V5_1,兩者的診療方案內容基本相同,發生的改動較小。此外,較為相似的診療方案還有 V2 與 V3(相似度為 0.84)、V4 與 V5(相似度為 0.93)、V6 與 V7(相似度為 0.91)、V7 與 V8(相似度為 0.94)。從另一個角度來看,發布時間越相鄰的版本越相似,說明對同一事物的認識程度相近,對方案進化和改善影響較小。診療方案發生較大程度改變的時間節點反映在圖 3 的凹點處,分別處于 V1 與 V2 之間、V3 與 V4 之間以及 V5_1 與 V6 之間,說明在這三個時間段內,人們對新型冠狀病毒肺炎的診療方案有了更深入的認識。發布時間間隔方面,V1 到 V7 版本之間不同版本方案發布時間間隔較短,在 2020-01-16 至 2020-03-04 的 48 天內,國家衛生健康委員會緊急發布了 8 版新型冠狀病毒肺炎診療方案,此時也正值我國抗擊疫情的關鍵時期。在 V7 版基礎上,隨著臨床經驗以及科學研究的不斷積累,間隔 168 天后國家衛生健康委員會才發布了 V8,這期間我們對新型冠狀病毒有了較為清晰的認識且我國疫情已得到較為有效的控制。

2.2 診療方案的分塊對比
2.2.1 病原學特點
將每個版本中關于病原學特點的描述內容抽取出來,繪制兩兩之間的相關性圖,如圖 4 所示。從 V4 至 V7,診療方案病原學特點部分相似度較高,說明此時期對新型冠狀病毒的病原學特點認識較為穩定。而最新發布的 V8 病原學部分,對新型冠狀病毒有更加清晰精確的認識。與其他版本不同,V8 明確指出新型冠狀病毒具有 5 個必備基因并對其結構進行描述,由此說明 V8 對新型冠狀病毒已有一個較為精準的認識。

對比計算機生成的文檔向量發現,V1~V3 中對冠狀病毒進行了詳細的解釋,V4~V8 則不再對冠狀病毒進行解釋,而是直接闡述新型冠狀病毒的病原學特點。此外,V4~V8 對新型冠狀病毒的發現位置和時間因素進行了說明,即在人呼吸道上皮細胞內發現需 96 h 左右,而在 VeroE6 和 Huh-7 細胞系中分離培養需約 6 天(V8 描述的是 4~6 天)。在所有版本中,僅 V2 和 V3 未提及“2019-nCoV”這一概念。V2、V3、V4、V5 以及 V7 中描述冠狀病毒理化特性的認識多來自于 SARS 病毒(severe acute respiratory syndrome coronavirus,SARS-CoV)與 MERS 病毒(Middle East respiratory syndrome coronavirus,MERS-CoV),V5_1 和 V6 中描述冠狀病毒理化特性的認識多來自于 SARSr-CoV 與 MERSr-CoV。
2.2.2 流行病學特點
在 9 個版本中,V2 和 V3 沒有給出流行病學特點,V1、V4 到 V8 中描述流行病學特點的內容的詞云圖如圖 5 所示。從圖 5 中可以看出人們對新型冠狀病毒認識的動態變化過程。

(1)傳染源方面:V4 明確了患者是主要傳染源;V5~V7 相同,增加了無癥狀感染者成為傳染源的可能性;V8 則進一步明確無癥狀感染者也是傳染源,并強調“在潛伏期即有傳染性,發病后 5 天內傳染性較強”。
(2)傳播途徑方面:V1 沒有說明;V4 強調了飛沫傳播是主要途徑,亦可通過接觸傳播;V5 和 V5_1 中把接觸傳播也列為主要傳播方式,并增加了尚不明確的氣溶膠和消化道兩種傳播方式;V6 中對氣溶膠傳播做了進一步的條件設定,即“在相對封閉的環境中長時間暴露于高濃度氣溶膠情況下存在經氣溶膠傳播的可能”;V7 中提出了糞便及尿的影響,即“由于在糞便及尿中可分離到新型冠狀病毒,應注意糞便及尿對環境污染造成氣溶膠或接觸傳播”;V8 強調接觸病毒污染的物品也可造成感染。
(3)易感人群方面:疫情初期,開始有兒童不易感染的說法,V1 中只提及收治病例多數與武漢華南海鮮市場有關,家庭聚集性發病較為明顯;隨著疫情的發展,V4 中開始提及“人群普遍易感”的信息,并對兒童和老年人群做了特殊說明,即“老年人及有基礎疾病者感染后病情較重,兒童及嬰幼兒也有發病”;V5~V7 直接強調“人群普遍易感”;而 V8 在強調“人群普遍易感”的同時,增加“感染后或接種新型冠狀病毒疫苗后可獲得一定的免疫力,但持續時間尚不明確”的描述,也是階段性研究的體現。
2.2.3 臨床特點
將每個版本中關于臨床特點的描述內容抽取出來,計算兩兩之間的相似度,如圖 6 所示。V1~V7 中關于新型冠狀病毒肺炎的臨床特點描述相對一致,整體平均相似度約為 89%,其中胸部影像學完全一致。V8 在已有基礎上,增加了更多細節,描述最為詳細,這也是臨床認識不斷積累的體現。

相比于其他版本,V1 與其他方案的描述相差最大,差異主要在發病早期,并且 V1 中沒有描述“低熱”癥狀。此外,V4~V6 對人體相關提取物中可檢測出新型冠狀病毒進行了描述。V5_1 和 V6 對老年人和兒童癥狀進行了特別說明。V6 對患者臨床表現和實驗室檢查結果進行了更詳細的描述,如分泌物、痰等標本,以及危重型患者的呼吸道、多器官功能衰竭、氣管插管等。V7 增加了對孕產婦和兒童的臨床表現描述,如“孕產婦臨床過程與同齡患者接近”以及“部分兒童及新生兒病例癥狀可不典型,表現為嘔吐、腹瀉等消化道癥狀或僅表現為精神弱、呼吸急促”。V8 新增“部分患者以嗅覺、味覺減退或喪失等為首發癥狀”,并描述“極少數患者還可有中樞神經系統受累及肢端缺血性壞死等表現”。V8 也進一步強調病情危重多見于老年人、有慢性基礎疾病者、晚期妊娠和圍產期女性以及肥胖人群。此外,V8 還增加了對兒童及新生兒病例更詳盡的描述:“極少數兒童可有兒童多系統炎癥綜合征(multisystem inflammatory syndrome in children,MIS-C),出現類似川崎病或不典型川崎病表現、中毒性休克綜合征或巨噬細胞活化綜合征等,多發生于恢復期。主要表現為發熱伴皮疹、非化膿性結膜炎、黏膜炎癥、低血壓或休克、凝血障礙、急性消化道癥狀等。一旦發生,病情可在短期內急劇惡化”。在實驗室檢查部分 V8 也對送檢進行了詳細描述,并強調要綜合血清學檢測、流行病學史、臨床表現和基礎疾病等情況進行綜合判別是否陽性。在胸部影像部分,V1~V7 描述一致,而 V8 增加“MIS-C 時,心功能不全患者可見心影增大和肺水腫”的描述。
2.2.4 診斷標準
診斷標準分兩個方面進行,一是疑似病例的診斷,另一個是確診病例的診斷,詳細的診斷標準演化過程如圖 7 所示。

針對疑似病例的診斷標準演化情況,疫情初期,人們對該疾病的判斷有限,在 V1 中,“農貿市場”“武漢市旅游”“經規范抗菌藥物治療 3 天病情無明顯改善或進行性加重”等是不同于其他版本的診斷標準。V2 與 V3 完全一致,但標準相對嚴格,需要同時具備相應的臨床表現,并與“武漢”相關的行為有聯系,如武漢居住史、旅行史、與來自武漢的患者接觸等。V4 在前面的基礎上,放寬了診斷標準,只需滿足“流行病學史中的任何一條,并同時符合臨床表現中任意 2 條”即可定義為疑似病例。V5 和 V5_1 完全一致,在原有基礎上,對湖北省內和省外做了細致的區分,拓寬了流行病學史的波及范圍,即與任何患者或者有患者的地區來往接觸的,都認定在流行病學史之內。隨著人們對疫情的認識,V6 中不再對湖北省加以區分,診斷標準與 V5 中關于湖北省外的標準相同。V7 中疑似病例診斷標準與 V6 相同。V8 與 V7 相似,但是不再強調“武漢市及周邊地區”,且在流行病學史中增加“發病前 14 天內與新型冠狀病毒無癥狀感染者有接觸史”這一條件。
針對確診病例的診斷標準演化情況,V1 限制條件較為嚴格,V2 和 V3 相同,與 V1 相比,確診條件較為寬松,只需滿足其中之一即可。V4~V5_1 中,由 V4 之前版本中采用“痰液、咽拭子、下呼吸道分泌物等標本”改為采用“呼吸道標本或者血液標本”作為檢測對象。V6 則沒有對采樣標本進行說明。V7 新增了“血清新型冠狀病毒特異性 IgM 抗體和 IgG 抗體陽性;血清新型冠狀病毒特異性 IgG 抗體由陰性轉為陽性或恢復期較急性期 4 倍及以上升高”確診條件,V8 則將其拆分為兩個條件,形成四個確診條件,疑似病例同時具備其中之一可判為確診病例。
2.2.5 臨床分型與鑒別診斷
臨床分型的演化很好地反映了人們對新型冠狀病毒認識的逐步加深及精細化。整個分類呈階梯型分布,V1 只對危重型進行了描述,V2 和 V3 對重型和危重型做了描述,V4 增加了對普通型的描述,V5~V8 對輕型、普通型、重型和危重型做了全面的描述和分類。在四種類型的判定中,只有重型的判定上存在差異:從 V2 到 V4,其相應的判定條件逐步減少,V4~V6 基本一致,V6 對高海拔地區做了進一步科學解釋說明,V7 在 V6 基礎之上,增加了兒童重型的 5 個判斷條件,滿足其中之一即為重型。V8 在 V7 兒童重型的 5 個判斷條件基礎上,增加“持續高熱超過 3 天”形成 6 個判斷條件且滿足其中之一即為重型。而各版本關于危重癥、普通型和輕型的判定條件基本一致。
在鑒別診斷方面,V1~V5_1 基本一致,唯一的不同在于 V1 中列出了與 MERS 病毒性肺炎的鑒別。V6 和 V7 在之前版本基礎上,增加了新型冠狀病毒感染輕型表現及疑似病例檢測的說明,并取消了與副流感病毒、鼻病毒、人偏肺病毒、SARS 冠狀病毒的鑒別。V8 在 V6 和 V7 版本基礎上增加了“兒童患者出現皮疹、黏膜損害時,需與川崎病鑒別”。
2.2.6 治療
治療是診療方案中最重要的部分,同時也占據了方案大量的篇幅。治療主要從確定治療場所、一般治療和重型、危重型病例的治療及中醫治療四個方面劃分。
首先拋開中醫治療,對前三個方面的內容整體進行聚類分析,發現 V1~V4 的內容相近,其兩兩相似度平均達到 95.7%,其中 V2 與 V3 完全一致;V5~V6 的內容相近,其兩兩相似度平均達到 95.5%,V5 與 V5_1 幾乎一致。V4 與 V5 相似度為 85.0%,V6 與 V7 相似度為 86.1%,這是診療方案治療部分變化較大的兩次,如圖 8 所示,其中 V7 增加了病理改變以及重型、危重型臨床預警指標。

七個治療方案內容的異同,主要體現在:
(1)確定治療場所方面:V1~V8 對治療場所具備的隔離條件和防護條件描述相同,對危重癥病例的處置方式相同。差異方面,V1 沒有對疑似病例和確診病例進行區分,而 V2~V8 強調,疑似病例應單人單間隔離治療,確診病例可收治在同一病室。
(2)一般治療方面:V1~V4 中提及了“無創或有創機械通氣”的氧療方法,并提出加強細菌學監測,而 V5~V7 中刪除了上述方式,但從 V5 開始加入了動脈血氣分析、細胞因子等監測方式。在給藥上,V1~V3 提及可以短期內使用糖皮質激素,而 V4~V6 取消了該藥的使用,從 V5 開始使用加入了利巴韋林的使用,V5_1 對利巴韋林的劑量使用做了適當修改。V7 增加了氫氧混合吸入氣治療,并增加對孕婦患者的治療的敘述。V8 在抗病毒治療部分提出“不推薦單獨使用洛匹那韋/利托那韋和利巴韋林,不推薦使用羥氯喹或聯合使用阿奇霉素”。
(3)重型、危重型病例的治療方面:V1 中提及高頻振蕩通氣治療方式,而后續方案不再提及此方式;V1~V3 治療方法中,提及體外膜氧合方法,而 V4~V6 中修改為體外膜肺氧合(extracorporeal membrane oxygenation,ECMO);從 V4 開始,對危重癥病例增加了心理疏導的治療方式以及細菌感染預防的措施,并提出可考慮恢復期血漿治療。與 V1~V3 不同的是,V4~V6 在危重癥患者可使用腸道微生態調節劑、血必凈以及酌情使用糖皮質激素,使得用藥更為精確。V5~V6 提出采用“低吸氣壓力”的通氣方法,增加了對重型患者的面罩吸氧和鼻導管治療以及對其呼吸窘迫和低氧血癥的評估,對短時間內病情無改善甚至惡化者,提出及時采用氣管插管和有創機械通氣方法,對人機不同步的患者,提出及時采用鎮靜以及肌松劑的方法。V6 在血液凈化技術中,增加了“血漿置換”方式。V7 較 V6 而言,增加了“根據氣道分泌物情況,選擇密閉式吸痰,必要時行支氣管鏡檢查采取相應治療”,也增加了體外膜肺氧合相關指征,循環支持敘述更加詳盡,增加了腎功能衰竭和腎替代治療、血液凈化治療和免疫治療。V8 在 V7 基礎上,增加了糖皮質激素治療等方法,同時對免疫治療、體外膜肺氧合等方法敘述更加詳盡。
以 V8 中針對根據病情確定治療場所,以及一般治療方法、抗病毒治療、免疫治療、糖皮質激素治療和重型危重型的治療方法為標準,通過實體關系抽取,形成如圖 9 所示的針對新型冠狀病毒肺炎的治療圖譜。在一般治療和重型危重型治療方法上,經鼻高流量氧療有交叉。

(4)中醫治療方面:隨著對新型冠狀病毒肺炎臨床表現、癥候和臨床分期認識的不斷深入,從 V1 到 V8 一直在探索中醫藥在新型冠狀病毒肺炎治療中更加精準化、精細化的處方設計、方劑調配及其使用方式。新型冠狀病毒肺炎屬于中醫疫病范疇,病因為感受疫戾之氣,病位在肺,基本病機特點為“濕、熱、毒、瘀”,細化癥候和臨床分析能夠更好地發揮中醫藥的獨特作用[29]。圖 10 展示了不同版本間新型冠狀病毒肺炎的中醫治療演化關系,其中 V1~V3 是根據證候辨證施治,而 V4~V8 增加了醫學觀察期和臨床治療期,為根據證候和分期辨證施治,V4 和 V5 內容一致,V3~V5 每個證候使用的中藥材數量上差別較小,V6、V7 和 V8 分期和證候更加詳細,中藥材使用數量也普遍增加,且推薦了適用于輕型、普通型、重型和危重型的“清肺排毒湯”,V7 和 V8 一致,較 V6 增加了危重型出現機械通氣伴腹脹便秘或大便不暢,以及人機不同步情況下的中藥使用。

中藥材轉移度強調前一分期(或證候)中多大比例的藥材在下一分期(或證候)仍被繼續使用,可以為新處方的設計提供參考。本文按照轉移度結果劃分為四個層次,分別為低、中、高、全,結果如圖 10 所示。
在 V3~V8 中,共識別了 27 種轉移中藥材,V3 中濕邪郁肺證(5 種)與邪毒閉肺證(7 種)中較多的中藥材在 V4~V5_1 中的中期(疫毒閉肺證)被繼續使用,V3 中內閉外脫證(3 種)與 V4~V5_1 中的重癥期(內閉外脫證)使用中藥材基本保持一致。V4~V5_1(4 種)與 V6、V7 中醫學觀察期基本相同,V4~V5_1 中初期(寒濕郁肺證)中較多中藥材在 V6、V7 和 V8 中輕型和重型(疫毒閉肺證)中被繼續使用,而與 V6、V7 和 V8 中普通型(寒濕阻肺證)完全一致,V4~V5_1 中重癥期(內閉外脫證)和恢復期與 V6、V7 和 V8 中危重型(內閉外脫證)和恢復期保持一致。此外,本文發現在 V4~V5_1 與 V6、V7 和 V8 的中醫治療中,證候相同時處方中具體中藥的使用存在一定差異,而證候不同時處方中也使用了很多相同的中藥材。
在 V8 中,結合已印發的《關于推薦在中西醫結合救治新型冠狀病毒肺炎中使用“清肺排毒湯”的通知》,推薦了清肺排毒湯。清肺排毒湯來源于中醫經典方劑組合,包括麻杏石甘湯、射干麻黃湯、小柴胡湯、五苓散共 21 種中藥材,性味平和,適用于新型冠狀病毒肺炎輕型、普通型、重型甚至危重型患者。圖 11 展示了清肺排毒湯與 V8 各臨床治療分期處方使用的關系,整體上存在 11 種共同的中藥材,分別為麻黃、炙甘草、生石膏與藿香各 4 次,隨后是杏仁 3 次,生姜 2 次、白術、柴胡、茯苓、黃苓和陳皮各 1 次;具體表現在輕型(寒濕阻肺證)、普通型(濕毒郁肺證)和重型(疫毒閉肺證)中存在至少 6 種相同的中藥材,主要為麻黃、炙甘草、生石膏、藿香與杏仁,而在其他臨床分期或證候也存在至少 2 種中藥材,也間接地論證了“清肺排毒湯”可適用于輕型、普通型、重型患者,而與危重型(內閉外脫證)不存在相同的中藥材,因此 V8 中強調“在危重型患者救治中可結合患者實際情況合理使用清肺排毒湯”。

本文還對相鄰版本間整體及治療部分的文本相似度進行對比,如圖 12 所示。由圖 12 可以看出,相鄰方案間西醫部分與中醫部分演化規律不同。相鄰方案間西醫部分經歷過多次較大更新,并且直到 V6、V7 和 V8 版本時仍在不斷更新完善;相鄰方案間中醫部分從無到有在 V6 版本時進行較大更新,之后逐漸穩定。這也凸顯出現代醫學精細化、傳統醫學整體化的特點。

2.2.7 其他
在病例的發現與報告方面,所有版本中,都強調了“隔離治療”的重要性,不同的是,V6、V7 和 V8 強調了“單人間隔離治療”。V1~V3 基本一致,隨著國家對防控的進一步規劃,從 V4 開始,出現了“定點醫院”“網絡直報”等關鍵詞,并拓寬了新型冠狀病毒病原學檢測的范圍。V5 和 V5_1 對湖北省內和省外進行了區分,對湖北省內的病例,強調了隔離的首要位置。V8 進一步明確,對于確診病例應在發現后 2 h 內進行網絡直報。這些表明我國發現與報告以及處理體系及機制逐漸成熟。
在解除隔離和出院標準方面,V1 未提及,V2~V8 基本相同,不同的是,V4 中未提及“肺部影像學顯示炎癥明顯吸收”這一條件,V6 則把上述條件定義得更為精確,即“肺部影像學顯示急性滲出性病變明顯改善”。V7 在 V6 的基礎上,將“連續兩次呼吸道標本核酸檢測陰性(采樣時間至少間隔一天)”改為“連續兩次痰、鼻咽拭子等呼吸道標本核酸檢測陰性(采樣時間至少間隔 24 小時)”。V8 在 V7 條件基礎之上,增加滿足出院標準前三條但核酸仍持續陽性超過 4 周者的情形,并建議通過抗體檢測、病毒培養分離等方法對患者傳染性進行綜合評估后,判斷是否出院。這表明出院條件逐漸地精確和完善。此外 V6、V7 和 V8 增加了詳細的“出院后注意事項”。
在轉運原則方面,主要強調“運送患者應使用專用車輛,并做好運送人員的個人防護和車輛消毒”,在《新型冠狀病毒肺炎病例轉運工作方案》(試行)[30]制定之后,從 V4 開始,主要參照該轉運工作方案。
在醫療機構內感染預防與控制方面,V1 未提及,V2 主要從嚴格執行標準預防、醫學人員個人防護及其他注意事項三個方面來描述。隨著國家相關標準和指南的出臺,V3 主要參照《醫療機構內新型冠狀病毒感染預防與控制技術指南(第一版)》[31],V4~V8 遵照《醫療機構內新型冠狀病毒感染預防與控制技術指南(第一版)》和《新型冠狀病毒肺炎防控中常見醫用防護使用范圍指引(試行)》[32]執行。
V8 新增“護理”部分,為臨床護理工作提供指導,特別是對于重癥患者的護理。此外,V8 還新增“預防”部分,為預防新型冠狀病毒感染提供指導,也是診療方案涉及范圍向前延伸的體現。這些都表明診療方案在不斷地豐富。
2.3 方法有效性驗證
本文從基于文本挖掘的演化方法的應用、結果符合認知規律以及與相關解讀對比三個方面證明方法的有效性。首先,從方法層面,基于文本挖掘的演化方法已經在相關領域得以應用和驗證,如基于文本挖掘的國家科技創新政策的主題分析與演化[22]、在線醫療健康研究的主題演化[23]以及歷年國務院政府工作報告演化[24]等,證明采用文本挖掘來進行診療方案演化分析的可行性。其次,基于本文提出方法的演化分析結果符合認知規律,例如其他版本與第八版相似度逐漸提升,證明對診療方案的認識在不斷加深,符合我們對事物的認知規律。最后,結合新型冠狀病毒肺炎診療方案,基于本文方法的演化分析與專家解讀相對比,結果較為一致。如音銘等[33]基于領域專家視角對新型冠狀病毒肺炎第八版診療方案的變化進行闡述,分析了流行病學特點、病理改變、診斷標準、臨床分型以及治療等部分的變化情況。本文 2.2 部分的相關分析與其一致,證明本文方法的有效性。而且,本文基于定性與定量分析相結合的方式,可以對更細節的變化進行挖掘,如對治療部分的分析,本文從病情確定治療場所,以及一般治療方法、抗病毒治療、免疫治療、糖皮質激素治療和重型危重型的治療方法等方面進行細致分析,同時基于關鍵詞繪制出治療圖譜,為新型冠狀病毒肺炎的臨床治療提供了支持。此外,本文還關注了病原學特點、中醫治療、轉運以及醫療機構內感染預防與控制等方面的變化,分析結果更加全面。
3 總結及建議
整體來講,診療方案發生較大程度改變的時間節點分別處于 V1 與 V2 之間、V3 與 V4 之間以及 V5_1 與 V6 之間。從 V1 到 V2,在各方面都有較多的改動;從 V3 到 V4,在病原學特點、流行病學特點、臨床分型、診斷標準、治療、轉運原則、醫院感染控制方面有較多的改動;從 V5_1 到 V6,在傳播途徑、診斷標準(湖北省內外的區分)、鑒別診斷、中醫治療等方面有較多的改動。在診斷和治療方面,V8 較 V7 增加較多細節,描述得更加詳細,如增加糖皮質激素治療等方法,同時對免疫治療、體外膜肺氧合等方法敘述更加詳盡,說明國家對診療認識的進一步加深。在中醫治療方面,V8 與 V7 版本較為一致,說明目前形成了較為穩定的中醫治療方案。
針對 9 份新型冠狀病毒肺炎診療方案的對比分析結果,本文給出如下建議:
(1)關注新型冠狀病毒肺炎第八版診療方案與其他版本的差異:新型冠狀病毒肺炎診療方案的更新與完善是對新型冠狀病毒肺炎認識不斷加深的體現,每次更新的部分也是發現和認識的重點,如第八版新型冠狀病毒肺炎診療方案與其他版本相比,進一步明確了流行病學特點,完善了病理改變和臨床表現,補充了“重型/危重型高危人群”的判定標準,大幅度修正了治療措施,新增了“預防”相關內容等。這些變化是新發現與新認知的體現,為使用新版診療方案時提供了關注重點,更好地方便臨床等相關人員對新版診療方案的學習和掌握。
(2)充分發揮傳統醫學特色優勢:新型冠狀病毒肺炎診療方案演化中,中西醫診療方案展現出不同特點,現代醫學更加精細,而傳統醫學更加整體化。可以充分融合中西醫優勢,發揮中醫藥治未病、辨證施治、多靶點干預等獨特優勢,特別是在預防和早期階段實時中醫藥介入,提高免疫力。本文識別出麻黃、炙甘草、生石膏與藿香等為疫情防控常用的中藥材,為新型冠狀病毒肺炎疫情防控重點物資保障提供指導,建議關注重點中藥材的市場動態,保障供應與價格穩定。
(3)制定統一的中西醫路徑方案:雖然針對新型冠狀病毒肺炎的診療方案相對穩定,仍需對整個診療方案進行規范化和科學化,形成統一的臨床診療路徑方案。對當前通過中西醫治愈的病例進行歸納總結,針對觀察期、治療期、輕型、初期、中期、重癥期及恢復期分別制定較為統一的中西藥用藥方案,形成規范的中西藥治療路徑。
(4)借助大數據與人工智能等技術優化診療方案:當前新型冠狀病毒肺炎診療方案為統一指導性方案,而臨床實踐中患者層面診療方案可能因患者的特點而不盡相同。在“互聯網+醫療健康”背景下,可借助大數據和人工智能技術,對已治愈病例以及死亡病例進行動態分析與挖掘,發現并提取出更為有效的診療模式,修正臨床診療路徑方案和中藥用藥路徑。同時可基于機器學習推薦算法,依據患者自身實際情況推薦個性化診療方案,以達到更好的診療效果。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
引言
2019 年 12 月在湖北省武漢市首次報道了新型冠狀病毒肺炎(corona virus disease 2019,COVID-19)病例。新型冠狀病毒肺炎是指新型冠狀病毒(2019-nCoV)感染導致的肺炎,患病后以血管緊張素轉化酶域作為受體侵入細胞導致肺損傷。新型冠狀病毒肺炎傳染性強,重癥患者會出現急性呼吸窘迫綜合征和感染性休克,最終出現多器官功能衰竭[1]。隨著疫情的全球蔓延,世界衛生組織于 2020 年 1 月 31 日將新型冠狀病毒肺炎疫情列為突發公共衛生事件,引起了廣泛關注[2],相關的臨床研究迅速展開[3-4]。為有效抑制疫情的發展,指導全國科學規范地做好新型冠狀病毒肺炎病例診斷和醫療救治工作,2020 年 1 月 16 日至 2020 年 8 月 19 日,國家衛生健康委員會相繼發布了 9 版新型冠狀病毒肺炎診療方案,具體包括 1 月 16 日的第一版(V1)、1 月 18 日的第二版(V2)、1 月 22 日的第三版(V3)、1 月 27 日的第四版(V4)、2 月 4 日的第五版(V5)、2 月 8 日的第五版修訂版(V5_1)、2 月 19 日的第六版(V6)、3 月 4 日的第七版(V7)和 8 月 19 日的第八版(V8)[5]。
新型冠狀病毒肺炎診療方案的完善過程是人們對新型冠狀病毒認識不斷加深的體現,也是人們對新型冠狀病毒肺炎的診斷和治療方法的研究更科學、更高效、更深入的體現。分析新型冠狀病毒肺炎診療方案的演化可以總結新型冠狀病毒肺炎診療經驗,將有助于促進新型冠狀病毒肺炎醫療救治工作。當前國內疫情雖得到有效的控制,但是國外疫情形勢不容樂觀,對我國新型冠狀病毒肺炎診療方案演化的分析也可為全球抗擊疫情提供參考。
眾多研究者對診療方案的不同方面展開精細化研究。如車坷科等[6]從臨床藥學角度對最新診療方案中所涉及的抗病毒藥物進行回顧分析,并提出藥學監護的重點。趙建平[7]在《新型冠狀病毒肺炎診療方案(試行第六版)》及《“新型冠狀病毒感染的肺炎”重型及危重型診療方案(試行第一版)》的基礎上,對重癥及危重癥患者的診斷標準、臨床預警指標、診療流程及護理方案等進行了詳細的闡述。丁寧等[8]從疫情暴發地定點醫院的視角對新型冠狀病毒肺炎的防治實踐進行分析,并給出相關建議。蔣倩等[9]基于循證醫學視角對新型冠狀病毒肺炎的診療方案進行比較。同時,關于診療方案中醫治療的研究較多[10-11]。楊晨等[12]、李凌濤等[13]以及李思聰等[14]基于新型冠狀病毒肺炎診療方案對中成藥的合理使用、藥學監護、選用依據等進行了探討。宋斌[15]基于診療方案從中醫分期與西醫分型基本情況、分離現狀、原因分析及其不利影響等方面進行探討。任偉鈺等[16]對新型冠狀病毒肺炎的中醫藥用藥方案進行系統分析,為中藥處方治療的合理性提供參考。于明坤等[17]對中醫診療方案進行匯總分析,得出不同診療方案的異同,同時指出中醫在新型冠狀病毒肺炎防治過程中的積極參與、中醫治療的整體觀念及同病異治的理念。已有的診療方案分析大多基于特定版本或者特定部分,以人工總結、定性分析為主,可能導致分析不全面和不細致。
目前,文本挖掘的理論與技術發展迅速,為文本分析挖掘提供了強有力的支持。基于文本挖掘的新型冠狀病毒肺炎診療方案的分析融合了定量方法,更加快速和全面,為新型冠狀病毒肺炎診療方案演化的研究提供新的思路。文本挖掘于 1995 年 Feldman 等[18]首次提出以來,已被廣泛運用到各個領域[19-20],并展現了巨大的優勢和作用[21]。張寶建等[22]基于文本挖掘對國家科技創新政策的主題分析與演化過程進行研究,根據挖掘結果凝練出政策演化規律。吳江等[23]基于文本挖掘技術對在線醫療健康研究的研究熱點、主題演化等內容進行研究,基于關鍵詞的聚類分析,分析出文獻的主題分布和演化。魏偉等[24]基于文本挖掘技術對歷年國務院政府工作報告進行多粒度、多層次的綜合定量分析,探討了報告中的共性問題、熱點問題及其演化規律。多領域學者基于領域文本數據及文本挖掘技術對領域問題演化進行了探討。蒲曉蓉等[25]通過對文本主題進行無監督學習,實現新型冠狀病毒肺炎診療方案的計算機自動智能解讀。已有研究顯示基于文本挖掘的演化分析已被應用到多個領域并取得較好結果,證明了采用文本挖掘分析新型冠狀病毒肺炎診療方案演化的可行性。
本文將在已有研究的基礎上,基于新型冠狀病毒肺炎診療方案文本數據,借助文本挖掘相關理論方法,對新型冠狀病毒肺炎診療方案的演化進行歸納分析,以期為新型冠狀病毒肺炎的診療提供參考。
1 研究方法
1.1 研究框架
新型冠狀病毒肺炎診療方案模塊化程度高,每個版本的診療方案主要包括 11 個部分,即病原學特點、流行病學特點、臨床特點、診斷標準、臨床分型、鑒別診斷、病例的發現與報告、治療、解除隔離和出院后注意事項、轉運原則以及醫療機構內感染預防與控制。據此,本文擬對 9 版新型冠狀病毒肺炎診療方案整體及相應模塊的演化進行分析,整體研究框架如圖 1 所示。

1.2 研究數據選取
本文選取 2020 年 1 月 16 日至 2020 年 8 月 19 日期間國家衛生健康委員會相繼發布的 9 版新型冠狀病毒肺炎診療方案作為基礎研究數據,通過對相關模塊的提取,形成整體文本和分模塊文本,構成本文的研究數據。
1.3 文本預處理
文本預處理作為自然語言處理的重要過程,可以減少文本中的噪聲,有助于提高最終挖掘結果。文本預處理過程主要包括文本分詞技術、新詞發現技術等,文本預處理后續階段主要包括詞性篩選(本文主要選取名詞、具有名詞功能的動詞、具有名詞功能的形容詞、動詞性慣用語)和去停用詞等操作[24]。
1.3.1 基于信息熵的文本分詞
本文主要借助中科院開發的 ICTCLAS 分詞工具進行分詞操作[26]。由于該工具為通用分詞工具,不能夠保留較長的語義單元短語,提供的分詞結果以較短詞語為主,一定程度上破壞了原始語義結構。本文在 ICTCLAS 分詞工具基礎之上,基于信息熵并人機結合進行分詞。首先基于新詞發現和人工構建初步的領域詞典,對診療方案進行初步分詞,然后基于信息熵的方法對分詞結果進行合并處理。兩詞合并需要滿足相鄰和頻繁共線兩個條件,計算方法如下:
![]() |
其中, 表示詞
在文檔中出現的頻率,
表示詞
和詞
在文檔中連續出現的頻率。
當 滿足一定閾值(本文為 0.5),將該兩詞進行合并得到較長的語義單元短語,再經過人工篩選后添加到領域詞典中對原文檔進行進一步分詞,循環多次,直至穩定。
1.3.2 詞性篩選
由于診療方案是文件類型材料,名詞更能代表原文檔的語義信息。在分詞結果基礎之上,本文選擇名詞或與名詞相近的詞(如具有名詞功能的動詞等)作為研究對象。
1.3.3 去停用詞
基于詞性篩選后的結果,對領域背景下相對較弱的詞進行去除,減少干擾。本文在通用停用詞詞典的基礎之上,構建特定領域的停用詞詞典來輔助去除停用詞。
1.4 診療方案文檔表示及相似度度量
1.4.1 診療方案表示
鑒于診療方案是指導和說明性文件,語言簡潔凝練,大部分詞語只出現一次,故本文選取基于詞頻的向量空間模型文本表示方法[27]。研究文本集 D 中有 n 個文檔,經過預處理后確定每個文檔 d 有 m 個特征項,第 i 文檔 第 k 個特征項
權重為
,則第 i 文檔
可以表示為:
![]() |
本文以 9 版診療方案為基礎,并按照模塊分為多個研究文本集,每個文本集中有 9 個文檔。將詞頻作為特征項權重,將文檔表示為向量。
1.4.2 相似度度量
文本之間的相似度采用標準化的余弦距離[28],第 i 文檔 和第 j 文檔
相似度
計算如下:
![]() |
1.4.3 中藥材轉移度
中藥藥方包含多種藥材,演化有一定繼承性,本文用轉移度來分析中藥藥方的演化。不同版本間兩個處方的轉移度用兩個處方相同藥品數與上一版本處方中藥品數的比值來衡量。中藥材轉移度強調前一分期(或證候)中的藥材在下一分期(或證候)仍被繼續使用的比例,可以為新處方的設計提供參考。本文定義轉移度(T)計算如下:
![]() |
其中 E 表示前一分期(或證候)的某一藥方,具體是該藥方中藥材的集合,即 ;
表示后一分期(或證候)的某一藥方,具體是該藥方中藥材的集合,即
。
2 新型冠狀病毒肺炎診療方案演化分析
2.1 診療方案的整體對比
本文對 9 個版本診療方案進行預處理后,每個方案表示為 1*1 176 維的向量。對診療方案進行兩兩關聯性分析,結果如圖 2 所示。

V1 到 V7 與 V8 的相似度分別為 0.61、0.63、0.68、0.76、0.76、0.77、0.85 和 0.94,數值呈現遞增趨勢,反映到圖中,表現為圖 2 中第一行顏色逐漸變深、餅狀陰影占比越來越大,說明從第一版到第七版,整體上對新型冠狀病毒肺炎診療方案的認識在逐步地成熟。此外,從診療方案內容豐富程度的角度看,V1 到 V8 的字符數逐步攀升,分別為 3 682、3 458、3 473、3 726、4 675、4 653、6 903、9 638 和 11 560,說明人們對肺炎診療方案具有越來越明確的認識和說明。
將圖 2 中相鄰版本間的文本相似度值以及發布間隔時間單獨抽取出來,形成如圖 3 所示的折線圖,整體相似度呈上升趨勢,進一步驗證了針對新型冠狀病毒肺炎的診療方案正日趨成熟。V5 與 V5_1 的相似度為 0.98,說明從 V5 到 V5_1,兩者的診療方案內容基本相同,發生的改動較小。此外,較為相似的診療方案還有 V2 與 V3(相似度為 0.84)、V4 與 V5(相似度為 0.93)、V6 與 V7(相似度為 0.91)、V7 與 V8(相似度為 0.94)。從另一個角度來看,發布時間越相鄰的版本越相似,說明對同一事物的認識程度相近,對方案進化和改善影響較小。診療方案發生較大程度改變的時間節點反映在圖 3 的凹點處,分別處于 V1 與 V2 之間、V3 與 V4 之間以及 V5_1 與 V6 之間,說明在這三個時間段內,人們對新型冠狀病毒肺炎的診療方案有了更深入的認識。發布時間間隔方面,V1 到 V7 版本之間不同版本方案發布時間間隔較短,在 2020-01-16 至 2020-03-04 的 48 天內,國家衛生健康委員會緊急發布了 8 版新型冠狀病毒肺炎診療方案,此時也正值我國抗擊疫情的關鍵時期。在 V7 版基礎上,隨著臨床經驗以及科學研究的不斷積累,間隔 168 天后國家衛生健康委員會才發布了 V8,這期間我們對新型冠狀病毒有了較為清晰的認識且我國疫情已得到較為有效的控制。

2.2 診療方案的分塊對比
2.2.1 病原學特點
將每個版本中關于病原學特點的描述內容抽取出來,繪制兩兩之間的相關性圖,如圖 4 所示。從 V4 至 V7,診療方案病原學特點部分相似度較高,說明此時期對新型冠狀病毒的病原學特點認識較為穩定。而最新發布的 V8 病原學部分,對新型冠狀病毒有更加清晰精確的認識。與其他版本不同,V8 明確指出新型冠狀病毒具有 5 個必備基因并對其結構進行描述,由此說明 V8 對新型冠狀病毒已有一個較為精準的認識。

對比計算機生成的文檔向量發現,V1~V3 中對冠狀病毒進行了詳細的解釋,V4~V8 則不再對冠狀病毒進行解釋,而是直接闡述新型冠狀病毒的病原學特點。此外,V4~V8 對新型冠狀病毒的發現位置和時間因素進行了說明,即在人呼吸道上皮細胞內發現需 96 h 左右,而在 VeroE6 和 Huh-7 細胞系中分離培養需約 6 天(V8 描述的是 4~6 天)。在所有版本中,僅 V2 和 V3 未提及“2019-nCoV”這一概念。V2、V3、V4、V5 以及 V7 中描述冠狀病毒理化特性的認識多來自于 SARS 病毒(severe acute respiratory syndrome coronavirus,SARS-CoV)與 MERS 病毒(Middle East respiratory syndrome coronavirus,MERS-CoV),V5_1 和 V6 中描述冠狀病毒理化特性的認識多來自于 SARSr-CoV 與 MERSr-CoV。
2.2.2 流行病學特點
在 9 個版本中,V2 和 V3 沒有給出流行病學特點,V1、V4 到 V8 中描述流行病學特點的內容的詞云圖如圖 5 所示。從圖 5 中可以看出人們對新型冠狀病毒認識的動態變化過程。

(1)傳染源方面:V4 明確了患者是主要傳染源;V5~V7 相同,增加了無癥狀感染者成為傳染源的可能性;V8 則進一步明確無癥狀感染者也是傳染源,并強調“在潛伏期即有傳染性,發病后 5 天內傳染性較強”。
(2)傳播途徑方面:V1 沒有說明;V4 強調了飛沫傳播是主要途徑,亦可通過接觸傳播;V5 和 V5_1 中把接觸傳播也列為主要傳播方式,并增加了尚不明確的氣溶膠和消化道兩種傳播方式;V6 中對氣溶膠傳播做了進一步的條件設定,即“在相對封閉的環境中長時間暴露于高濃度氣溶膠情況下存在經氣溶膠傳播的可能”;V7 中提出了糞便及尿的影響,即“由于在糞便及尿中可分離到新型冠狀病毒,應注意糞便及尿對環境污染造成氣溶膠或接觸傳播”;V8 強調接觸病毒污染的物品也可造成感染。
(3)易感人群方面:疫情初期,開始有兒童不易感染的說法,V1 中只提及收治病例多數與武漢華南海鮮市場有關,家庭聚集性發病較為明顯;隨著疫情的發展,V4 中開始提及“人群普遍易感”的信息,并對兒童和老年人群做了特殊說明,即“老年人及有基礎疾病者感染后病情較重,兒童及嬰幼兒也有發病”;V5~V7 直接強調“人群普遍易感”;而 V8 在強調“人群普遍易感”的同時,增加“感染后或接種新型冠狀病毒疫苗后可獲得一定的免疫力,但持續時間尚不明確”的描述,也是階段性研究的體現。
2.2.3 臨床特點
將每個版本中關于臨床特點的描述內容抽取出來,計算兩兩之間的相似度,如圖 6 所示。V1~V7 中關于新型冠狀病毒肺炎的臨床特點描述相對一致,整體平均相似度約為 89%,其中胸部影像學完全一致。V8 在已有基礎上,增加了更多細節,描述最為詳細,這也是臨床認識不斷積累的體現。

相比于其他版本,V1 與其他方案的描述相差最大,差異主要在發病早期,并且 V1 中沒有描述“低熱”癥狀。此外,V4~V6 對人體相關提取物中可檢測出新型冠狀病毒進行了描述。V5_1 和 V6 對老年人和兒童癥狀進行了特別說明。V6 對患者臨床表現和實驗室檢查結果進行了更詳細的描述,如分泌物、痰等標本,以及危重型患者的呼吸道、多器官功能衰竭、氣管插管等。V7 增加了對孕產婦和兒童的臨床表現描述,如“孕產婦臨床過程與同齡患者接近”以及“部分兒童及新生兒病例癥狀可不典型,表現為嘔吐、腹瀉等消化道癥狀或僅表現為精神弱、呼吸急促”。V8 新增“部分患者以嗅覺、味覺減退或喪失等為首發癥狀”,并描述“極少數患者還可有中樞神經系統受累及肢端缺血性壞死等表現”。V8 也進一步強調病情危重多見于老年人、有慢性基礎疾病者、晚期妊娠和圍產期女性以及肥胖人群。此外,V8 還增加了對兒童及新生兒病例更詳盡的描述:“極少數兒童可有兒童多系統炎癥綜合征(multisystem inflammatory syndrome in children,MIS-C),出現類似川崎病或不典型川崎病表現、中毒性休克綜合征或巨噬細胞活化綜合征等,多發生于恢復期。主要表現為發熱伴皮疹、非化膿性結膜炎、黏膜炎癥、低血壓或休克、凝血障礙、急性消化道癥狀等。一旦發生,病情可在短期內急劇惡化”。在實驗室檢查部分 V8 也對送檢進行了詳細描述,并強調要綜合血清學檢測、流行病學史、臨床表現和基礎疾病等情況進行綜合判別是否陽性。在胸部影像部分,V1~V7 描述一致,而 V8 增加“MIS-C 時,心功能不全患者可見心影增大和肺水腫”的描述。
2.2.4 診斷標準
診斷標準分兩個方面進行,一是疑似病例的診斷,另一個是確診病例的診斷,詳細的診斷標準演化過程如圖 7 所示。

針對疑似病例的診斷標準演化情況,疫情初期,人們對該疾病的判斷有限,在 V1 中,“農貿市場”“武漢市旅游”“經規范抗菌藥物治療 3 天病情無明顯改善或進行性加重”等是不同于其他版本的診斷標準。V2 與 V3 完全一致,但標準相對嚴格,需要同時具備相應的臨床表現,并與“武漢”相關的行為有聯系,如武漢居住史、旅行史、與來自武漢的患者接觸等。V4 在前面的基礎上,放寬了診斷標準,只需滿足“流行病學史中的任何一條,并同時符合臨床表現中任意 2 條”即可定義為疑似病例。V5 和 V5_1 完全一致,在原有基礎上,對湖北省內和省外做了細致的區分,拓寬了流行病學史的波及范圍,即與任何患者或者有患者的地區來往接觸的,都認定在流行病學史之內。隨著人們對疫情的認識,V6 中不再對湖北省加以區分,診斷標準與 V5 中關于湖北省外的標準相同。V7 中疑似病例診斷標準與 V6 相同。V8 與 V7 相似,但是不再強調“武漢市及周邊地區”,且在流行病學史中增加“發病前 14 天內與新型冠狀病毒無癥狀感染者有接觸史”這一條件。
針對確診病例的診斷標準演化情況,V1 限制條件較為嚴格,V2 和 V3 相同,與 V1 相比,確診條件較為寬松,只需滿足其中之一即可。V4~V5_1 中,由 V4 之前版本中采用“痰液、咽拭子、下呼吸道分泌物等標本”改為采用“呼吸道標本或者血液標本”作為檢測對象。V6 則沒有對采樣標本進行說明。V7 新增了“血清新型冠狀病毒特異性 IgM 抗體和 IgG 抗體陽性;血清新型冠狀病毒特異性 IgG 抗體由陰性轉為陽性或恢復期較急性期 4 倍及以上升高”確診條件,V8 則將其拆分為兩個條件,形成四個確診條件,疑似病例同時具備其中之一可判為確診病例。
2.2.5 臨床分型與鑒別診斷
臨床分型的演化很好地反映了人們對新型冠狀病毒認識的逐步加深及精細化。整個分類呈階梯型分布,V1 只對危重型進行了描述,V2 和 V3 對重型和危重型做了描述,V4 增加了對普通型的描述,V5~V8 對輕型、普通型、重型和危重型做了全面的描述和分類。在四種類型的判定中,只有重型的判定上存在差異:從 V2 到 V4,其相應的判定條件逐步減少,V4~V6 基本一致,V6 對高海拔地區做了進一步科學解釋說明,V7 在 V6 基礎之上,增加了兒童重型的 5 個判斷條件,滿足其中之一即為重型。V8 在 V7 兒童重型的 5 個判斷條件基礎上,增加“持續高熱超過 3 天”形成 6 個判斷條件且滿足其中之一即為重型。而各版本關于危重癥、普通型和輕型的判定條件基本一致。
在鑒別診斷方面,V1~V5_1 基本一致,唯一的不同在于 V1 中列出了與 MERS 病毒性肺炎的鑒別。V6 和 V7 在之前版本基礎上,增加了新型冠狀病毒感染輕型表現及疑似病例檢測的說明,并取消了與副流感病毒、鼻病毒、人偏肺病毒、SARS 冠狀病毒的鑒別。V8 在 V6 和 V7 版本基礎上增加了“兒童患者出現皮疹、黏膜損害時,需與川崎病鑒別”。
2.2.6 治療
治療是診療方案中最重要的部分,同時也占據了方案大量的篇幅。治療主要從確定治療場所、一般治療和重型、危重型病例的治療及中醫治療四個方面劃分。
首先拋開中醫治療,對前三個方面的內容整體進行聚類分析,發現 V1~V4 的內容相近,其兩兩相似度平均達到 95.7%,其中 V2 與 V3 完全一致;V5~V6 的內容相近,其兩兩相似度平均達到 95.5%,V5 與 V5_1 幾乎一致。V4 與 V5 相似度為 85.0%,V6 與 V7 相似度為 86.1%,這是診療方案治療部分變化較大的兩次,如圖 8 所示,其中 V7 增加了病理改變以及重型、危重型臨床預警指標。

七個治療方案內容的異同,主要體現在:
(1)確定治療場所方面:V1~V8 對治療場所具備的隔離條件和防護條件描述相同,對危重癥病例的處置方式相同。差異方面,V1 沒有對疑似病例和確診病例進行區分,而 V2~V8 強調,疑似病例應單人單間隔離治療,確診病例可收治在同一病室。
(2)一般治療方面:V1~V4 中提及了“無創或有創機械通氣”的氧療方法,并提出加強細菌學監測,而 V5~V7 中刪除了上述方式,但從 V5 開始加入了動脈血氣分析、細胞因子等監測方式。在給藥上,V1~V3 提及可以短期內使用糖皮質激素,而 V4~V6 取消了該藥的使用,從 V5 開始使用加入了利巴韋林的使用,V5_1 對利巴韋林的劑量使用做了適當修改。V7 增加了氫氧混合吸入氣治療,并增加對孕婦患者的治療的敘述。V8 在抗病毒治療部分提出“不推薦單獨使用洛匹那韋/利托那韋和利巴韋林,不推薦使用羥氯喹或聯合使用阿奇霉素”。
(3)重型、危重型病例的治療方面:V1 中提及高頻振蕩通氣治療方式,而后續方案不再提及此方式;V1~V3 治療方法中,提及體外膜氧合方法,而 V4~V6 中修改為體外膜肺氧合(extracorporeal membrane oxygenation,ECMO);從 V4 開始,對危重癥病例增加了心理疏導的治療方式以及細菌感染預防的措施,并提出可考慮恢復期血漿治療。與 V1~V3 不同的是,V4~V6 在危重癥患者可使用腸道微生態調節劑、血必凈以及酌情使用糖皮質激素,使得用藥更為精確。V5~V6 提出采用“低吸氣壓力”的通氣方法,增加了對重型患者的面罩吸氧和鼻導管治療以及對其呼吸窘迫和低氧血癥的評估,對短時間內病情無改善甚至惡化者,提出及時采用氣管插管和有創機械通氣方法,對人機不同步的患者,提出及時采用鎮靜以及肌松劑的方法。V6 在血液凈化技術中,增加了“血漿置換”方式。V7 較 V6 而言,增加了“根據氣道分泌物情況,選擇密閉式吸痰,必要時行支氣管鏡檢查采取相應治療”,也增加了體外膜肺氧合相關指征,循環支持敘述更加詳盡,增加了腎功能衰竭和腎替代治療、血液凈化治療和免疫治療。V8 在 V7 基礎上,增加了糖皮質激素治療等方法,同時對免疫治療、體外膜肺氧合等方法敘述更加詳盡。
以 V8 中針對根據病情確定治療場所,以及一般治療方法、抗病毒治療、免疫治療、糖皮質激素治療和重型危重型的治療方法為標準,通過實體關系抽取,形成如圖 9 所示的針對新型冠狀病毒肺炎的治療圖譜。在一般治療和重型危重型治療方法上,經鼻高流量氧療有交叉。

(4)中醫治療方面:隨著對新型冠狀病毒肺炎臨床表現、癥候和臨床分期認識的不斷深入,從 V1 到 V8 一直在探索中醫藥在新型冠狀病毒肺炎治療中更加精準化、精細化的處方設計、方劑調配及其使用方式。新型冠狀病毒肺炎屬于中醫疫病范疇,病因為感受疫戾之氣,病位在肺,基本病機特點為“濕、熱、毒、瘀”,細化癥候和臨床分析能夠更好地發揮中醫藥的獨特作用[29]。圖 10 展示了不同版本間新型冠狀病毒肺炎的中醫治療演化關系,其中 V1~V3 是根據證候辨證施治,而 V4~V8 增加了醫學觀察期和臨床治療期,為根據證候和分期辨證施治,V4 和 V5 內容一致,V3~V5 每個證候使用的中藥材數量上差別較小,V6、V7 和 V8 分期和證候更加詳細,中藥材使用數量也普遍增加,且推薦了適用于輕型、普通型、重型和危重型的“清肺排毒湯”,V7 和 V8 一致,較 V6 增加了危重型出現機械通氣伴腹脹便秘或大便不暢,以及人機不同步情況下的中藥使用。

中藥材轉移度強調前一分期(或證候)中多大比例的藥材在下一分期(或證候)仍被繼續使用,可以為新處方的設計提供參考。本文按照轉移度結果劃分為四個層次,分別為低、中、高、全,結果如圖 10 所示。
在 V3~V8 中,共識別了 27 種轉移中藥材,V3 中濕邪郁肺證(5 種)與邪毒閉肺證(7 種)中較多的中藥材在 V4~V5_1 中的中期(疫毒閉肺證)被繼續使用,V3 中內閉外脫證(3 種)與 V4~V5_1 中的重癥期(內閉外脫證)使用中藥材基本保持一致。V4~V5_1(4 種)與 V6、V7 中醫學觀察期基本相同,V4~V5_1 中初期(寒濕郁肺證)中較多中藥材在 V6、V7 和 V8 中輕型和重型(疫毒閉肺證)中被繼續使用,而與 V6、V7 和 V8 中普通型(寒濕阻肺證)完全一致,V4~V5_1 中重癥期(內閉外脫證)和恢復期與 V6、V7 和 V8 中危重型(內閉外脫證)和恢復期保持一致。此外,本文發現在 V4~V5_1 與 V6、V7 和 V8 的中醫治療中,證候相同時處方中具體中藥的使用存在一定差異,而證候不同時處方中也使用了很多相同的中藥材。
在 V8 中,結合已印發的《關于推薦在中西醫結合救治新型冠狀病毒肺炎中使用“清肺排毒湯”的通知》,推薦了清肺排毒湯。清肺排毒湯來源于中醫經典方劑組合,包括麻杏石甘湯、射干麻黃湯、小柴胡湯、五苓散共 21 種中藥材,性味平和,適用于新型冠狀病毒肺炎輕型、普通型、重型甚至危重型患者。圖 11 展示了清肺排毒湯與 V8 各臨床治療分期處方使用的關系,整體上存在 11 種共同的中藥材,分別為麻黃、炙甘草、生石膏與藿香各 4 次,隨后是杏仁 3 次,生姜 2 次、白術、柴胡、茯苓、黃苓和陳皮各 1 次;具體表現在輕型(寒濕阻肺證)、普通型(濕毒郁肺證)和重型(疫毒閉肺證)中存在至少 6 種相同的中藥材,主要為麻黃、炙甘草、生石膏、藿香與杏仁,而在其他臨床分期或證候也存在至少 2 種中藥材,也間接地論證了“清肺排毒湯”可適用于輕型、普通型、重型患者,而與危重型(內閉外脫證)不存在相同的中藥材,因此 V8 中強調“在危重型患者救治中可結合患者實際情況合理使用清肺排毒湯”。

本文還對相鄰版本間整體及治療部分的文本相似度進行對比,如圖 12 所示。由圖 12 可以看出,相鄰方案間西醫部分與中醫部分演化規律不同。相鄰方案間西醫部分經歷過多次較大更新,并且直到 V6、V7 和 V8 版本時仍在不斷更新完善;相鄰方案間中醫部分從無到有在 V6 版本時進行較大更新,之后逐漸穩定。這也凸顯出現代醫學精細化、傳統醫學整體化的特點。

2.2.7 其他
在病例的發現與報告方面,所有版本中,都強調了“隔離治療”的重要性,不同的是,V6、V7 和 V8 強調了“單人間隔離治療”。V1~V3 基本一致,隨著國家對防控的進一步規劃,從 V4 開始,出現了“定點醫院”“網絡直報”等關鍵詞,并拓寬了新型冠狀病毒病原學檢測的范圍。V5 和 V5_1 對湖北省內和省外進行了區分,對湖北省內的病例,強調了隔離的首要位置。V8 進一步明確,對于確診病例應在發現后 2 h 內進行網絡直報。這些表明我國發現與報告以及處理體系及機制逐漸成熟。
在解除隔離和出院標準方面,V1 未提及,V2~V8 基本相同,不同的是,V4 中未提及“肺部影像學顯示炎癥明顯吸收”這一條件,V6 則把上述條件定義得更為精確,即“肺部影像學顯示急性滲出性病變明顯改善”。V7 在 V6 的基礎上,將“連續兩次呼吸道標本核酸檢測陰性(采樣時間至少間隔一天)”改為“連續兩次痰、鼻咽拭子等呼吸道標本核酸檢測陰性(采樣時間至少間隔 24 小時)”。V8 在 V7 條件基礎之上,增加滿足出院標準前三條但核酸仍持續陽性超過 4 周者的情形,并建議通過抗體檢測、病毒培養分離等方法對患者傳染性進行綜合評估后,判斷是否出院。這表明出院條件逐漸地精確和完善。此外 V6、V7 和 V8 增加了詳細的“出院后注意事項”。
在轉運原則方面,主要強調“運送患者應使用專用車輛,并做好運送人員的個人防護和車輛消毒”,在《新型冠狀病毒肺炎病例轉運工作方案》(試行)[30]制定之后,從 V4 開始,主要參照該轉運工作方案。
在醫療機構內感染預防與控制方面,V1 未提及,V2 主要從嚴格執行標準預防、醫學人員個人防護及其他注意事項三個方面來描述。隨著國家相關標準和指南的出臺,V3 主要參照《醫療機構內新型冠狀病毒感染預防與控制技術指南(第一版)》[31],V4~V8 遵照《醫療機構內新型冠狀病毒感染預防與控制技術指南(第一版)》和《新型冠狀病毒肺炎防控中常見醫用防護使用范圍指引(試行)》[32]執行。
V8 新增“護理”部分,為臨床護理工作提供指導,特別是對于重癥患者的護理。此外,V8 還新增“預防”部分,為預防新型冠狀病毒感染提供指導,也是診療方案涉及范圍向前延伸的體現。這些都表明診療方案在不斷地豐富。
2.3 方法有效性驗證
本文從基于文本挖掘的演化方法的應用、結果符合認知規律以及與相關解讀對比三個方面證明方法的有效性。首先,從方法層面,基于文本挖掘的演化方法已經在相關領域得以應用和驗證,如基于文本挖掘的國家科技創新政策的主題分析與演化[22]、在線醫療健康研究的主題演化[23]以及歷年國務院政府工作報告演化[24]等,證明采用文本挖掘來進行診療方案演化分析的可行性。其次,基于本文提出方法的演化分析結果符合認知規律,例如其他版本與第八版相似度逐漸提升,證明對診療方案的認識在不斷加深,符合我們對事物的認知規律。最后,結合新型冠狀病毒肺炎診療方案,基于本文方法的演化分析與專家解讀相對比,結果較為一致。如音銘等[33]基于領域專家視角對新型冠狀病毒肺炎第八版診療方案的變化進行闡述,分析了流行病學特點、病理改變、診斷標準、臨床分型以及治療等部分的變化情況。本文 2.2 部分的相關分析與其一致,證明本文方法的有效性。而且,本文基于定性與定量分析相結合的方式,可以對更細節的變化進行挖掘,如對治療部分的分析,本文從病情確定治療場所,以及一般治療方法、抗病毒治療、免疫治療、糖皮質激素治療和重型危重型的治療方法等方面進行細致分析,同時基于關鍵詞繪制出治療圖譜,為新型冠狀病毒肺炎的臨床治療提供了支持。此外,本文還關注了病原學特點、中醫治療、轉運以及醫療機構內感染預防與控制等方面的變化,分析結果更加全面。
3 總結及建議
整體來講,診療方案發生較大程度改變的時間節點分別處于 V1 與 V2 之間、V3 與 V4 之間以及 V5_1 與 V6 之間。從 V1 到 V2,在各方面都有較多的改動;從 V3 到 V4,在病原學特點、流行病學特點、臨床分型、診斷標準、治療、轉運原則、醫院感染控制方面有較多的改動;從 V5_1 到 V6,在傳播途徑、診斷標準(湖北省內外的區分)、鑒別診斷、中醫治療等方面有較多的改動。在診斷和治療方面,V8 較 V7 增加較多細節,描述得更加詳細,如增加糖皮質激素治療等方法,同時對免疫治療、體外膜肺氧合等方法敘述更加詳盡,說明國家對診療認識的進一步加深。在中醫治療方面,V8 與 V7 版本較為一致,說明目前形成了較為穩定的中醫治療方案。
針對 9 份新型冠狀病毒肺炎診療方案的對比分析結果,本文給出如下建議:
(1)關注新型冠狀病毒肺炎第八版診療方案與其他版本的差異:新型冠狀病毒肺炎診療方案的更新與完善是對新型冠狀病毒肺炎認識不斷加深的體現,每次更新的部分也是發現和認識的重點,如第八版新型冠狀病毒肺炎診療方案與其他版本相比,進一步明確了流行病學特點,完善了病理改變和臨床表現,補充了“重型/危重型高危人群”的判定標準,大幅度修正了治療措施,新增了“預防”相關內容等。這些變化是新發現與新認知的體現,為使用新版診療方案時提供了關注重點,更好地方便臨床等相關人員對新版診療方案的學習和掌握。
(2)充分發揮傳統醫學特色優勢:新型冠狀病毒肺炎診療方案演化中,中西醫診療方案展現出不同特點,現代醫學更加精細,而傳統醫學更加整體化。可以充分融合中西醫優勢,發揮中醫藥治未病、辨證施治、多靶點干預等獨特優勢,特別是在預防和早期階段實時中醫藥介入,提高免疫力。本文識別出麻黃、炙甘草、生石膏與藿香等為疫情防控常用的中藥材,為新型冠狀病毒肺炎疫情防控重點物資保障提供指導,建議關注重點中藥材的市場動態,保障供應與價格穩定。
(3)制定統一的中西醫路徑方案:雖然針對新型冠狀病毒肺炎的診療方案相對穩定,仍需對整個診療方案進行規范化和科學化,形成統一的臨床診療路徑方案。對當前通過中西醫治愈的病例進行歸納總結,針對觀察期、治療期、輕型、初期、中期、重癥期及恢復期分別制定較為統一的中西藥用藥方案,形成規范的中西藥治療路徑。
(4)借助大數據與人工智能等技術優化診療方案:當前新型冠狀病毒肺炎診療方案為統一指導性方案,而臨床實踐中患者層面診療方案可能因患者的特點而不盡相同。在“互聯網+醫療健康”背景下,可借助大數據和人工智能技術,對已治愈病例以及死亡病例進行動態分析與挖掘,發現并提取出更為有效的診療模式,修正臨床診療路徑方案和中藥用藥路徑。同時可基于機器學習推薦算法,依據患者自身實際情況推薦個性化診療方案,以達到更好的診療效果。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。