本研究旨在從國家衛生健康委員會發布的《新型冠狀病毒肺炎診療方案(試行第九版)》重型和危重型藥方中篩選可能對新型冠狀病毒肺炎(COVID-19)有治療作用的活性成分,并通過其與嚴重急性呼吸綜合征冠狀病毒2(SARS-CoV-2)蛋白的相互作用闡釋其作用機制。采用國際ETCM數據庫和SwissADME數據庫篩選3個藥方中25味中藥所含有的活性成分,使用PDB數據庫獲取SARS-CoV-2的4種蛋白質的晶體結構,采用Autodock Vina進行分子對接,使用GROMACS進行分子動力學模擬。分子結合能結果顯示夏姆比奧納、甘草素L、木犀草苷和黃芩苷等44種活性成分與SARS-CoV-2的多個靶點顯示出良好的結合親和力,而分子動力學模擬分析顯示夏姆比奧納與SARS-CoV-2的核衣殼蛋白能夠更緊密地結合并發揮有效的抑制作用。本研究采用現代技術方法對中藥活性成分進行研究,發現夏姆比奧納是SARS-CoV-2核衣殼蛋白的有效抑制劑,為開發新型的抗SARS-CoV-2藥物及其治療方法提供科學的理論依據。
引用本文: 劉明皓, Faez Iqbal Khan, 肖雨晴, 王栩, 胡子然, 賴大坤. 基于分子對接與動力學模擬的用于治療新型冠狀病毒肺炎的中藥活性成分虛擬篩選研究. 生物醫學工程學雜志, 2022, 39(5): 1005-1014. doi: 10.7507/1001-5515.202205021 復制
引言
2019年12月暴發的新型冠狀病毒肺炎(coronavirus disease 2019,COVID-19)因其傳播迅速和癥狀嚴重,引起了各國的強烈重視[1]。世界衛生組織于2020年3月11日宣布新型冠狀病毒肺炎為大流行病[2]。新型冠狀病毒肺炎是由嚴重急性呼吸綜合征冠狀病毒2(severe acute respiratory syndrome coronavirus 2,SARS-CoV-2)引起的,它是一種人畜共患病原體,屬于冠狀病毒科正冠狀病毒亞科的β-冠狀病毒(β-CoV)屬[3]。該病毒最初攻擊呼吸系統并引起咳嗽和發燒等類似流感的癥狀[4],在嚴重的情況下,患者可能會出現急性呼吸窘迫綜合征和呼吸衰竭。此外,新型冠狀病毒肺炎還可引起全身炎癥和急性心臟損害,導致危重患者出現心律失常、心力衰竭和多器官功能障礙[5]。
新型冠狀病毒肺炎暴發后,國家衛生健康委員會及時發布了《新型冠狀病毒肺炎診療方案》,截止2022年3月15日已更新到試行第九版。在COVID-19治療的過程中,中醫藥參與了全程治療并發揮了顯著作用。2022年3月31日,世界衛生組織發布的報告[6]中指出:“中藥能有效治療COVID-19,減少輕型、普通型病例轉為重癥,縮短病毒清除時間,改善輕型和普通型患者的臨床預后”。納入COVID-19治療的中藥有血必凈、痰熱清、熱毒寧、喜炎平等。中藥的藥方往往含有多種草藥,而每種草藥又含有多種活性分子,活性成分的研究對治療COVID-19有一定的參考意義。中藥的作用主要是增強抵抗力,然而當前中藥治療新型冠狀病毒肺炎的具體藥理機制還不十分清楚。以往研究表明,中藥活性成分可以通過結合病毒蛋白活性部位抑制病毒活性[7],這為研究中藥治療新型冠狀病毒肺炎的具體藥理機制帶來了新見解。目前針對中藥活性分子與SARS-CoV-2蛋白相互作用的研究大多聚集于分子對接,然而分子對接在復雜情況下有較大的誤差,從而會影響結果的準確性。分子動力學模擬作為分子對接的有效補充,有利于提高結果的準確性,從更深層次揭示相互作用的機制。
為了開發新型且有用的抗新型冠狀病毒療法,了解該病毒的發病機制非常重要。已有研究顯示,SARS-CoV-2的RNA基因組編碼29種病毒蛋白[8],包括結構蛋白和非結構蛋白。結構蛋白包括刺突蛋白(S蛋白)、包膜蛋白(E蛋白)、膜蛋白(M蛋白)、核衣殼蛋白(N蛋白)等,非結構蛋白包括RNA依賴性的RNA聚合酶(RNA-dependent RNA polymerase, RDRP)和其他輔助蛋白[9]。其中,考慮到S蛋白、E蛋白、M蛋白和N蛋白起到了維持病毒結構的功能,RDRP在病毒復制過程中起到關鍵作用,因此被納入本研究的對接分析中,作為活性分子對接的受體。本研究圍繞《新型冠狀病毒肺炎診療方案(試行第九版)》[10]中的中草藥方,采用包括分子對接、分子動力學模擬的計算機藥物設計方法[11-12]篩選出其中的藥物活性成分,同時探討其對SARS-CoV-2可能的作用靶點和潛在的作用機制,為開發新型且有用的抗新型冠狀病毒藥物及其治療方法提供科學的理論依據。
1 材料與方法
本研究采用計算機輔助藥物設計方法,主要包括數據挖掘與建模、分子對接、分子動力學模擬等步驟,以及藥物相似性評估和吉布斯自由能(Gibbs free energy,GFE)景觀表達,如圖1所示。

1.1 數據挖掘與建模
處方來源:國家衛生健康委員會發布的《新型冠狀病毒肺炎診療方案(試行第九版)》[10]。本研究選取了重型治療中“疫毒閉肺證”“氣營兩燔證”和危重型治療中“內閉外脫證”的3個處方。“疫毒閉肺證”的處方組成:生麻黃6 g、杏仁9 g、生石膏15 g、甘草3 g、藿香10 g、厚樸10 g、蒼術15 g、草果10 g、法半夏9 g、茯苓15 g、生大黃5 g、生黃芪10 g、葶藶子10 g、赤芍10 g。“氣營兩燔證”的處方組成:生石膏30 g、知母30 g、生地30 g、水牛角30 g、赤芍30 g、玄參30 g、連翹15 g、丹皮15 g、黃連6 g、竹葉12 g、葶藶子15 g、生甘草6 g。“內閉外脫證”的處方組成:人參15 g、黑順片10 g、山茱萸15 g。其中,生麻黃、法半夏、生大黃、生甘草、生地、竹葉、丹皮、黑順片分別以“麻黃”“半夏”“大黃”“甘草”“地黃”“淡竹葉”“牡丹皮”“附子”為名查詢。從上述藥方中共提取出25味草藥,通過檢索ETCM(http://www.tcmip.cn/ETCM/)25味草藥的藥名查詢活性成分。查詢PubChem(https://pubchem.ncbi.nlm.nih.gov/)下載其結構式,以.sdf的格式保存(檢索日期:2022年3月20日)。
從RCSB蛋白質數據庫(PDB)(http://www.rcsb.org/)下載3CL蛋白(PDB ID:7BRO,分辨率為2.00 ?,與水分子結合)[13]、核衣殼蛋白N-末端RNA結合結構域(N-terminal domain,NTD)(PDB ID:6M3M,分辨率為2.70 ?)[14]、前融合構象刺突蛋白(PDB ID:7AD1,分辨率為2.92 ?)[15]和RDRP(PDB ID:7D4F,分辨率為2.57 ?,與蘇拉明結合)[16]的結構。使用Autodock Vina[11]分別制備四種蛋白質[3CL、N (NTD)、S和RDRP]用于對接的結構,其中包括氫的添加和水的去除。使用Chimera軟件[17]進行結構的最小化。使用shell腳本實現每種蛋白質與所有天然化合物的對接。
1.2 分子對接
分子對接是從大分子(受體)和小分子(配體)的未結合結構或同源建模中獲得的結構開始,目標是它們的結合構象和結合親和力。分子對接是結構藥物設計方法中的一部分,該技術廣泛用于藥物的篩選和鑒定。本研究使用AutoDock Vina[11]對44種活性分子與3CL蛋白、N蛋白、S蛋白和RDRP進行分子對接。根據結合能以及活性成分的正確方向選擇每個活性分子的最佳對接取向[17]。
1.3 分子動力學模擬
分子動力學模擬是生物分子計算研究最重要的工具之一,可用于計算分子系統的時間依賴性行為,并提供蛋白質波動和構象變化的綜合信息。該方法普遍應用于研究生物系統中發生的復雜動態過程,包括蛋白質折疊與穩定性、構象變化和藥物設計等。根據實驗所得結果,使用GROMACS 2018.2[18]對SARS-CoV-2 N蛋白和N蛋白-夏姆比奧納復合物執行分子動力學模擬。添加了合理數量的Na+和Cl?離子以保持系統的中性,并實現了100 ns的最終生成階段。基本動力學提取蛋白質的相關運動,以了解對蛋白質活性最重要的運動。通過協方差矩陣C的對角化估計SARS-CoV-2 N蛋白和N蛋白-夏姆比奧納復合物的主成分分析:
![]() |
式中,ri表示第i個Cα原子的笛卡爾坐標,N表示Cα原子的數量,<ri>表示所有配置的時間平均值[19-21]。
吉布斯自由能景觀可表明蛋白質分子的構象變化[22]。為了獲得二維和三維的圖像,將SARS-CoV-2 N蛋白和N蛋白-夏姆比奧納復合物的吉布斯自由能景觀投影到PC1和PC2上。
![]() |
式中,kB代表玻爾茲曼常數,T代表溫度,P(PC1,PC2)代表歸一化聯合概率分布。
1.4 藥物相似性評估
通過Lipinski過濾器評估活性分子的藥物相似性[23]。根據實驗所得結果,通過估計藥代動力學參數以分析夏姆比奧納、甘草素L、木犀草苷和黃芩苷的吸收、分布、代謝和排泄(absorption,distribution,metabolism,excretion and toxicity,ADMET)特性和毒性。使用SwissADME [24]、CarcinoPred-EL[25]和PreADMET服務器分別預測了ADMET、致癌性和毒性。
2 結果
2.1 中藥活性成分的虛擬篩選
通過對上述中藥藥方的分析,我們共提取出1 043種活性成分。將以上活性成分作為配體,分別與3CL蛋白、N蛋白、S蛋白和RDRP為受體進行分子對接。選取打分最高的構象作為對接構象,選取作用明確的RDRP抑制劑作為對照,選取兩個及以上對接結果好于瑞德西韋的活性成分作為分子對接結果,得到44種可能具有抗SARS-CoV-2活性的中藥活性成分,結果如表1所示。

表1所示的44種中藥活性成分的分子對接分析結果顯示,對接排名前四名為夏姆比奧納、甘草素L、木犀草苷和黃芩苷。與3CL蛋白結合能最高的前五種活性成分的分子分別為夏姆比奧納、木犀草苷、靛玉紅、β-胡蘿卜素和大黃酸;與N蛋白結合能最高的前五種活性成分的分子分別為夏姆比奧納、甘草異黃烷酮、β-胡蘿卜素、黃芩苷和鵝去氧膽酸;與S蛋白結合能最高的前五種活性成分的分子分別為黃芩苷、夏姆比奧納、木犀草苷、甘草素L和漢黃芩苷;與RDRP結合能最高的前五種活性成分的分子分別為靛藍、蘆丁、夏姆比奧納、甘草素L和木犀草苷。由于夏姆比奧納對SARS-CoV-2的3CL、N、S和RDRP蛋白顯示出最高的結合能,因此本研究進一步選取夏姆比奧納進行詳細的分子對接和分子動力學模擬分析。
2.2 夏姆比奧納與 3CL、N、S 蛋白和 RDRP 的分子對接分析
夏姆比奧納與3CL、N、S 蛋白和RDRP的分子對接結果如圖2所示。夏姆比奧納與3CL蛋白的結合能為–8.3 kcal/mol。它與殘基Phe294和Ile249具有π-σ鍵,還與殘基Pro252、Leu253、Pro293和Val297等產生范德華力相互作用。已有研究表明3CL蛋白的結構域Ⅲ(殘基201-301)具有催化活性[26],因此夏姆比奧納有可能通過抑制催化活性發揮一定的抑制作用。夏姆比奧納與N蛋白的N端RNA結合域強烈結合,結合能為–11.2 kcal/mol。在N蛋白中,由于N端RNA結合域對于病毒的復制等生理過程具有重要作用,因此該分子有可能通過抑制RNA的釋放發揮相應的抑制作用[27]。夏姆比奧納與S蛋白的結合能為–9.6 kcal/mol。它與殘基Pro322具有π-烷基鍵,顯示了酰胺-π與Phe321的疊加相互作用以及與Thr319、Val320、Pro323、Arg349和Pro461的范德華力相互作用。結構和生化分析確定SARS-CoV-2的S1亞基C末端結構域的211個氨基酸區域(第319-529位氨基酸)為RBD(受體結合域),它在病毒進入中具有關鍵作用,是結合抗體的靶標。RBM介導與ACE2受體(SARS-CoV-2 S蛋白的437-507位氨基酸)的接觸[28]。因此該分子有可能通過抑制RBD與ACE2受體結合發揮一定的抑制作用。夏姆比奧納以–8.5 kcal/mol的結合能與RDRP結合。它與Gln762、Gly769、Ile770、Glu773等發生范德華力相互作用。RDRP的核心域位于殘基397-581、621-679和819-920,其中殘基Asp760、Ser759和Asp761與RNA結合[29],揭示了該分子有可能通過抑制RNA的復制發揮相應的抑制作用。

該結構分別表明與3CL蛋白、N蛋白、RDRP和S蛋白中不同殘基的相互作用
Figure2. The molecular docking of xambioona into 3CL protein, N protein, RDRP, and S protein, respectivelythe structure indicated different residual interactions in 3CL-xambioona, N-xambioona, RDRP-xambioona, and S-xambioona, respectively
2.3 夏姆比奧納和N蛋白-夏姆比奧納復合物的分子動力學模擬分析
分子對接分析結果顯示,夏姆比奧納對SARS-CoV-2的N蛋白具有最高的結合能。因此,選擇夏姆比奧納與N蛋白進行進一步的分子動力學模擬。
2.3.1 結構動力學和結構分析
通過測量均方根(root mean square,RMS)分布和RMS波動來探究N蛋白和N蛋白-夏姆比奧納復合物的結構動力學,結構偏差由RMS分布、RMS波動,以及在主成分分析期間計算的RMS波動得出(見圖3)。本組結果顯示,當夏姆比奧納與N蛋白的天然構象結合時,其結構偏離天然構象的程度較小。由此可得,在這種情況下,夏姆比奧納與N蛋白的結合是穩定的。

a-c分別代表RMS分布、RMS波動和主成分分析期間計算的RMS波動,vec 1和vec 2表示主成分分析提取出的2個向量,紅色和黑色分別代表N蛋白和N蛋白-夏姆比奧納復合物;d-e分別代表N蛋白和N蛋白-夏姆比奧納復合物在主成分分析期間計算的RMS波動,紅色、綠色、藍色和黑色分別表示
a-c represent the RMS distribution, RMS fluctuations, and RMS fluctuations calculated during principal component analysis, respectively, vec1 and vec2 represent the two vectors extracted by principal component analysis, and red and black color represent values calculated for N protein and N-xambioona complex, respectively. Further eigen-components were resolved in total (black),
結構分析發現N蛋白和N蛋白-夏姆比奧納復合物的體積分別為46.79 nm3和47.47 nm3,平均密度分別為966.71 g/L和952.73 g/L。在結合夏姆比奧納后,N蛋白的平均體積略有增加而密度降低。此外,在分子動力學模擬過程中,在0.35 nm內配對的SARS-CoV-2的N蛋白和N蛋白-夏姆比奧納復合物的主鏈和側鏈之間的氫鍵總數分別為104和97;在100 ns分子動力學模擬期間,夏姆比奧納傾向于與N蛋白形成3~4個氫鍵,N蛋白-夏姆比奧納復合物的主鏈和側鏈之間的氫鍵減少。該結果表明,N蛋白被夏姆比奧納的結合抑制,與夏姆比奧納的強結合導致N蛋白的展開。
溶劑可及表面積(solvent accessible surface area,SASA)指溶劑可接觸的生物分子表面積。SARS-CoV-2的N蛋白和N蛋白-夏姆比奧納復合物的平均SASA值估計分別為132.35 nm2和137.75 nm2。這清楚地顯示了夏姆比奧納與N蛋白的結合增加了SASA,這種結合導致蛋白質核心中存在的氨基酸殘基暴露,間接表明了夏姆比奧納與N蛋白的強結合。SARS-CoV-2的N蛋白和N蛋白-夏姆比奧納復合物的自由溶劑化能分別為247.58 kJ/(mol·nm?2)和256.37 kJ/(mol·nm?2),顯示N蛋白-夏姆比奧納復合物比N蛋白具有更多的溶劑化自由能。
2.3.2 二級結構構象
N蛋白與夏姆比奧納的結合會導致N蛋白的結構偏差,分析二級結構構象可用于鑒定蛋白質的結構特性,進一步闡明二者的結構差異。當夏姆比奧納與N蛋白結合時,二級結構發生了輕微變化(見圖4)。表2比較了參與SARS-CoV-2的N蛋白和N蛋白-夏姆比奧納復合物二級結構形成的平均殘基數占比。N蛋白的平均結構、卷曲、β-折疊、β-橋、彎曲和轉角分別為39%、40%、23%、4%、20%和12%,而N蛋白-夏姆比奧納復合物的上述參數則別為40%、40%、23%、6%、18%和10%。兩者在β橋、彎曲、轉角和5-螺旋區域顯示出輕微差異。


2.3.3 吉布斯自由能景觀
吉布斯自由能景觀顯示出SARS-CoV-2的N蛋白和N蛋白-夏姆比奧納復合物構象與能量的關系(見圖5)。深藍色的構象能量輪廓表示蛋白質的較低能量構象狀態,構象從深藍色到淺藍色的轉變表明蛋白質構象的轉變在熱力學上不太有利。N蛋白全局能量最小區域中的自由能態具有尖銳的單一低能態。當夏姆比奧納與N蛋白結合時,自由能全局最小值的自由取向發生了變化。這些不同的吉布斯自由能景觀是由于夏姆比奧納與N蛋白的結合而產生的不同構象。

2.4 藥物相似性分析
毒性和較差的藥代動力學特性是導致藥物在臨床試驗中失敗的主要原因,可用藥代動力學特征和類藥五原則規則區分非藥物分子和類似藥物分子。表1結果顯示,對接排名前四名為夏姆比奧納、甘草素L、木犀草苷和黃芩苷。表3展示了夏姆比奧納、甘草素L、木犀草苷和黃芩苷的Lipinski過濾器和ADMET特性。夏姆比奧納和甘草素L表現出了類似藥物的良好特性,如質量(< 500 Da)、親脂性(LogP < 5)、氫鍵供體(< 5)、氫鍵受體(< 10)和摩爾折射率(40~130)等。

3 討論
作為一種全球性流行病,COVID-19正在世界各地肆虐,但迄今為止尚無療效明顯的藥物上市。COVID-19在我國傳統醫學中屬于“疫病”,史籍記載的防治方法歷史悠久、手段豐富,因此利用我國傳統的中醫藥資源意義重大。在多輪疫情中,中醫藥在治療COVID-19感染、減輕COVID-19并發癥中發揮了重要作用,有效減少了致死率。中藥方成分復雜,對中藥活性成分的鑒別和篩選有助于闡明中藥發揮治療作用的機制,對于治療COVID-19具有重要意義。
《新型冠狀病毒肺炎診療方案》是由國家衛生健康委員會發布的COVID-19治療指南,具有極強的參考價值。針對COVID-19相對于以往疫病的特殊性,診療方案提出了一些新的處方專門應用于COVID-19的治療,因此研究這些新提出的處方具有一定的現實意義。本研究選取了重型治療中“疫毒閉肺證”“氣營兩燔證”和危重型治療中“內閉外脫證”的3個處方,從中提取出有效成分,通過使用分子對接和分子動力學模擬等幾種計算方法,篩選出44種可能對SARS-CoV-2有抑制作用的中藥活性成分,并確定了一種理論上有效的COVID-19抑制劑夏姆比奧納。
S蛋白的S1結構域與其宿主受體(ACE2)之間的初始相互作用以及隨后的S2片段介導的宿主和病毒膜融合使RNA基因組進入宿主細胞[30]。N蛋白在結構上與病毒核酸結合,參與病毒復制周期過程和宿主細胞對病毒感染的細胞反應[29]。N蛋白NTD結構域的RNA結合活性對于SARS-CoV-2的RNP的形成和基因組復制是必不可少的。3CL蛋白參與了前體多蛋白的大部分成熟切割[31]。RDRP是RNA合成的活性中心[32],結構上保守的RDRP核心和相關基序對于RNA催化功能是必不可少的。由于上述蛋白質對SARS-CoV-2的生理過程和致病機制至關重要,因此針對上述蛋白質研發或篩選藥物分子被認為是開發抗病毒藥物的良好策略。
在44種可能對SARS-CoV-2有抑制作用的中藥活性成分中,結合能排名前四位的分別為夏姆比奧納、甘草素L、木犀草苷和黃芩苷,其結合能均普遍高于臨床上推薦的抗SARS-CoV-2藥物瑞德西韋,表明其與SARS-CoV-2的主要蛋白結合能力較強,可能以抑制主要蛋白功能的方式發揮抗病毒作用。在44個活性分子的對接結果之中,夏姆比奧納與SARS-CoV-2的S蛋白、3CL蛋白、N蛋白和RDRP都具有最高的結合能。夏姆比奧納為甘草的活性成分之一,但以往對該活性成分的研究極少,其生理作用和具體的作用機制均不明確。本研究從分子對接和分子動力學模擬的角度,分析了夏姆比奧納與SARS-CoV-2主要蛋白的相互作用,揭示了夏姆比奧納抗病毒的可能機制。
隨著分子建模、分子對接和分子動力學模擬等各種計算機方法的快速發展,現代計算機手段為探究中醫藥的科學基礎提供了新的策略。考慮到分子對接在復雜情形下有較大的誤差,本研究引入了分子動力學模擬的方法。分子動力學模擬將配體與受體放入體系中,模擬自然狀態下兩者的結合。分子動力學模擬能夠從原子層面給出體系的微觀演變過程,直觀地展示實驗現象發生的機制與規律,在研究配體-受體結合的機制方面具有很大優勢。分子動力學模擬結果表明,夏姆比奧納與N蛋白產生了較強的結合模式,并可能通過核心氨基酸暴露的方式發揮抑制作用。分子動力學模擬的結果進一步佐證了分子對接中夏姆比奧納和N蛋白緊密結合的分析。為了確認篩選出的活性成分可以被用作藥物,本研究還進行了藥物相似性分析。結果表明,夏姆比奧納的LogP值約為5.8,甘草素L約為3.6。因此,夏姆比奧納和甘草素L更可能被較好吸收。此外,夏姆比奧納和甘草素L遵循類藥五原則的所有特性,使其成為藥物相似分子。
綜上所述,此前對中藥的研究主要集中在免疫學和網絡藥理學。探索中藥活性小分子與SARS-CoV-2蛋白相互作用可能性的嘗試,可以為COVID-19的治療帶來新的見解。分子對接分析表明,夏姆比奧納對N蛋白具有最高的結合能(–11.2 kcal/mol)。分子動力學模擬研究表明,夏姆比奧納的結合在很大程度上導致了N蛋白的展開。除了夏姆比奧納,甘草素L、木犀草苷、黃芩苷也顯示出良好的結合能,但只有甘草素L鑒定為藥物樣分子。因此,這是一種基于計算篩選、分子對接和分子動力學模擬的理性計算預測,以確定一種精確靶向SARS-CoV-2的新型抑制劑。
4 結論
針對SARS-CoV-2病毒,本研究采用計算機輔助藥物設計方法虛擬篩選和研究了25種中草藥,發現夏姆比奧納、甘草素L、木犀草苷和黃芩苷等四種活性分子與SARS-CoV-2的多個靶點具有很強的結合親和力。其中,特別發現夏姆比奧納與N蛋白的結合能最高,其相應的分子動力學模擬研究結果顯示,夏姆比奧納與SARS-CoV-2的N蛋白緊密結合,這表明夏姆比奧納可能是SARS-CoV-2核衣殼蛋白的潛在良好抑制劑。綜上所述,本研究對多種中草藥物與SARS-CoV-2的結合進行了詳細的計算和分析,發現了夏姆比奧納這一具有潛在價值的中草藥活性成分或可用于合成一種精確靶向SARS-CoV-2的新型抑制劑,然而本研究相關結果的最終應用還有待于后續大量的實驗室研究和適當的臨床試驗評估。
重要聲明
利益沖突聲明: 本文全體作者均聲明不存在利益沖突。
作者貢獻聲明: 本研究數據挖掘與建模、分子對接、分子動力學模擬由劉明皓、Faez Iqbal Khan、肖雨晴、王栩共同完成,論文寫作與修改由劉明皓、Faez Iqbal Khan、胡子然完成,賴大坤教授承擔本研究工作的總體指導。劉明皓和Faez Iqbal Khan兩位作者貢獻相同。
引言
2019年12月暴發的新型冠狀病毒肺炎(coronavirus disease 2019,COVID-19)因其傳播迅速和癥狀嚴重,引起了各國的強烈重視[1]。世界衛生組織于2020年3月11日宣布新型冠狀病毒肺炎為大流行病[2]。新型冠狀病毒肺炎是由嚴重急性呼吸綜合征冠狀病毒2(severe acute respiratory syndrome coronavirus 2,SARS-CoV-2)引起的,它是一種人畜共患病原體,屬于冠狀病毒科正冠狀病毒亞科的β-冠狀病毒(β-CoV)屬[3]。該病毒最初攻擊呼吸系統并引起咳嗽和發燒等類似流感的癥狀[4],在嚴重的情況下,患者可能會出現急性呼吸窘迫綜合征和呼吸衰竭。此外,新型冠狀病毒肺炎還可引起全身炎癥和急性心臟損害,導致危重患者出現心律失常、心力衰竭和多器官功能障礙[5]。
新型冠狀病毒肺炎暴發后,國家衛生健康委員會及時發布了《新型冠狀病毒肺炎診療方案》,截止2022年3月15日已更新到試行第九版。在COVID-19治療的過程中,中醫藥參與了全程治療并發揮了顯著作用。2022年3月31日,世界衛生組織發布的報告[6]中指出:“中藥能有效治療COVID-19,減少輕型、普通型病例轉為重癥,縮短病毒清除時間,改善輕型和普通型患者的臨床預后”。納入COVID-19治療的中藥有血必凈、痰熱清、熱毒寧、喜炎平等。中藥的藥方往往含有多種草藥,而每種草藥又含有多種活性分子,活性成分的研究對治療COVID-19有一定的參考意義。中藥的作用主要是增強抵抗力,然而當前中藥治療新型冠狀病毒肺炎的具體藥理機制還不十分清楚。以往研究表明,中藥活性成分可以通過結合病毒蛋白活性部位抑制病毒活性[7],這為研究中藥治療新型冠狀病毒肺炎的具體藥理機制帶來了新見解。目前針對中藥活性分子與SARS-CoV-2蛋白相互作用的研究大多聚集于分子對接,然而分子對接在復雜情況下有較大的誤差,從而會影響結果的準確性。分子動力學模擬作為分子對接的有效補充,有利于提高結果的準確性,從更深層次揭示相互作用的機制。
為了開發新型且有用的抗新型冠狀病毒療法,了解該病毒的發病機制非常重要。已有研究顯示,SARS-CoV-2的RNA基因組編碼29種病毒蛋白[8],包括結構蛋白和非結構蛋白。結構蛋白包括刺突蛋白(S蛋白)、包膜蛋白(E蛋白)、膜蛋白(M蛋白)、核衣殼蛋白(N蛋白)等,非結構蛋白包括RNA依賴性的RNA聚合酶(RNA-dependent RNA polymerase, RDRP)和其他輔助蛋白[9]。其中,考慮到S蛋白、E蛋白、M蛋白和N蛋白起到了維持病毒結構的功能,RDRP在病毒復制過程中起到關鍵作用,因此被納入本研究的對接分析中,作為活性分子對接的受體。本研究圍繞《新型冠狀病毒肺炎診療方案(試行第九版)》[10]中的中草藥方,采用包括分子對接、分子動力學模擬的計算機藥物設計方法[11-12]篩選出其中的藥物活性成分,同時探討其對SARS-CoV-2可能的作用靶點和潛在的作用機制,為開發新型且有用的抗新型冠狀病毒藥物及其治療方法提供科學的理論依據。
1 材料與方法
本研究采用計算機輔助藥物設計方法,主要包括數據挖掘與建模、分子對接、分子動力學模擬等步驟,以及藥物相似性評估和吉布斯自由能(Gibbs free energy,GFE)景觀表達,如圖1所示。

1.1 數據挖掘與建模
處方來源:國家衛生健康委員會發布的《新型冠狀病毒肺炎診療方案(試行第九版)》[10]。本研究選取了重型治療中“疫毒閉肺證”“氣營兩燔證”和危重型治療中“內閉外脫證”的3個處方。“疫毒閉肺證”的處方組成:生麻黃6 g、杏仁9 g、生石膏15 g、甘草3 g、藿香10 g、厚樸10 g、蒼術15 g、草果10 g、法半夏9 g、茯苓15 g、生大黃5 g、生黃芪10 g、葶藶子10 g、赤芍10 g。“氣營兩燔證”的處方組成:生石膏30 g、知母30 g、生地30 g、水牛角30 g、赤芍30 g、玄參30 g、連翹15 g、丹皮15 g、黃連6 g、竹葉12 g、葶藶子15 g、生甘草6 g。“內閉外脫證”的處方組成:人參15 g、黑順片10 g、山茱萸15 g。其中,生麻黃、法半夏、生大黃、生甘草、生地、竹葉、丹皮、黑順片分別以“麻黃”“半夏”“大黃”“甘草”“地黃”“淡竹葉”“牡丹皮”“附子”為名查詢。從上述藥方中共提取出25味草藥,通過檢索ETCM(http://www.tcmip.cn/ETCM/)25味草藥的藥名查詢活性成分。查詢PubChem(https://pubchem.ncbi.nlm.nih.gov/)下載其結構式,以.sdf的格式保存(檢索日期:2022年3月20日)。
從RCSB蛋白質數據庫(PDB)(http://www.rcsb.org/)下載3CL蛋白(PDB ID:7BRO,分辨率為2.00 ?,與水分子結合)[13]、核衣殼蛋白N-末端RNA結合結構域(N-terminal domain,NTD)(PDB ID:6M3M,分辨率為2.70 ?)[14]、前融合構象刺突蛋白(PDB ID:7AD1,分辨率為2.92 ?)[15]和RDRP(PDB ID:7D4F,分辨率為2.57 ?,與蘇拉明結合)[16]的結構。使用Autodock Vina[11]分別制備四種蛋白質[3CL、N (NTD)、S和RDRP]用于對接的結構,其中包括氫的添加和水的去除。使用Chimera軟件[17]進行結構的最小化。使用shell腳本實現每種蛋白質與所有天然化合物的對接。
1.2 分子對接
分子對接是從大分子(受體)和小分子(配體)的未結合結構或同源建模中獲得的結構開始,目標是它們的結合構象和結合親和力。分子對接是結構藥物設計方法中的一部分,該技術廣泛用于藥物的篩選和鑒定。本研究使用AutoDock Vina[11]對44種活性分子與3CL蛋白、N蛋白、S蛋白和RDRP進行分子對接。根據結合能以及活性成分的正確方向選擇每個活性分子的最佳對接取向[17]。
1.3 分子動力學模擬
分子動力學模擬是生物分子計算研究最重要的工具之一,可用于計算分子系統的時間依賴性行為,并提供蛋白質波動和構象變化的綜合信息。該方法普遍應用于研究生物系統中發生的復雜動態過程,包括蛋白質折疊與穩定性、構象變化和藥物設計等。根據實驗所得結果,使用GROMACS 2018.2[18]對SARS-CoV-2 N蛋白和N蛋白-夏姆比奧納復合物執行分子動力學模擬。添加了合理數量的Na+和Cl?離子以保持系統的中性,并實現了100 ns的最終生成階段。基本動力學提取蛋白質的相關運動,以了解對蛋白質活性最重要的運動。通過協方差矩陣C的對角化估計SARS-CoV-2 N蛋白和N蛋白-夏姆比奧納復合物的主成分分析:
![]() |
式中,ri表示第i個Cα原子的笛卡爾坐標,N表示Cα原子的數量,<ri>表示所有配置的時間平均值[19-21]。
吉布斯自由能景觀可表明蛋白質分子的構象變化[22]。為了獲得二維和三維的圖像,將SARS-CoV-2 N蛋白和N蛋白-夏姆比奧納復合物的吉布斯自由能景觀投影到PC1和PC2上。
![]() |
式中,kB代表玻爾茲曼常數,T代表溫度,P(PC1,PC2)代表歸一化聯合概率分布。
1.4 藥物相似性評估
通過Lipinski過濾器評估活性分子的藥物相似性[23]。根據實驗所得結果,通過估計藥代動力學參數以分析夏姆比奧納、甘草素L、木犀草苷和黃芩苷的吸收、分布、代謝和排泄(absorption,distribution,metabolism,excretion and toxicity,ADMET)特性和毒性。使用SwissADME [24]、CarcinoPred-EL[25]和PreADMET服務器分別預測了ADMET、致癌性和毒性。
2 結果
2.1 中藥活性成分的虛擬篩選
通過對上述中藥藥方的分析,我們共提取出1 043種活性成分。將以上活性成分作為配體,分別與3CL蛋白、N蛋白、S蛋白和RDRP為受體進行分子對接。選取打分最高的構象作為對接構象,選取作用明確的RDRP抑制劑作為對照,選取兩個及以上對接結果好于瑞德西韋的活性成分作為分子對接結果,得到44種可能具有抗SARS-CoV-2活性的中藥活性成分,結果如表1所示。

表1所示的44種中藥活性成分的分子對接分析結果顯示,對接排名前四名為夏姆比奧納、甘草素L、木犀草苷和黃芩苷。與3CL蛋白結合能最高的前五種活性成分的分子分別為夏姆比奧納、木犀草苷、靛玉紅、β-胡蘿卜素和大黃酸;與N蛋白結合能最高的前五種活性成分的分子分別為夏姆比奧納、甘草異黃烷酮、β-胡蘿卜素、黃芩苷和鵝去氧膽酸;與S蛋白結合能最高的前五種活性成分的分子分別為黃芩苷、夏姆比奧納、木犀草苷、甘草素L和漢黃芩苷;與RDRP結合能最高的前五種活性成分的分子分別為靛藍、蘆丁、夏姆比奧納、甘草素L和木犀草苷。由于夏姆比奧納對SARS-CoV-2的3CL、N、S和RDRP蛋白顯示出最高的結合能,因此本研究進一步選取夏姆比奧納進行詳細的分子對接和分子動力學模擬分析。
2.2 夏姆比奧納與 3CL、N、S 蛋白和 RDRP 的分子對接分析
夏姆比奧納與3CL、N、S 蛋白和RDRP的分子對接結果如圖2所示。夏姆比奧納與3CL蛋白的結合能為–8.3 kcal/mol。它與殘基Phe294和Ile249具有π-σ鍵,還與殘基Pro252、Leu253、Pro293和Val297等產生范德華力相互作用。已有研究表明3CL蛋白的結構域Ⅲ(殘基201-301)具有催化活性[26],因此夏姆比奧納有可能通過抑制催化活性發揮一定的抑制作用。夏姆比奧納與N蛋白的N端RNA結合域強烈結合,結合能為–11.2 kcal/mol。在N蛋白中,由于N端RNA結合域對于病毒的復制等生理過程具有重要作用,因此該分子有可能通過抑制RNA的釋放發揮相應的抑制作用[27]。夏姆比奧納與S蛋白的結合能為–9.6 kcal/mol。它與殘基Pro322具有π-烷基鍵,顯示了酰胺-π與Phe321的疊加相互作用以及與Thr319、Val320、Pro323、Arg349和Pro461的范德華力相互作用。結構和生化分析確定SARS-CoV-2的S1亞基C末端結構域的211個氨基酸區域(第319-529位氨基酸)為RBD(受體結合域),它在病毒進入中具有關鍵作用,是結合抗體的靶標。RBM介導與ACE2受體(SARS-CoV-2 S蛋白的437-507位氨基酸)的接觸[28]。因此該分子有可能通過抑制RBD與ACE2受體結合發揮一定的抑制作用。夏姆比奧納以–8.5 kcal/mol的結合能與RDRP結合。它與Gln762、Gly769、Ile770、Glu773等發生范德華力相互作用。RDRP的核心域位于殘基397-581、621-679和819-920,其中殘基Asp760、Ser759和Asp761與RNA結合[29],揭示了該分子有可能通過抑制RNA的復制發揮相應的抑制作用。

該結構分別表明與3CL蛋白、N蛋白、RDRP和S蛋白中不同殘基的相互作用
Figure2. The molecular docking of xambioona into 3CL protein, N protein, RDRP, and S protein, respectivelythe structure indicated different residual interactions in 3CL-xambioona, N-xambioona, RDRP-xambioona, and S-xambioona, respectively
2.3 夏姆比奧納和N蛋白-夏姆比奧納復合物的分子動力學模擬分析
分子對接分析結果顯示,夏姆比奧納對SARS-CoV-2的N蛋白具有最高的結合能。因此,選擇夏姆比奧納與N蛋白進行進一步的分子動力學模擬。
2.3.1 結構動力學和結構分析
通過測量均方根(root mean square,RMS)分布和RMS波動來探究N蛋白和N蛋白-夏姆比奧納復合物的結構動力學,結構偏差由RMS分布、RMS波動,以及在主成分分析期間計算的RMS波動得出(見圖3)。本組結果顯示,當夏姆比奧納與N蛋白的天然構象結合時,其結構偏離天然構象的程度較小。由此可得,在這種情況下,夏姆比奧納與N蛋白的結合是穩定的。

a-c分別代表RMS分布、RMS波動和主成分分析期間計算的RMS波動,vec 1和vec 2表示主成分分析提取出的2個向量,紅色和黑色分別代表N蛋白和N蛋白-夏姆比奧納復合物;d-e分別代表N蛋白和N蛋白-夏姆比奧納復合物在主成分分析期間計算的RMS波動,紅色、綠色、藍色和黑色分別表示
a-c represent the RMS distribution, RMS fluctuations, and RMS fluctuations calculated during principal component analysis, respectively, vec1 and vec2 represent the two vectors extracted by principal component analysis, and red and black color represent values calculated for N protein and N-xambioona complex, respectively. Further eigen-components were resolved in total (black),
結構分析發現N蛋白和N蛋白-夏姆比奧納復合物的體積分別為46.79 nm3和47.47 nm3,平均密度分別為966.71 g/L和952.73 g/L。在結合夏姆比奧納后,N蛋白的平均體積略有增加而密度降低。此外,在分子動力學模擬過程中,在0.35 nm內配對的SARS-CoV-2的N蛋白和N蛋白-夏姆比奧納復合物的主鏈和側鏈之間的氫鍵總數分別為104和97;在100 ns分子動力學模擬期間,夏姆比奧納傾向于與N蛋白形成3~4個氫鍵,N蛋白-夏姆比奧納復合物的主鏈和側鏈之間的氫鍵減少。該結果表明,N蛋白被夏姆比奧納的結合抑制,與夏姆比奧納的強結合導致N蛋白的展開。
溶劑可及表面積(solvent accessible surface area,SASA)指溶劑可接觸的生物分子表面積。SARS-CoV-2的N蛋白和N蛋白-夏姆比奧納復合物的平均SASA值估計分別為132.35 nm2和137.75 nm2。這清楚地顯示了夏姆比奧納與N蛋白的結合增加了SASA,這種結合導致蛋白質核心中存在的氨基酸殘基暴露,間接表明了夏姆比奧納與N蛋白的強結合。SARS-CoV-2的N蛋白和N蛋白-夏姆比奧納復合物的自由溶劑化能分別為247.58 kJ/(mol·nm?2)和256.37 kJ/(mol·nm?2),顯示N蛋白-夏姆比奧納復合物比N蛋白具有更多的溶劑化自由能。
2.3.2 二級結構構象
N蛋白與夏姆比奧納的結合會導致N蛋白的結構偏差,分析二級結構構象可用于鑒定蛋白質的結構特性,進一步闡明二者的結構差異。當夏姆比奧納與N蛋白結合時,二級結構發生了輕微變化(見圖4)。表2比較了參與SARS-CoV-2的N蛋白和N蛋白-夏姆比奧納復合物二級結構形成的平均殘基數占比。N蛋白的平均結構、卷曲、β-折疊、β-橋、彎曲和轉角分別為39%、40%、23%、4%、20%和12%,而N蛋白-夏姆比奧納復合物的上述參數則別為40%、40%、23%、6%、18%和10%。兩者在β橋、彎曲、轉角和5-螺旋區域顯示出輕微差異。


2.3.3 吉布斯自由能景觀
吉布斯自由能景觀顯示出SARS-CoV-2的N蛋白和N蛋白-夏姆比奧納復合物構象與能量的關系(見圖5)。深藍色的構象能量輪廓表示蛋白質的較低能量構象狀態,構象從深藍色到淺藍色的轉變表明蛋白質構象的轉變在熱力學上不太有利。N蛋白全局能量最小區域中的自由能態具有尖銳的單一低能態。當夏姆比奧納與N蛋白結合時,自由能全局最小值的自由取向發生了變化。這些不同的吉布斯自由能景觀是由于夏姆比奧納與N蛋白的結合而產生的不同構象。

2.4 藥物相似性分析
毒性和較差的藥代動力學特性是導致藥物在臨床試驗中失敗的主要原因,可用藥代動力學特征和類藥五原則規則區分非藥物分子和類似藥物分子。表1結果顯示,對接排名前四名為夏姆比奧納、甘草素L、木犀草苷和黃芩苷。表3展示了夏姆比奧納、甘草素L、木犀草苷和黃芩苷的Lipinski過濾器和ADMET特性。夏姆比奧納和甘草素L表現出了類似藥物的良好特性,如質量(< 500 Da)、親脂性(LogP < 5)、氫鍵供體(< 5)、氫鍵受體(< 10)和摩爾折射率(40~130)等。

3 討論
作為一種全球性流行病,COVID-19正在世界各地肆虐,但迄今為止尚無療效明顯的藥物上市。COVID-19在我國傳統醫學中屬于“疫病”,史籍記載的防治方法歷史悠久、手段豐富,因此利用我國傳統的中醫藥資源意義重大。在多輪疫情中,中醫藥在治療COVID-19感染、減輕COVID-19并發癥中發揮了重要作用,有效減少了致死率。中藥方成分復雜,對中藥活性成分的鑒別和篩選有助于闡明中藥發揮治療作用的機制,對于治療COVID-19具有重要意義。
《新型冠狀病毒肺炎診療方案》是由國家衛生健康委員會發布的COVID-19治療指南,具有極強的參考價值。針對COVID-19相對于以往疫病的特殊性,診療方案提出了一些新的處方專門應用于COVID-19的治療,因此研究這些新提出的處方具有一定的現實意義。本研究選取了重型治療中“疫毒閉肺證”“氣營兩燔證”和危重型治療中“內閉外脫證”的3個處方,從中提取出有效成分,通過使用分子對接和分子動力學模擬等幾種計算方法,篩選出44種可能對SARS-CoV-2有抑制作用的中藥活性成分,并確定了一種理論上有效的COVID-19抑制劑夏姆比奧納。
S蛋白的S1結構域與其宿主受體(ACE2)之間的初始相互作用以及隨后的S2片段介導的宿主和病毒膜融合使RNA基因組進入宿主細胞[30]。N蛋白在結構上與病毒核酸結合,參與病毒復制周期過程和宿主細胞對病毒感染的細胞反應[29]。N蛋白NTD結構域的RNA結合活性對于SARS-CoV-2的RNP的形成和基因組復制是必不可少的。3CL蛋白參與了前體多蛋白的大部分成熟切割[31]。RDRP是RNA合成的活性中心[32],結構上保守的RDRP核心和相關基序對于RNA催化功能是必不可少的。由于上述蛋白質對SARS-CoV-2的生理過程和致病機制至關重要,因此針對上述蛋白質研發或篩選藥物分子被認為是開發抗病毒藥物的良好策略。
在44種可能對SARS-CoV-2有抑制作用的中藥活性成分中,結合能排名前四位的分別為夏姆比奧納、甘草素L、木犀草苷和黃芩苷,其結合能均普遍高于臨床上推薦的抗SARS-CoV-2藥物瑞德西韋,表明其與SARS-CoV-2的主要蛋白結合能力較強,可能以抑制主要蛋白功能的方式發揮抗病毒作用。在44個活性分子的對接結果之中,夏姆比奧納與SARS-CoV-2的S蛋白、3CL蛋白、N蛋白和RDRP都具有最高的結合能。夏姆比奧納為甘草的活性成分之一,但以往對該活性成分的研究極少,其生理作用和具體的作用機制均不明確。本研究從分子對接和分子動力學模擬的角度,分析了夏姆比奧納與SARS-CoV-2主要蛋白的相互作用,揭示了夏姆比奧納抗病毒的可能機制。
隨著分子建模、分子對接和分子動力學模擬等各種計算機方法的快速發展,現代計算機手段為探究中醫藥的科學基礎提供了新的策略。考慮到分子對接在復雜情形下有較大的誤差,本研究引入了分子動力學模擬的方法。分子動力學模擬將配體與受體放入體系中,模擬自然狀態下兩者的結合。分子動力學模擬能夠從原子層面給出體系的微觀演變過程,直觀地展示實驗現象發生的機制與規律,在研究配體-受體結合的機制方面具有很大優勢。分子動力學模擬結果表明,夏姆比奧納與N蛋白產生了較強的結合模式,并可能通過核心氨基酸暴露的方式發揮抑制作用。分子動力學模擬的結果進一步佐證了分子對接中夏姆比奧納和N蛋白緊密結合的分析。為了確認篩選出的活性成分可以被用作藥物,本研究還進行了藥物相似性分析。結果表明,夏姆比奧納的LogP值約為5.8,甘草素L約為3.6。因此,夏姆比奧納和甘草素L更可能被較好吸收。此外,夏姆比奧納和甘草素L遵循類藥五原則的所有特性,使其成為藥物相似分子。
綜上所述,此前對中藥的研究主要集中在免疫學和網絡藥理學。探索中藥活性小分子與SARS-CoV-2蛋白相互作用可能性的嘗試,可以為COVID-19的治療帶來新的見解。分子對接分析表明,夏姆比奧納對N蛋白具有最高的結合能(–11.2 kcal/mol)。分子動力學模擬研究表明,夏姆比奧納的結合在很大程度上導致了N蛋白的展開。除了夏姆比奧納,甘草素L、木犀草苷、黃芩苷也顯示出良好的結合能,但只有甘草素L鑒定為藥物樣分子。因此,這是一種基于計算篩選、分子對接和分子動力學模擬的理性計算預測,以確定一種精確靶向SARS-CoV-2的新型抑制劑。
4 結論
針對SARS-CoV-2病毒,本研究采用計算機輔助藥物設計方法虛擬篩選和研究了25種中草藥,發現夏姆比奧納、甘草素L、木犀草苷和黃芩苷等四種活性分子與SARS-CoV-2的多個靶點具有很強的結合親和力。其中,特別發現夏姆比奧納與N蛋白的結合能最高,其相應的分子動力學模擬研究結果顯示,夏姆比奧納與SARS-CoV-2的N蛋白緊密結合,這表明夏姆比奧納可能是SARS-CoV-2核衣殼蛋白的潛在良好抑制劑。綜上所述,本研究對多種中草藥物與SARS-CoV-2的結合進行了詳細的計算和分析,發現了夏姆比奧納這一具有潛在價值的中草藥活性成分或可用于合成一種精確靶向SARS-CoV-2的新型抑制劑,然而本研究相關結果的最終應用還有待于后續大量的實驗室研究和適當的臨床試驗評估。
重要聲明
利益沖突聲明: 本文全體作者均聲明不存在利益沖突。
作者貢獻聲明: 本研究數據挖掘與建模、分子對接、分子動力學模擬由劉明皓、Faez Iqbal Khan、肖雨晴、王栩共同完成,論文寫作與修改由劉明皓、Faez Iqbal Khan、胡子然完成,賴大坤教授承擔本研究工作的總體指導。劉明皓和Faez Iqbal Khan兩位作者貢獻相同。