癲癇的臨床特征決定了如何定義癲癇,進而指導治療。因此,在對癲癇病因、軌跡和治療反應的研究中,考慮構成癲癇的基本臨床實體至關重要。人類表型本體論(Human phenotype ontology,HPO)廣泛應用于臨床和遺傳學研究中用于臨床特征的簡明交流和建模,其允許使用邏輯推理來協調提取的數據。我們試圖重新設計HPO癲癇亞本體,以提高其與當前癲癇概念的一致性,同時支持在高通量臨床和基因組研究中應用大型臨床數據集。根據2017年國際抗癲癇聯盟對癲癇發作類型的分類,我們創建了一個新的HPO癲癇亞本體,并在不同細節層次上整合了癲癇持續狀態、熱性驚厥、反射性發作和新生兒癲癇的概念。我們比較了修訂前后的HPO癲癇亞本體,根據3個獨立隊列中791例患者的癲癇發作信息可以推斷:其中2個獨立隊列的信息先前已發表過,還有150例患者是新招募的。每個隊列的數據以不同的格式提供,并通過兩個版本的HPO進行協調。新的癲癇亞本體將癲癇發作的描述性概念數量增加了5倍。可標注到隊列中的癲癇發作描述符號數量增加了40%,關于個體癲癇發作的信息總量增加了38%。最重要的定性差異是局灶性進展為雙側強直-陣攣發作與全面起始和局灶起始發作的關系。我們已經生成了一個詳細的當代概念圖,用于協調臨床癲癇發作數據,并在2020-12-07 HPO的官方版本中實施,并在hpo.jax.org免費提供。這將有助于克服基因組學中的表型瓶頸,促進有價值數據的再利用,并最終提高對癲癇的診斷和精準治療。
引用本文: DavidLewis-Smith, PeterD Galer, GannaBalagura, 黃格格 牛永利 譯, 楊建仲 審. 在人類表型本體論中對癲癇發作進行建模—根據當代ILAE概念使大的表型數據易于處理. 癲癇雜志, 2022, 8(5): 457-468. doi: 10.7507/2096-0247.202205013 復制
要點
? 人類表型本體論(Human phenotype ontology,HPO)對臨床概念之間的關系進行正式建模,以促進簡潔的交流、協調和算法推理
? 新的HPO癲癇亞本體增加了可編碼和可用于自動推理的信息量,使臨床數據在大數據集中易于處理
研究參與者的臨床特征信息對于遺傳發現的診斷解釋和癲癇遺傳學的發現研究至關重要。為了充分利用這些數據,必須協調信息,以便將個體與診斷標準或彼此之間進行可靠的比較。在癲癇中,表型數據的解釋具有挑戰性,特別是因為癲癇發作的主要臨床特征是多樣的、動態的,并且可能以不同的組合、不同的發育階段和合并癥發生。至關重要的是,同一次癲癇發作可以根據臨床需要或考慮到信息的不完整在不同的細節層次上進行分類。
即使是單個個體的臨床數據也可能需要在不同的正式分類之間進行協調,這是因為每個醫療保健提供者偏好不一樣、對于特定研究的數據的收集形式有特定的設計,又或者是因為患者的病史可能跨越了幾十年。例如,不同來源的信息可能將同一癲癇發作描述為局灶性(非運動性)知覺性發作,局灶性發作,先兆、感覺性發作,或單純部分性發作。
傳統上,協調通常是在數據輸入過程中手動進行,這取決于貢獻者填寫特定診斷服務或研究表格的臨床專業知識。數據的手動協調給臨床醫生帶來了很大的負擔,并且有過度限制所提供的表型細節的深度和質量的風險,甚至是病例的確定。此外,為一項研究收集的臨床數據的格式可能無法映射到另一項研究所需的變量上,從而限制了重復使用的便利性和產量。隨著越來越多地診斷服務和研究分析來自數萬人的數據,對大型多中心數據集快速和準確的自動化表型協調的需求變得越來越重要。
本體對特定專家領域中存在的概念和關系進行正式建模。人類表型本體論(Human phenotype ontology,HPO)是一種工具,已成為臨床和研究遺傳學家之間簡明交流和協調臨床特征的通用語(人類表型本體論網站)。HPO 是破譯發育障礙研究和美國國立衛生研究院研究生物資源10萬基因組項目,以及即將推出的英國國家健康服務基因組醫學服務臨床基因組測序服務的數據采集中心。自2008年以來,隨著各臨床領域專家的貢獻,HPO已經包括了15 247個描述不同臨床表型概念的術語。每個術語都有一個名稱、唯一標識符(例如,HP:0001250)和定義,且可能有同義詞(可通過其進行搜索)、注釋、來自其他數據庫的交叉引用概念,例如OMIM(人類的在線孟德爾遺傳,omim.org)或 SNOMED-CT(醫學系統化命名法-臨床術語,snomed.org),和支持引用的PubMed標識符。目前的項目包括將 HPO 翻譯成多種語言,以及改進對臨床診斷和研究資源的交叉引用,例如 Orphanet(http://www.orphadata.org)和模式生物表型本體論。
每例患者的每一個相關臨床特征都被標注為最具概念性的HPO術語以充分描述它。為了將 HPO術語與當前手稿中的正式癲癇發作類型或癥狀學描述區分開來,我們用大寫名稱和 HPO 標識符以斜體字表示 HPO 概念。例如,若一例患者有focal aware motor seizures,則應將其編碼為Focal aware motor seizure(HP:0020217)。然后,自動推理算法可以從HPO中的"是"關系中推斷出這個人有Focal aware seizure(HP:0002349)和Focal motor seizure(HP:0011153),并從其中任何一個中推斷出他們有Focal-onset seizure(HP:0007359),并由此產生Seizure(HP:0001250)。因此,從單個輸入數據中,一例患者的臨床特征可以在適用的描述性術語的廣度范圍內自動描述,這些術語跨越了表型深度。因此,結合自然語言處理和同義詞詞典,這些算法可以將醫療記錄和研究數據轉換成相同的 HPO 格式,并將這些個體的臨床特征相互比較以進行研究,或與數據庫中特定遺傳疾病或綜合征相關的臨床特征進行變異優先排序(圖1)。與跨越分類的臨床記錄一樣,編碼為 HPO 術語的數據可能跨越多個版本,因為 HPO 會定期更新以納入表型概念化的進展。獨特的術語標識符映射到一致的概念,以便于從一個 HPO 版本到另一個版本的轉換。

認識到 HPO 在基因組學中的重要性、癲癇發作類型與癲癇概念化的相關性以及最近對癲癇發作分類的修訂(ILAE 2017),我們為HPO創建了一個新的現代癲癇發作概念本體論。在本文中,我們使用HPO演示了3個隊列的協調,并將我們新的癲癇亞本體(2020-12-07 版)捕獲的信息與之前迭代(2017-12-12 版)捕獲的信息進行比較。
1 方法
1.1 癲癇發作數據隊列
本研究的當地癲癇隊列包括從費城兒童醫院為Epi25協作研究招募的150例癲癇患兒,其中包括遺傳性全面性癲癇(GGE,65例)、局灶性癲癇(53例)、發育性癲癇性腦病(DEE,32例)。我們使用了Epi25格式的癲癇發作數據,但沒有使用Epi25協作組織的原始數據。根據赫爾辛基宣言,這項研究需要獲得參與者本人或(必要時)他們的父母的知情同意,該研究是依照協議并通過使用經費城兒童醫院機構審查委員會(IRB 15–12226)當地批準的非識別數據來完成的。來自另外兩個關于發育性癲癇性腦病的獨立隊列的數據被重新使用,以證明不同數據集的一致性。Helbig等在2019年發表過包括306例患者的數據,Galer等在2000年發表一個包括335例患者的癲癇亞本體,這335人來自癲癇表型/基因組計劃(EPGP)。我們只包括有任何形式癲癇發作記錄的獨特個體。
當地隊列的數據以分類癲癇發作變量的形式存在,這些變量來自于三個Epi25協作數據收集表單,分別對應于遺傳性全面性癲癇、局灶性癲癇、發育性癲癇性腦病(epi-25協作組織/Epi25格式)。Helbig等2019年的數據基于HPO 2017-12-12版本,而Galer等2020年的數據基于HPO 2018-11-08版本。
1.2 應用HPO協調數據
對于每個隊列,我們創建了一個詞典,將癲癇發作數據從原始格式轉換為HPO的指定版本。一旦數據被翻譯成HPO注釋,HPO術語之間的“是”關系就被用來推斷另一個概念上不太具體的HPO發作描述符,該描述符必須適用于個體,如上文所述的局灶性(運動性)知覺性發作。我們把這個過程稱為傳播,即捕捉適用于初始注釋的所有術語,然后在不同的細節層次上全面描述表型特征。傳播術語集既包括通過使用詞典翻譯注釋的初始術語,也包括通過本體內的邏輯推斷的術語。
1.3 統計程序
所有的統計測試和基于本體論的自動推斷均使用R統計框架進行,包括tidyverse軟件包集合和本體索引。
1.4 HPO癲癇亞本體的修正過程
2018年10月4日—10日,在盧森堡舉行的EMBO系統遺傳學神經綜合征表型研討會上,我們建立了一個國際合作項目-基于當代癲癇概念為HPO建立癲癇亞本體。在I.H.和R.K.(國際抗癲癇聯盟遺傳學委員會癲癇病工作組)以及P.N.R.(HPO的創建者)的監督下,本研究團隊每2周召開1次視頻會議,使用在線工具WebProtégé(網址為webprotege.stanford.edu)協調本體設計。我們還考慮了HPO用戶在HPO GitHub頁面(網址為GitHub.com/oboptype/human-optypeontology)上提供的反饋和意見。
2 結果
2.1 基于人類表型本體論的推理在不同精度、癥狀學和分類水平上協調癲癇發作描述
我們將來自當地隊列的150例患者的Epi25格式的癲癇分類數據和來自癲癇表型/基因組計劃(EPGP)即Galer2020隊列研究中的335例患者在HPO 2019-11-08版本中的癲癇發作注釋翻譯為HPO 2017-12-12版本(HPO 2017)術語。這使他們的數據和已根據HPO 2017-12-12版本編碼的306例患者(Helbig2019隊列)的數據相一致。我們比較了使用該版本的HPO在傳播之前和之后可注釋到這791例患者中的每一例的癲癇發作描述符的數量(圖2a)。我們發現由于傳播的結果,描述每個患者的癲癇發作術語的中位數從2增加到6,增長了3倍,Wilcoxon符號秩檢驗雙側P<0.001。

由于將這3個獨立隊列的數據統一放在了同一個概念模型上,我們能夠通過注釋有特定癲癇描述的個體比例對其進行比較(圖2b)。每個隊列中發作類型的相對豐度反映了每個研究的表型重點。在之前發表的DEE隊列中,全面性肌陣攣發作(HP:0002123)和全面性強直發作(HP:0010818)的個體比例高于當地隊列。在Helbig 2019隊列中,癲癇持續狀態負擔較高(HP:0002133),局灶性發作的患病率(HP:0007359)與混合隊列相似,但無局灶起始的全面性強直-陣攣發作的患病率較低(HP:0025190)。在Galer 2020隊列中,癇性痙攣(HP:0011097)、嬰兒痙攣(HP:0012469)和非典型失神發作(HP:0007270)頻繁被注釋。相反,混合隊列中有更多個體出現意識障礙性發作(HP:0011146),包括典型失神發作(HP:0011147)和局灶性知覺損害性發作(HP:0002384)。
2.2 為人類表型本體論創建當代癲癇概念的新亞本體
在2017年ILAE公布癲癇的可操作性分類時,HPO的癲癇亞本體缺乏區分某些癲癇發作類型的詞匯,卻包含了冗余術語和整合不良的概念。例如,局灶起始的全面性強直-陣攣發作(HP:0007334)(局灶性進展為雙側強直-陣攣發作)被認為是一種全面起始發作而非局灶起始發作。認識到這些現有的差異,我們生成了一個新的癲癇發作類型本體,然后在可能的情況下跨同義概念映射已存在的HPO術語,從而允許歷史HPO數據映射到現代概念進行重用。
新本體論的核心基于2017年ILAE新公布的癲癇分類,隨后還納入了其他分類和常用概念(表1)。我們為癲癇概念選擇了首選名稱,這些概念簡明地描述了它們的特征,以便在本體瀏覽器(如hpo.jax.org)中可視化。一般情況下,我們通常傾向于使用ILAE分類中的術語,在特殊情況下遵循優先順序。然而,與2017年相反,我們更傾向于使用“全面起始的雙側性強直-陣攣發作”,而不是“全面性強直-陣攣發作”,以減少使用后者的不考慮發作起始的人的誤解。HPO術語可以通過首選名稱、標識符或同義詞進行搜索。我們在必要時提供ILAE和歷史分類術語作為同義詞。

雖然用明確的術語來表示診斷的不確定性在臨床分類上非常重要,例如未知起始的強直-陣攣發作,但是這種明確的不確定性并不適用于癲癇發作本身(強直-陣攣發作或是全面起始,亦或是局灶起始),而只是對臨床醫生根據現有證據對癲癇進行分類的能力:“未知起始這一術語只是一個占位符—并不是癲癇發作的特征,而是無知。” HPO術語代表的是表型本身的概念,而不是在特定情況下分類的局限性。所以在HPO發作中被歸類為未知起始的強直-陣攣發作應映射為HPO術語,這意味著該發作或是全面起始的雙側性強直-陣攣發作(HP:0025190),或是局灶起始的雙側性強直-陣攣發作(HP:0007334),相應地在2017年ILAE中,該發作或是全面性強直-陣攣發作,或是局灶性進展為雙側強直-陣攣發作,而不是第三種在本質上有不同的發作類型,比如失神發作。因此,癲癇亞本體還包括額外的術語,如未知起始的雙側性強直-陣攣發作(HP:0002069)。該術語適用于2017年ILAE公布的未知起始的強直-陣攣發作、全面性強直-陣攣發作和局灶性進展為雙側強直-陣攣發作概念。起始明確的發作形式有它們各自的發作特異性術語對應全面起始(運動性)發作(HP:0032677)和局灶起始發作(HP:0007359)的“是”的關系,此外,還有第二種對應未知起始術語的“是”的關系。因此,當出現未知起始的強直-陣攣發作時,在沒有發作特異性術語的情況下,用未知起始術語進行標注。這種概念安排類似于2017年ILAE公布的局灶起始發作分類,該分類允許局灶起始發作的特定實例通過知覺或運動來分類,必要時可以對非運動發作進行獨立分類,不需要明確提及另一個,而不是要求所有的局灶起始發作都按照這兩個維度進行分類。此外,它還允許對所提出的驚厥性癲癇持續狀態的分類進行優化整合。
所謂的“雙親”也有助于減少使用基于HPO算法的診斷決策支持工具中的錯誤分類。在某些情況下,區分非典型失神發作和局灶性知覺損害性發作很困難,非專科醫生經常將局灶性知覺損害性發作誤診為“失神”甚至是“小發作”。先前存在的HPO術語意識障礙性發作(HP:0011146)也認識到失神發作(HP:0002121)和局灶性知覺損害性發作(HP:0002384)之間的癥狀學相似性。如果在HPO電傳播擴散發作中沒有父項,這兩個概念似乎并不相似,就像失神發作(HP:0002121)與局灶起始的雙側性強直-陣攣發作(HP:0007334)一樣,它們最具體的共同祖先是發作(HP:0001250)。因此,局灶性知覺損害性發作的患者是否會被錯誤地標注為失神發作呢(HP:0002121)?如果該患者被編碼為其實際注釋的父代:意識障礙性發作(HP:0011146),那么將其與局灶性知覺損害性發作(HP:0002384)的參考進行比較的一種算法可以使用“模糊匹配”來識別正確(但不精確)的匹配。
我們把這種創建獨立于腦電起病的雙親關系的策略擴展到臨床范圍之外用于減輕不確定性和錯誤分類,從而處理可能發生在局灶或全面起始的癥狀學。為了研究共同的關聯和機制,研究人員可能對識別獨立于腦電發作的癥狀學特征的癲癇發作的患者感興趣。雙親關系允許本體論認識到局灶性強直發作類似于其他類型的局灶性運動發作,但通過引入第二個父項—與起始無關的強直發作(HP:0032792),其更類似于全面性強直發作,而不是全面性肌陣攣發作。不希望使用這些或其他概念的用戶,不必簡單地在其數據詞典和傳播術語集中忽略它們。
在臨床遺傳診斷和研究中表型瓶頸的一個主要組成部分是數據輸入。我們提供了非常具體的癲癇發作概念和關系,允許本體論通過提供最少數量的輸入術語來推斷出盡可能多的關于癲癇發作的信息。例如,在提供似曾相識的單一高度特異性術語局灶性知覺認知發作時(HP:0032883),一種推理算法可以使用本體論來推斷其他12個本體論癲癇發作描述符的適用性,這些描述符捕捉其局灶起始、認知發作表現,以及在不同的組合和程度上意識的保持。
只有當先前存在的HPO術語無法映射到當前的癲癇發作概念或是多余時,它們才會失效(參見原文鏈接表S1)。否則,術語會被集成到新的本體中,需要時可以修改它們的定義或關系,或者作為新術語的同義詞。
2.3 2020年HPO癲癇亞本體版本比2017年版能捕捉到更多的癲癇信息
在將新的癲癇亞本體整合到HPO 2020-12-07版本(HPO 2020)中之后,我們根據描述癲癇發作的術語數量以及這些概念之間的關系(表2),將其與修訂開始前發布的2017-12-12版本(HPO 2017)進行了比較。HPO 2020版包含的術語數量是原來的5倍,關系數量是原來的7倍。

應用這一點,我們將當地隊列的分類數據和之前在HPO 2017版本中公布的DEE隊列數據整合到HPO 2020版本亞本體中,然后按該HPO版本比較791例患者組合隊列的注釋性癲癇發作數據(表2)。有幾個新術語描述了新穎的概念,因此HPO 2017版本沒有收錄。在HPO 2020版本中,局灶起始發作(HP:0007359)更常見,而全面起始發作(HP:0002197)不太常見。這是一個修正關系的結果,使局灶起始的雙側性強直-陣攣發作(HP:0007334)成為局灶起始發作(HP:0007359)的一種形式,而不是全面起始發作(HP:0002197)。雙側性強直-陣攣發作(HP:0002069)頻率的增加與發作起始無關,其原因是增加了一個特定的術語,即驚厥性癲癇持續狀態(HP:0032660),它是雙側性強直-陣攣發作的延長形式。
表型深度可以被概念化為關于個體或群體表型所提供的信息量。我們比較了使用每個癲癇亞本體所編碼的組合隊列的表型信息深度(表3)。翻譯后標注給個體的癲癇發作術語數量是對原始數據中概念的一種度量,本體論可以在不進行推理的情況下捕獲這些概念。傳播后標注的術語數量衡量了原始數據中的癲癇發作在推理后可由本體論描述或分類的潛在方式的總數。我們發現在翻譯后,對隊列的注釋有適度的可檢測的增加:HPO 2020版本增加了46例患者的注釋數量,減少了13例患者的注釋數量。與HPO 2017版本相比,HPO 2020版本將組合隊列中傳播的注釋數量增加了40%。每個個體傳播術語數量的中位數增加了50%(表3、圖3a)。


a. 綠線表示傳播后注釋的癲癇發作描述符的數量增加,紅線表示減少,藍線表示沒有變化;b. 根據每個人類表型本體論(HPO)癲癇發作亞本體,編碼每個個體的癲癇發作類型的信息總量。所示的個體數量對應于2×2以內的個體,灰色虛線表示相關,回歸線用紫色表示
然而,注釋的數量并不能區分癲癇發作的常見和罕見特征。與常見癲癇發作類型相比,更罕見的癲癇類型在區分個體與隊列中其他人方面具有更大的直觀價值。換句話說,罕見發作類型的存在比普通發作類型的存在信息量更豐富。在信息論中,這可以被量化為信息內容,通常以比特為單位衡量,并定義為隊列中其頻率的負對數[IC=?log2(f)]。這就為罕見癲癇發作術語的注釋提供了比常見癲癇類型更多的信息。由于注釋是從概念上的狹義術語傳播到更廣泛的父術語,所以從廣義術語到更詳細的術語,信息內容往往會增加,因此這是一個很好的特異性度量。
因此,在傳播后,我們可以測量每個癲癇發作術語的真實頻率,并計算隊列中注釋的每個術語的信息內容。描述個體癲癇發作清單的本體所捕獲的信息總量可以計算為其每個癲癇發作注釋的信息內容的總和。我們發現,當使用HPO 2020版本時,群體癲癇發作的信息總量增加了38%(表3、圖3b)。個體癲癇發作的信息在686例患者中是增加的,在86例患者中是減少的,這表明了一個較大的效應量(|z|=0.80)。盡管86例患者的信息量略有減少,這可歸因于前面描述的變化,HPO 2020版本糾正了局灶起始的雙側性強直-陣攣性發作概念的關系(HP:0007334),并將驚厥性癲癇持續狀態(HP:0032660)作為雙側性強直-陣攣發作(HP:0002069)的一種。因此,盡管少數人的信息量有所減少,但HPO 2020版本捕獲的信息質量更高。
3 討論
本文描述了為與當代分類概念保持一致而對HPO中癲癇發作域的修訂,以及由此對791例患者癲癇發作精確描述的影響。我們演示了如何用HPO術語對癲癇數據進行編碼,并根據多個概念上更廣泛的描述符自動對每個癲癇發作進行分類,以及如何協調不同格式的數據。與之前的迭代相比,我們發現新的亞本體增加了可以用HPO術語編碼的有關個體癲癇發作的信息量,因此,基于癲癇發作概念的自動推斷,可以促進與其他數據的的組合或分析。我們新開發的癲癇亞本體已在2020-12-07發布的HPO官方版本中全面實施,并可在hpo.jax.org上免費獲得。
新的亞本體從正式分類、共識聲明和描述定義臨床實體的特定發作類型的相關同行評審文獻中獲取證據,涵蓋了臨床實踐中遇到的各種癲癇發作類型。它不是一種臨床分類,但有不同的用途:促進臨床癲癇發作數據的自動推斷,以便進行協調分析或比較。雖然我們沒有修改癲癇發作分類概念本身,但我們使用本體論方法盡可能多地保留關于那些被不完全分類的癲癇發作的信息。這使得在沒有明確腦電發作(例如“持續強直發作”)的病歷中,癲癇發作的癥狀學描述可以被編碼,而不需要獲得腦電發作證據,也不會失去對該臨床表現的所有描述。類似地,亞本體包括癥狀學術語,這些術語可以編碼80%起始不明確的癲癇發作。例如,術語非運動性發作(HP:0033259)可能與癲癇患者有關,這些患者沒有足夠的主觀經驗明確是局灶性非運動性發作中的哪一種特定類型,并且無法獲得足夠的支持證據來區分局灶性發作和失神發作,所以,癥狀學描述包括2017年ILAE公布的未知起始的行動終止這一概念。僅根據患者或證人提供的有限病史對癲癇發作進行信息編碼的能力優化了來自于獲得諸如視頻腦電圖等資源有限的衛生保健機構的數據的協調。
HPO還包括一些癲癇學家認為有用的舊概念,如癲癇先兆(HP:0033348)和意識障礙性發作(HP:0011146),我們已在可能的情況下將其與2017年ILAE公布的概念相整合。這最大限度地提高了歷史數據信息的準確度,這些數據可以使用HPO與當前的ILAE概念相協調。
開發新的癲癇亞本體時的一個優先事項是盡可能有效地編碼癲癇類型,以減少手動數據輸入和詞典設計的負擔。單一輸入術語允許在不同的細節層次上協調癲癇發作類型和描述符,也明確地將意識水平和特定癲癇發作的初始表現等特征結合在一起。 一個例外是局灶性進展為雙側強直-陣攣發作的概念,2017年ILAE公布的癲癇分類認為這是一種傳播模式,而不是單一發作類型。同樣,我們將這個概念表示為一個獨立的術語,即局灶起始的雙側性強直-陣攣發作(HP:0007334),這避免了亞本體中術語的數量變得難以控制。
與2017年ILAE公布的癲癇分類一致,新HPO亞本體的結構基于腦電發作和初始表現的優先順序。一種基于本體論的臨床診斷支持工具已經開發出來,它使用2017年ILAE公布的術語來提示綜合征或基因診斷。盡管該本體中的癲癇概念列表已經公布,但具體概念之間的關系無法公開與我們的亞本體進行比較。
局灶性發作的癥狀學演變增加了粒度,這對于繪制其在大腦皮層的傳播非常重要,并且可以使用2017年ILAE公布的癲癇分類、ILAE詞匯表或四維癲癇分類癥狀學分類中的一系列成分來記錄。除了意識喪失和雙側傳播外,同一單一局灶性發作類型的不同癥狀學演變在HPO中是難以區分的。這可能不足以進行詳細的外科手術和網絡分析。然而,HPO主要是基因組學的一個工具,癲癇遺傳學中的表型分析側重于發作類型,而不是同一類型發作的進化差異。癲癇綜合征發作本體論(1.03版,bioportal.bioontology.org/ontologies/ESSO)、癲癇和發作本體論(1.0版,bioportal.bioontology.org/ontologies/EPSO)早于2017年ILAE公布的癲癇分類,他們對癲癇發作的多維表現(與四維癲癇分類一致)的描述可能更適合此類任務。2017年ILAE公布癲癇分類之前的另一種癥狀學本體論方法表明,對癥狀學特征組合的分析可用于顳葉癲癇和顳葉外癲癇的分類。對局灶性發作的理解和分類的進展可能有助于對HPO中癥狀學成分的重要序列進行有限排序。
目前,與本研究一樣,HPO術語通常在查閱病歷時手動注釋,或通過大量翻譯來自研究或臨床遺傳學臨床數據表中的結構化分類數據進行注釋。然而,隨著帶有集成HPO注釋模塊的電子病歷系統的可用性的增加,以及自然語言處理的進步,HPO編碼的負擔將會減輕。
盡管這次HPO癲癇亞本體的協調修訂改進了其術語的整合及其與當前ILAE公布的癲癇分類的一致性,但仍有改進的余地,包括整合來自其他分類的概念,以最大限度地提高其對非2017年ILAE公布的數據(如歷史隊列數據)的協調價值。持續的專家參與(我們鼓勵通過https://github.com/obophenotype/human-phenotype-ontology/issues提出意見)將利于與癲癇相關的HPO領域的逐步改進,這將有益于未來幾年癲癇患者的臨床診斷算法和研究。
利益沖突 H.K.已獲得Biogen,,Roche,Teva的演講酬金,并由Congenica資助。R.H.T.已獲得Arvelle, Eisai, GW Pharma, Sanofi, UCB Pharma, and Zogenix的酬金,以及Bial, LivaNova, Novartis, and UCBPharma的會議支持。I.H.曾擔任Biogen的付費顧問。D.L.-S.,P.D.G.,G.B.,S.G.,M.C.,M.O.,P.V.,C.A.E.,R.K.和P.N.R.沒有利益沖突需要披露。我們確認已經閱讀了本雜志關于出版道德問題的立場,并確認本文符合這些要求。
致謝 我們感謝為促進該項目做出貢獻的在 2018 年 10 月 4 日至 10 日在盧森堡舉行的 EMBO 系統遺傳學表型神經綜合征研討會上為早期討論做出貢獻的與會者;通過 GitHub 提供反饋的 HPO 用戶;和國際抗癲癇聯盟的癲癇專案組。
這項研究全部或部分由 Wellcome Trust [203914/Z/16/Z] 資助。 D.L.-S.也得到了BRAIN擔保人的支持。 I.H.由哈特韋爾基金會通過個人生物醫學研究獎和國際抗癲癇聯盟提供支持。這項工作還得到了美國國家神經疾病和中風研究所 (K02 NS112600) 的支持,包括關于癲癇離子通道功能的無壁壘中心的支持(“通道病相關研究中心”,U54 NS108874)、Eunice Kennedy Shriver National兒童健康與人類發展研究所 (U54 HD086984) 通過費城兒童醫院的智力和發育障礙研究中心 (IDDRC) 和賓夕法尼亞大學佩雷爾曼醫學院,以及費城兒童醫院的校內資金通過癲癇神經遺傳學倡議(ENGIN)。
本出版物中報告的研究還得到了美國國立衛生研究院國家轉化科學促進中心的支持,獎項編號為 UL1TR001878。
該項目還得到了賓夕法尼亞大學佩雷爾曼醫學院轉化醫學和治療學研究所 (ITMAT) 轉化醫學和治療學跨學科項目、德國 EuroEPINOMICS-Rare Epilepsy Syndrome (RES) 聯盟的部分支持 歐洲科學基金會 EuroEPINOMICS 框架內的研究基金會(HE5415/3-1 至 I.H.),部分資助由德國研究基金會(DFG;HE5415/-1,HE5415/6-1 至 I.H)和 DFG/FNR INTER Research 提供 單位 FOR2715(He5415/7-1 至 I.H,INTER/DFG/17/11583046 至 R.K.),部分由愛爾蘭科學基金會 (SFI) 資助,資助號為 16/RC/3948。并由歐洲區域發展基金、FutureNeuro 行業合作伙伴 Congenica 和歐盟委員會 (Solve-RD; 779257) 提供共同資助。
要點
? 人類表型本體論(Human phenotype ontology,HPO)對臨床概念之間的關系進行正式建模,以促進簡潔的交流、協調和算法推理
? 新的HPO癲癇亞本體增加了可編碼和可用于自動推理的信息量,使臨床數據在大數據集中易于處理
研究參與者的臨床特征信息對于遺傳發現的診斷解釋和癲癇遺傳學的發現研究至關重要。為了充分利用這些數據,必須協調信息,以便將個體與診斷標準或彼此之間進行可靠的比較。在癲癇中,表型數據的解釋具有挑戰性,特別是因為癲癇發作的主要臨床特征是多樣的、動態的,并且可能以不同的組合、不同的發育階段和合并癥發生。至關重要的是,同一次癲癇發作可以根據臨床需要或考慮到信息的不完整在不同的細節層次上進行分類。
即使是單個個體的臨床數據也可能需要在不同的正式分類之間進行協調,這是因為每個醫療保健提供者偏好不一樣、對于特定研究的數據的收集形式有特定的設計,又或者是因為患者的病史可能跨越了幾十年。例如,不同來源的信息可能將同一癲癇發作描述為局灶性(非運動性)知覺性發作,局灶性發作,先兆、感覺性發作,或單純部分性發作。
傳統上,協調通常是在數據輸入過程中手動進行,這取決于貢獻者填寫特定診斷服務或研究表格的臨床專業知識。數據的手動協調給臨床醫生帶來了很大的負擔,并且有過度限制所提供的表型細節的深度和質量的風險,甚至是病例的確定。此外,為一項研究收集的臨床數據的格式可能無法映射到另一項研究所需的變量上,從而限制了重復使用的便利性和產量。隨著越來越多地診斷服務和研究分析來自數萬人的數據,對大型多中心數據集快速和準確的自動化表型協調的需求變得越來越重要。
本體對特定專家領域中存在的概念和關系進行正式建模。人類表型本體論(Human phenotype ontology,HPO)是一種工具,已成為臨床和研究遺傳學家之間簡明交流和協調臨床特征的通用語(人類表型本體論網站)。HPO 是破譯發育障礙研究和美國國立衛生研究院研究生物資源10萬基因組項目,以及即將推出的英國國家健康服務基因組醫學服務臨床基因組測序服務的數據采集中心。自2008年以來,隨著各臨床領域專家的貢獻,HPO已經包括了15 247個描述不同臨床表型概念的術語。每個術語都有一個名稱、唯一標識符(例如,HP:0001250)和定義,且可能有同義詞(可通過其進行搜索)、注釋、來自其他數據庫的交叉引用概念,例如OMIM(人類的在線孟德爾遺傳,omim.org)或 SNOMED-CT(醫學系統化命名法-臨床術語,snomed.org),和支持引用的PubMed標識符。目前的項目包括將 HPO 翻譯成多種語言,以及改進對臨床診斷和研究資源的交叉引用,例如 Orphanet(http://www.orphadata.org)和模式生物表型本體論。
每例患者的每一個相關臨床特征都被標注為最具概念性的HPO術語以充分描述它。為了將 HPO術語與當前手稿中的正式癲癇發作類型或癥狀學描述區分開來,我們用大寫名稱和 HPO 標識符以斜體字表示 HPO 概念。例如,若一例患者有focal aware motor seizures,則應將其編碼為Focal aware motor seizure(HP:0020217)。然后,自動推理算法可以從HPO中的"是"關系中推斷出這個人有Focal aware seizure(HP:0002349)和Focal motor seizure(HP:0011153),并從其中任何一個中推斷出他們有Focal-onset seizure(HP:0007359),并由此產生Seizure(HP:0001250)。因此,從單個輸入數據中,一例患者的臨床特征可以在適用的描述性術語的廣度范圍內自動描述,這些術語跨越了表型深度。因此,結合自然語言處理和同義詞詞典,這些算法可以將醫療記錄和研究數據轉換成相同的 HPO 格式,并將這些個體的臨床特征相互比較以進行研究,或與數據庫中特定遺傳疾病或綜合征相關的臨床特征進行變異優先排序(圖1)。與跨越分類的臨床記錄一樣,編碼為 HPO 術語的數據可能跨越多個版本,因為 HPO 會定期更新以納入表型概念化的進展。獨特的術語標識符映射到一致的概念,以便于從一個 HPO 版本到另一個版本的轉換。

認識到 HPO 在基因組學中的重要性、癲癇發作類型與癲癇概念化的相關性以及最近對癲癇發作分類的修訂(ILAE 2017),我們為HPO創建了一個新的現代癲癇發作概念本體論。在本文中,我們使用HPO演示了3個隊列的協調,并將我們新的癲癇亞本體(2020-12-07 版)捕獲的信息與之前迭代(2017-12-12 版)捕獲的信息進行比較。
1 方法
1.1 癲癇發作數據隊列
本研究的當地癲癇隊列包括從費城兒童醫院為Epi25協作研究招募的150例癲癇患兒,其中包括遺傳性全面性癲癇(GGE,65例)、局灶性癲癇(53例)、發育性癲癇性腦病(DEE,32例)。我們使用了Epi25格式的癲癇發作數據,但沒有使用Epi25協作組織的原始數據。根據赫爾辛基宣言,這項研究需要獲得參與者本人或(必要時)他們的父母的知情同意,該研究是依照協議并通過使用經費城兒童醫院機構審查委員會(IRB 15–12226)當地批準的非識別數據來完成的。來自另外兩個關于發育性癲癇性腦病的獨立隊列的數據被重新使用,以證明不同數據集的一致性。Helbig等在2019年發表過包括306例患者的數據,Galer等在2000年發表一個包括335例患者的癲癇亞本體,這335人來自癲癇表型/基因組計劃(EPGP)。我們只包括有任何形式癲癇發作記錄的獨特個體。
當地隊列的數據以分類癲癇發作變量的形式存在,這些變量來自于三個Epi25協作數據收集表單,分別對應于遺傳性全面性癲癇、局灶性癲癇、發育性癲癇性腦病(epi-25協作組織/Epi25格式)。Helbig等2019年的數據基于HPO 2017-12-12版本,而Galer等2020年的數據基于HPO 2018-11-08版本。
1.2 應用HPO協調數據
對于每個隊列,我們創建了一個詞典,將癲癇發作數據從原始格式轉換為HPO的指定版本。一旦數據被翻譯成HPO注釋,HPO術語之間的“是”關系就被用來推斷另一個概念上不太具體的HPO發作描述符,該描述符必須適用于個體,如上文所述的局灶性(運動性)知覺性發作。我們把這個過程稱為傳播,即捕捉適用于初始注釋的所有術語,然后在不同的細節層次上全面描述表型特征。傳播術語集既包括通過使用詞典翻譯注釋的初始術語,也包括通過本體內的邏輯推斷的術語。
1.3 統計程序
所有的統計測試和基于本體論的自動推斷均使用R統計框架進行,包括tidyverse軟件包集合和本體索引。
1.4 HPO癲癇亞本體的修正過程
2018年10月4日—10日,在盧森堡舉行的EMBO系統遺傳學神經綜合征表型研討會上,我們建立了一個國際合作項目-基于當代癲癇概念為HPO建立癲癇亞本體。在I.H.和R.K.(國際抗癲癇聯盟遺傳學委員會癲癇病工作組)以及P.N.R.(HPO的創建者)的監督下,本研究團隊每2周召開1次視頻會議,使用在線工具WebProtégé(網址為webprotege.stanford.edu)協調本體設計。我們還考慮了HPO用戶在HPO GitHub頁面(網址為GitHub.com/oboptype/human-optypeontology)上提供的反饋和意見。
2 結果
2.1 基于人類表型本體論的推理在不同精度、癥狀學和分類水平上協調癲癇發作描述
我們將來自當地隊列的150例患者的Epi25格式的癲癇分類數據和來自癲癇表型/基因組計劃(EPGP)即Galer2020隊列研究中的335例患者在HPO 2019-11-08版本中的癲癇發作注釋翻譯為HPO 2017-12-12版本(HPO 2017)術語。這使他們的數據和已根據HPO 2017-12-12版本編碼的306例患者(Helbig2019隊列)的數據相一致。我們比較了使用該版本的HPO在傳播之前和之后可注釋到這791例患者中的每一例的癲癇發作描述符的數量(圖2a)。我們發現由于傳播的結果,描述每個患者的癲癇發作術語的中位數從2增加到6,增長了3倍,Wilcoxon符號秩檢驗雙側P<0.001。

由于將這3個獨立隊列的數據統一放在了同一個概念模型上,我們能夠通過注釋有特定癲癇描述的個體比例對其進行比較(圖2b)。每個隊列中發作類型的相對豐度反映了每個研究的表型重點。在之前發表的DEE隊列中,全面性肌陣攣發作(HP:0002123)和全面性強直發作(HP:0010818)的個體比例高于當地隊列。在Helbig 2019隊列中,癲癇持續狀態負擔較高(HP:0002133),局灶性發作的患病率(HP:0007359)與混合隊列相似,但無局灶起始的全面性強直-陣攣發作的患病率較低(HP:0025190)。在Galer 2020隊列中,癇性痙攣(HP:0011097)、嬰兒痙攣(HP:0012469)和非典型失神發作(HP:0007270)頻繁被注釋。相反,混合隊列中有更多個體出現意識障礙性發作(HP:0011146),包括典型失神發作(HP:0011147)和局灶性知覺損害性發作(HP:0002384)。
2.2 為人類表型本體論創建當代癲癇概念的新亞本體
在2017年ILAE公布癲癇的可操作性分類時,HPO的癲癇亞本體缺乏區分某些癲癇發作類型的詞匯,卻包含了冗余術語和整合不良的概念。例如,局灶起始的全面性強直-陣攣發作(HP:0007334)(局灶性進展為雙側強直-陣攣發作)被認為是一種全面起始發作而非局灶起始發作。認識到這些現有的差異,我們生成了一個新的癲癇發作類型本體,然后在可能的情況下跨同義概念映射已存在的HPO術語,從而允許歷史HPO數據映射到現代概念進行重用。
新本體論的核心基于2017年ILAE新公布的癲癇分類,隨后還納入了其他分類和常用概念(表1)。我們為癲癇概念選擇了首選名稱,這些概念簡明地描述了它們的特征,以便在本體瀏覽器(如hpo.jax.org)中可視化。一般情況下,我們通常傾向于使用ILAE分類中的術語,在特殊情況下遵循優先順序。然而,與2017年相反,我們更傾向于使用“全面起始的雙側性強直-陣攣發作”,而不是“全面性強直-陣攣發作”,以減少使用后者的不考慮發作起始的人的誤解。HPO術語可以通過首選名稱、標識符或同義詞進行搜索。我們在必要時提供ILAE和歷史分類術語作為同義詞。

雖然用明確的術語來表示診斷的不確定性在臨床分類上非常重要,例如未知起始的強直-陣攣發作,但是這種明確的不確定性并不適用于癲癇發作本身(強直-陣攣發作或是全面起始,亦或是局灶起始),而只是對臨床醫生根據現有證據對癲癇進行分類的能力:“未知起始這一術語只是一個占位符—并不是癲癇發作的特征,而是無知。” HPO術語代表的是表型本身的概念,而不是在特定情況下分類的局限性。所以在HPO發作中被歸類為未知起始的強直-陣攣發作應映射為HPO術語,這意味著該發作或是全面起始的雙側性強直-陣攣發作(HP:0025190),或是局灶起始的雙側性強直-陣攣發作(HP:0007334),相應地在2017年ILAE中,該發作或是全面性強直-陣攣發作,或是局灶性進展為雙側強直-陣攣發作,而不是第三種在本質上有不同的發作類型,比如失神發作。因此,癲癇亞本體還包括額外的術語,如未知起始的雙側性強直-陣攣發作(HP:0002069)。該術語適用于2017年ILAE公布的未知起始的強直-陣攣發作、全面性強直-陣攣發作和局灶性進展為雙側強直-陣攣發作概念。起始明確的發作形式有它們各自的發作特異性術語對應全面起始(運動性)發作(HP:0032677)和局灶起始發作(HP:0007359)的“是”的關系,此外,還有第二種對應未知起始術語的“是”的關系。因此,當出現未知起始的強直-陣攣發作時,在沒有發作特異性術語的情況下,用未知起始術語進行標注。這種概念安排類似于2017年ILAE公布的局灶起始發作分類,該分類允許局灶起始發作的特定實例通過知覺或運動來分類,必要時可以對非運動發作進行獨立分類,不需要明確提及另一個,而不是要求所有的局灶起始發作都按照這兩個維度進行分類。此外,它還允許對所提出的驚厥性癲癇持續狀態的分類進行優化整合。
所謂的“雙親”也有助于減少使用基于HPO算法的診斷決策支持工具中的錯誤分類。在某些情況下,區分非典型失神發作和局灶性知覺損害性發作很困難,非專科醫生經常將局灶性知覺損害性發作誤診為“失神”甚至是“小發作”。先前存在的HPO術語意識障礙性發作(HP:0011146)也認識到失神發作(HP:0002121)和局灶性知覺損害性發作(HP:0002384)之間的癥狀學相似性。如果在HPO電傳播擴散發作中沒有父項,這兩個概念似乎并不相似,就像失神發作(HP:0002121)與局灶起始的雙側性強直-陣攣發作(HP:0007334)一樣,它們最具體的共同祖先是發作(HP:0001250)。因此,局灶性知覺損害性發作的患者是否會被錯誤地標注為失神發作呢(HP:0002121)?如果該患者被編碼為其實際注釋的父代:意識障礙性發作(HP:0011146),那么將其與局灶性知覺損害性發作(HP:0002384)的參考進行比較的一種算法可以使用“模糊匹配”來識別正確(但不精確)的匹配。
我們把這種創建獨立于腦電起病的雙親關系的策略擴展到臨床范圍之外用于減輕不確定性和錯誤分類,從而處理可能發生在局灶或全面起始的癥狀學。為了研究共同的關聯和機制,研究人員可能對識別獨立于腦電發作的癥狀學特征的癲癇發作的患者感興趣。雙親關系允許本體論認識到局灶性強直發作類似于其他類型的局灶性運動發作,但通過引入第二個父項—與起始無關的強直發作(HP:0032792),其更類似于全面性強直發作,而不是全面性肌陣攣發作。不希望使用這些或其他概念的用戶,不必簡單地在其數據詞典和傳播術語集中忽略它們。
在臨床遺傳診斷和研究中表型瓶頸的一個主要組成部分是數據輸入。我們提供了非常具體的癲癇發作概念和關系,允許本體論通過提供最少數量的輸入術語來推斷出盡可能多的關于癲癇發作的信息。例如,在提供似曾相識的單一高度特異性術語局灶性知覺認知發作時(HP:0032883),一種推理算法可以使用本體論來推斷其他12個本體論癲癇發作描述符的適用性,這些描述符捕捉其局灶起始、認知發作表現,以及在不同的組合和程度上意識的保持。
只有當先前存在的HPO術語無法映射到當前的癲癇發作概念或是多余時,它們才會失效(參見原文鏈接表S1)。否則,術語會被集成到新的本體中,需要時可以修改它們的定義或關系,或者作為新術語的同義詞。
2.3 2020年HPO癲癇亞本體版本比2017年版能捕捉到更多的癲癇信息
在將新的癲癇亞本體整合到HPO 2020-12-07版本(HPO 2020)中之后,我們根據描述癲癇發作的術語數量以及這些概念之間的關系(表2),將其與修訂開始前發布的2017-12-12版本(HPO 2017)進行了比較。HPO 2020版包含的術語數量是原來的5倍,關系數量是原來的7倍。

應用這一點,我們將當地隊列的分類數據和之前在HPO 2017版本中公布的DEE隊列數據整合到HPO 2020版本亞本體中,然后按該HPO版本比較791例患者組合隊列的注釋性癲癇發作數據(表2)。有幾個新術語描述了新穎的概念,因此HPO 2017版本沒有收錄。在HPO 2020版本中,局灶起始發作(HP:0007359)更常見,而全面起始發作(HP:0002197)不太常見。這是一個修正關系的結果,使局灶起始的雙側性強直-陣攣發作(HP:0007334)成為局灶起始發作(HP:0007359)的一種形式,而不是全面起始發作(HP:0002197)。雙側性強直-陣攣發作(HP:0002069)頻率的增加與發作起始無關,其原因是增加了一個特定的術語,即驚厥性癲癇持續狀態(HP:0032660),它是雙側性強直-陣攣發作的延長形式。
表型深度可以被概念化為關于個體或群體表型所提供的信息量。我們比較了使用每個癲癇亞本體所編碼的組合隊列的表型信息深度(表3)。翻譯后標注給個體的癲癇發作術語數量是對原始數據中概念的一種度量,本體論可以在不進行推理的情況下捕獲這些概念。傳播后標注的術語數量衡量了原始數據中的癲癇發作在推理后可由本體論描述或分類的潛在方式的總數。我們發現在翻譯后,對隊列的注釋有適度的可檢測的增加:HPO 2020版本增加了46例患者的注釋數量,減少了13例患者的注釋數量。與HPO 2017版本相比,HPO 2020版本將組合隊列中傳播的注釋數量增加了40%。每個個體傳播術語數量的中位數增加了50%(表3、圖3a)。


a. 綠線表示傳播后注釋的癲癇發作描述符的數量增加,紅線表示減少,藍線表示沒有變化;b. 根據每個人類表型本體論(HPO)癲癇發作亞本體,編碼每個個體的癲癇發作類型的信息總量。所示的個體數量對應于2×2以內的個體,灰色虛線表示相關,回歸線用紫色表示
然而,注釋的數量并不能區分癲癇發作的常見和罕見特征。與常見癲癇發作類型相比,更罕見的癲癇類型在區分個體與隊列中其他人方面具有更大的直觀價值。換句話說,罕見發作類型的存在比普通發作類型的存在信息量更豐富。在信息論中,這可以被量化為信息內容,通常以比特為單位衡量,并定義為隊列中其頻率的負對數[IC=?log2(f)]。這就為罕見癲癇發作術語的注釋提供了比常見癲癇類型更多的信息。由于注釋是從概念上的狹義術語傳播到更廣泛的父術語,所以從廣義術語到更詳細的術語,信息內容往往會增加,因此這是一個很好的特異性度量。
因此,在傳播后,我們可以測量每個癲癇發作術語的真實頻率,并計算隊列中注釋的每個術語的信息內容。描述個體癲癇發作清單的本體所捕獲的信息總量可以計算為其每個癲癇發作注釋的信息內容的總和。我們發現,當使用HPO 2020版本時,群體癲癇發作的信息總量增加了38%(表3、圖3b)。個體癲癇發作的信息在686例患者中是增加的,在86例患者中是減少的,這表明了一個較大的效應量(|z|=0.80)。盡管86例患者的信息量略有減少,這可歸因于前面描述的變化,HPO 2020版本糾正了局灶起始的雙側性強直-陣攣性發作概念的關系(HP:0007334),并將驚厥性癲癇持續狀態(HP:0032660)作為雙側性強直-陣攣發作(HP:0002069)的一種。因此,盡管少數人的信息量有所減少,但HPO 2020版本捕獲的信息質量更高。
3 討論
本文描述了為與當代分類概念保持一致而對HPO中癲癇發作域的修訂,以及由此對791例患者癲癇發作精確描述的影響。我們演示了如何用HPO術語對癲癇數據進行編碼,并根據多個概念上更廣泛的描述符自動對每個癲癇發作進行分類,以及如何協調不同格式的數據。與之前的迭代相比,我們發現新的亞本體增加了可以用HPO術語編碼的有關個體癲癇發作的信息量,因此,基于癲癇發作概念的自動推斷,可以促進與其他數據的的組合或分析。我們新開發的癲癇亞本體已在2020-12-07發布的HPO官方版本中全面實施,并可在hpo.jax.org上免費獲得。
新的亞本體從正式分類、共識聲明和描述定義臨床實體的特定發作類型的相關同行評審文獻中獲取證據,涵蓋了臨床實踐中遇到的各種癲癇發作類型。它不是一種臨床分類,但有不同的用途:促進臨床癲癇發作數據的自動推斷,以便進行協調分析或比較。雖然我們沒有修改癲癇發作分類概念本身,但我們使用本體論方法盡可能多地保留關于那些被不完全分類的癲癇發作的信息。這使得在沒有明確腦電發作(例如“持續強直發作”)的病歷中,癲癇發作的癥狀學描述可以被編碼,而不需要獲得腦電發作證據,也不會失去對該臨床表現的所有描述。類似地,亞本體包括癥狀學術語,這些術語可以編碼80%起始不明確的癲癇發作。例如,術語非運動性發作(HP:0033259)可能與癲癇患者有關,這些患者沒有足夠的主觀經驗明確是局灶性非運動性發作中的哪一種特定類型,并且無法獲得足夠的支持證據來區分局灶性發作和失神發作,所以,癥狀學描述包括2017年ILAE公布的未知起始的行動終止這一概念。僅根據患者或證人提供的有限病史對癲癇發作進行信息編碼的能力優化了來自于獲得諸如視頻腦電圖等資源有限的衛生保健機構的數據的協調。
HPO還包括一些癲癇學家認為有用的舊概念,如癲癇先兆(HP:0033348)和意識障礙性發作(HP:0011146),我們已在可能的情況下將其與2017年ILAE公布的概念相整合。這最大限度地提高了歷史數據信息的準確度,這些數據可以使用HPO與當前的ILAE概念相協調。
開發新的癲癇亞本體時的一個優先事項是盡可能有效地編碼癲癇類型,以減少手動數據輸入和詞典設計的負擔。單一輸入術語允許在不同的細節層次上協調癲癇發作類型和描述符,也明確地將意識水平和特定癲癇發作的初始表現等特征結合在一起。 一個例外是局灶性進展為雙側強直-陣攣發作的概念,2017年ILAE公布的癲癇分類認為這是一種傳播模式,而不是單一發作類型。同樣,我們將這個概念表示為一個獨立的術語,即局灶起始的雙側性強直-陣攣發作(HP:0007334),這避免了亞本體中術語的數量變得難以控制。
與2017年ILAE公布的癲癇分類一致,新HPO亞本體的結構基于腦電發作和初始表現的優先順序。一種基于本體論的臨床診斷支持工具已經開發出來,它使用2017年ILAE公布的術語來提示綜合征或基因診斷。盡管該本體中的癲癇概念列表已經公布,但具體概念之間的關系無法公開與我們的亞本體進行比較。
局灶性發作的癥狀學演變增加了粒度,這對于繪制其在大腦皮層的傳播非常重要,并且可以使用2017年ILAE公布的癲癇分類、ILAE詞匯表或四維癲癇分類癥狀學分類中的一系列成分來記錄。除了意識喪失和雙側傳播外,同一單一局灶性發作類型的不同癥狀學演變在HPO中是難以區分的。這可能不足以進行詳細的外科手術和網絡分析。然而,HPO主要是基因組學的一個工具,癲癇遺傳學中的表型分析側重于發作類型,而不是同一類型發作的進化差異。癲癇綜合征發作本體論(1.03版,bioportal.bioontology.org/ontologies/ESSO)、癲癇和發作本體論(1.0版,bioportal.bioontology.org/ontologies/EPSO)早于2017年ILAE公布的癲癇分類,他們對癲癇發作的多維表現(與四維癲癇分類一致)的描述可能更適合此類任務。2017年ILAE公布癲癇分類之前的另一種癥狀學本體論方法表明,對癥狀學特征組合的分析可用于顳葉癲癇和顳葉外癲癇的分類。對局灶性發作的理解和分類的進展可能有助于對HPO中癥狀學成分的重要序列進行有限排序。
目前,與本研究一樣,HPO術語通常在查閱病歷時手動注釋,或通過大量翻譯來自研究或臨床遺傳學臨床數據表中的結構化分類數據進行注釋。然而,隨著帶有集成HPO注釋模塊的電子病歷系統的可用性的增加,以及自然語言處理的進步,HPO編碼的負擔將會減輕。
盡管這次HPO癲癇亞本體的協調修訂改進了其術語的整合及其與當前ILAE公布的癲癇分類的一致性,但仍有改進的余地,包括整合來自其他分類的概念,以最大限度地提高其對非2017年ILAE公布的數據(如歷史隊列數據)的協調價值。持續的專家參與(我們鼓勵通過https://github.com/obophenotype/human-phenotype-ontology/issues提出意見)將利于與癲癇相關的HPO領域的逐步改進,這將有益于未來幾年癲癇患者的臨床診斷算法和研究。
利益沖突 H.K.已獲得Biogen,,Roche,Teva的演講酬金,并由Congenica資助。R.H.T.已獲得Arvelle, Eisai, GW Pharma, Sanofi, UCB Pharma, and Zogenix的酬金,以及Bial, LivaNova, Novartis, and UCBPharma的會議支持。I.H.曾擔任Biogen的付費顧問。D.L.-S.,P.D.G.,G.B.,S.G.,M.C.,M.O.,P.V.,C.A.E.,R.K.和P.N.R.沒有利益沖突需要披露。我們確認已經閱讀了本雜志關于出版道德問題的立場,并確認本文符合這些要求。
致謝 我們感謝為促進該項目做出貢獻的在 2018 年 10 月 4 日至 10 日在盧森堡舉行的 EMBO 系統遺傳學表型神經綜合征研討會上為早期討論做出貢獻的與會者;通過 GitHub 提供反饋的 HPO 用戶;和國際抗癲癇聯盟的癲癇專案組。
這項研究全部或部分由 Wellcome Trust [203914/Z/16/Z] 資助。 D.L.-S.也得到了BRAIN擔保人的支持。 I.H.由哈特韋爾基金會通過個人生物醫學研究獎和國際抗癲癇聯盟提供支持。這項工作還得到了美國國家神經疾病和中風研究所 (K02 NS112600) 的支持,包括關于癲癇離子通道功能的無壁壘中心的支持(“通道病相關研究中心”,U54 NS108874)、Eunice Kennedy Shriver National兒童健康與人類發展研究所 (U54 HD086984) 通過費城兒童醫院的智力和發育障礙研究中心 (IDDRC) 和賓夕法尼亞大學佩雷爾曼醫學院,以及費城兒童醫院的校內資金通過癲癇神經遺傳學倡議(ENGIN)。
本出版物中報告的研究還得到了美國國立衛生研究院國家轉化科學促進中心的支持,獎項編號為 UL1TR001878。
該項目還得到了賓夕法尼亞大學佩雷爾曼醫學院轉化醫學和治療學研究所 (ITMAT) 轉化醫學和治療學跨學科項目、德國 EuroEPINOMICS-Rare Epilepsy Syndrome (RES) 聯盟的部分支持 歐洲科學基金會 EuroEPINOMICS 框架內的研究基金會(HE5415/3-1 至 I.H.),部分資助由德國研究基金會(DFG;HE5415/-1,HE5415/6-1 至 I.H)和 DFG/FNR INTER Research 提供 單位 FOR2715(He5415/7-1 至 I.H,INTER/DFG/17/11583046 至 R.K.),部分由愛爾蘭科學基金會 (SFI) 資助,資助號為 16/RC/3948。并由歐洲區域發展基金、FutureNeuro 行業合作伙伴 Congenica 和歐盟委員會 (Solve-RD; 779257) 提供共同資助。