現在良性癲癇伴中央顳區棘波[(Benign epilepsy with centrotemporal spikes,BECTS),或近期多被稱為 ECTS]與一系列認知和行為障礙相關的觀點已經被廣泛接受。盡管對 ECTS 的認知功能已經有了進一步的了解,目前仍沒有在綜合認知框架之下進行的量化分析研究。該系統評價和薈萃分析是在 PRISMA 指南的指導之下進行的。42 項對照研究滿足納入條件,共計包含 1 237 例 ECTS 患兒和 1 137 名健康對照兒童。對 8 個認知因素以及 Cattell-Horn-Carroll(CHC)智力模型進行單變量,隨機效應薈萃分析。總體來說,ECTS 患兒在神經心理學測試中所有認知方面與健康對照相比均明顯偏低。觀測效應從 0.42~0.81 集中標準差單位不等,其中長期存儲和獲取為最大效應而視覺信息處理為最小效應。目前薈萃分析的結果首次提供了 ECTS 患兒展現一系列普遍性的認知障礙的證據,因此對目前認為 ECTS 是一個良性疾病或者認為僅存在局限性、特定認知功能損害的觀點提出了挑戰。
引用本文: StevenWickens, Stephen C.Bowden, WendylD’Souza, 高慧 譯, 慕潔 審. 伴中央顳區棘波自限性癲癇患兒的認知功能:一項系統評價和薈萃分析. 癲癇雜志, 2018, 4(2): 150-161. doi: 10.7507/2096-0247.20180029 復制
要點
? 與健康對照相比,良性癲癇伴中央顳區棘波患兒明顯展現出更差的認知功能,且存在于所有被檢測的認知能力因素
? 雖然效應大小不同,點估計值和相應的置信區間指示出一系列普遍和廣泛存在的認知障礙
? 研究之間顯著的異質性提示對良性癲癇伴中央顳區棘波患兒的取樣不同會產生不同的結果
Rolandic(Rolandic epilepsy,RE)是兒童特發性癲癇最常見的形式,據估測占到所有兒童癲癇約 16%。常見發病年齡為 6~10 歲,RE 患者會有相對來說不算頻繁的局灶性發作:表現為知覺保留、主要為夜間發生的、半側面部運動性合并感覺特征、也許繼發全面的發作。之前被稱為良性癲癇伴中央顳區棘波(Benign epilepsy with centrotemporal spikes,BECTS),腦電圖(EEG)以中央顳區、中央溝區刻板存在地高電壓鈍棘-慢復合波放電為特征。目前認為 BECTS 的發病原因還不清楚。雖然被認為可能有潛在的基因學背景導致中央顳區棘波,同卵雙生子的研究卻指出該病的基因因素并不顯著。由此,表觀基因學和環境因素也許對該癲癇綜合征的出現起到一定作用。
雖然非特征性表現可存在,該情況特征性良性本質建立在絕大多數患者能夠達到完全發作緩解之上。然而,鑒于廣泛且常常頻繁出現的發作間期皮質高興奮性,尤其是睡眠期活躍,并且一般來說出現在敏感的發育期,眾多研究都探索了 BECTS 對行為和神經心理功能的影響。一系列研究均揭示了認知缺陷、行為障礙、學習能力異常、特定語言功能損害、語言-發聲異常和教育學習能力問題等在 BECTS 患兒中患病率增高。為此,修正版術語避免了對該種情況良性的錯誤解讀,將“良性”更換為“自限性”。因此,我們將在之后引用 ECTS 而非 BECTS 為縮寫。ECTS 患兒與對照相比也有更高的風險發展為注意缺陷多動障礙癥狀和存在外化問題行為。心理疾病的患病率升高,研究表明 64.5% 和 81% 的 ECTS 患兒呈現出至少一種精神病診斷與統計手冊第四版(DSM-IV)中定義的精神疾病,建立在相對應的 DSM-IV 或者情感障礙以及精神分裂癥的兒童診斷標準診斷之上。鑒于一系列損害均風險增高,這些兒童的生活質量下降就并不奇怪了。與認知結果相關,文獻中常見的內容是 ECTS 患兒一般智力功能在正常界限內,雖然比健康同齡人低。系統評價指出值得注意的語言及視覺記憶,以及注意力相關過程的問題。雖然大多數系統評價也指出其他認知區域比如處理速度、視覺空間能力、視覺運動協調及執行能力的缺陷。一項研究關注點在語言功能和視覺及聽覺信息處理起源于 ECTS 癇樣放電位置,且與語言能力相關的重要皮質區域— Rolandic 區有明顯相關性。相應的,研究發現一系列不同的表達性和接受性語言過程相關,有些認為存在廣泛性語言功能失常,然而有些則支持局限性的語言障礙。這條推理路線促使一些研究者提出記憶缺陷甚至也許是因為功能失調的語言系統導致的,因為在將語言信息編碼并組織成長期記憶中存在一定困難。目前,Smith 等量化整合了 ECTS 認知功能的研究,對 ECTS 患兒語言和讀寫能力進行薈萃分析。作者發現在所有分析的語言功能均有中等差異,包括單字閱讀、語音加工以及表達和接受語言。雖然 Smith 等的薈萃分析有重要貢獻,提供了 ECTS 患兒發生語言缺陷可能性增高的清晰證據,然而目前仍不清楚這些缺陷在更廣泛的神經心理范圍中所占據的位置。同時該研究者們沒有評估納入研究的方法學質量也是個值得注意的問題。雖然 ECTS 患兒存在認知損害的風險更高已是共識,解釋和對目前發現進行歸因卻并不明確。不同特定或者更廣泛的疾病相關特征的影響已經被進行了相關的探索,例如發病年齡、電生理特點,和抗驚厥藥物影響;癲癇的認知損害很可能是一個多因素導致的現象。然而,相關認知損害的理解,以有力的心理學理論為背景,也許會為探究損害明顯異質性提供必要的基礎。一些方法學上的問題限制了能夠使用的研究。許多研究樣本容量小,納入或者排除標準不統一,缺乏對照或者對照差,或者未能足夠匯報數據。因此,許多研究有樣本選擇,范圍或者報告偏倚的風險增高。并且一些研究評估了認知能力中有限的一部分,因此增加了確認偏倚或者將差表現歸因于局灶性功能失常的可能性增加。因此,所有認知因素的結果被混合起來匯報,ECTS 神經心理學的清晰情況仍有待被闡明。
目前還沒有研究以結合性和綜合性的認知框架量化整合可用研究。本研究在 ECTS 患兒中進行了關于認知結果的系統評價和薈萃分析,同時與被廣泛接受、綜合性強,并被經驗證實的認知框架—智力 Cattell-Horn-Carroll(CHC)模型進行關聯。CHC 模型近期被用于評估特發性和基因相關全面性癲癇的認知功能,研究發現它能夠提供合理的,在廣泛的神經心理學方面能提供狹義范圍的認知能力,包括執行能力。我們假設 ECTS 患兒與健康對照相比會展現出認知功能缺陷,更進一步探索這些困難的程度。我們研究是否會有特定神經心理學功能方面被偏好性影響,探索方法學或者臨床因素是否能夠解釋研究之間對認知影響結果的差異性。
1 資料與方法
1.1 方案注冊
本系統評價的方案已經在國際前瞻性系統評價注冊中心(International Prospective Register of Systematic Reviews)注冊(PROSPERO 注冊號碼 CRD42015024457)。本系統評價是以 PRISMA 指南為原則進行的。
1.2 搜索策略
使用 MEDLINE 和 Scopus 數據庫搜索 2016 年 12 月 31 日之前的文章。輸入關鍵詞包括綜合征( Rolandic 癲癇,良性癲癇伴中央顳區棘波,BECTS,BCECTS,BRE,BECRS)和神經心理學結果(認知的,認知,神經心理學,神經心理學的,智力,語言,記憶,注意力,執行力)。符合條件研究的參考文獻列表也被檢索以發現額外研究。
1.3 選擇標準
滿足以下所有標準的研究則被納入:① 發表在同行評議雜志上的原創性研究;② 對照或者隊列研究,包含診斷為 ECTS 的樣本和一組年齡匹配的健康對照;③ 研究參與者年齡 6~16 歲之間,以促進分組的同質性和結果測量方面的可比性;④ 結果包含以已發表的神經心理學測試測量認知功能中的任何因素。排除標準:① 患兒組包含存在中央溝放電但無癇性發作史的情況;② 患兒組包含其他異質性的癲癇綜合征;③ 對照組是非癲癇但是其他診斷陽性的樣本(不是健康對照);④ 全文不可獲得或者不是英文;⑤ 實驗的均值和標準差(Standard deviation,SD)無法獲得。本系統評價和薈萃分析使用的研究以星號在引文列表中標示出來。
1.4 數據提取
本研究包含的研究中神經心理學測試數據以測試均值和標準差的形式被提取。測試參照 CHC 模型的廣泛因素,即在這些因素中測試被認為是負荷最高的(分類的細節具體見原文鏈接信息表 S3)。測試分類到 CHC 因素是按照在之前文獻中提及的最新測試變量或者因素結構進行的,且由兩名獨立的評價者(S.W.和 S.C.B.)進行判定。更精確地說,分類測試按照由 McGrew 撰寫的 CHC 框架的詳細實施定義。為了促進研究之間的連續性,許多測試以他們的相對因素進行分類,與之前 Loughman 等系統評價一致。智力的 CHC 模型是最綜合性和經驗性確認的人類認知模型。CHC 框架在一個等級性的、三層模型上作用。最重要的,一個整體智力功能(G)的首要因素包含一些廣義的認知能力,包含但是不限于獲得知識(Gc),流體推理(Gf),工作/短期記憶能力(Gsm),處理速度(Gs)和長期存儲及獲取(Glr),見表 1。一系列狹義能力在廣義因素之下。

雖然 CHC 框架并不是僅僅指執行能力,它仍是許多研究者和臨床工作者認為的要點。因此,CHC 模型中執行能力占幾個廣義層面能力或者為多個 CHC 因素的合并。詞匯的提取,也被稱為語言流暢度,也常常被認為是一個執行功能。在傳統的 CHC 理論中,流暢度被認為是 Glr 的一個狹義能力,然而,最近的研究提示流暢度也許最好被展示為一個獨立的廣義因素,以代表提取過程和編碼過程相獨立。相對應本研究將流暢度(Gr)認為是一個獨立的廣義層面能力。
提取神經心理學測試數據從以下角度:
當一個單研究匯報多個測試反應一個廣義 CHC 因素(如數字廣度和區塊廣度),每個測試均被提取并被集中在其相對應的因素下(如 Gsm);當一個測試對一組刺激物有對個結果時,一個單獨的代表性結果則被選出[如 Rey 聽覺語言學習測試(Rey Auditory Verbal Learning Test,RAVLT) RAVLT 中的延遲回想];當一個單獨的神經心理學測試數據在一項研究中的亞組中匯報(如 EEG 集中點,存在抗癲癇藥物,存在間期癇樣放電),每組的數據均被提取并且在本研究中進行集中;當測試數據以對個時間點進行收集和匯報,針對患者和對照的數據均僅在第一個時間點提取。鑒于縱向研究的缺乏,目前研究數據均只限于活躍癲癇期的結果;當一個研究包含多個對照比較(如社區對照和患者同胞兄弟姐妹),則選擇社區對照組。
當多篇文章存在交叉,使樣本神經心理學測試重復,則選擇單篇研究。選取的研究是其中最全面匯報且最具代表性的一篇。然而,當以同一樣本的多篇文章存在不同的神經心理學測試時,文章均被納入并且被認為是同一研究(如 Riva 等和 Vago 等,Lopes 等和 Lopes 等)。
許多臨床變量同時也從納入的研究中被提取。包括病例和對照樣本大小,使用 ILAE 的診斷標準,癲癇患者樣本的平均年齡,癲癇或者癇性發作的起始平均,中央顳區棘波的位置和使用抗癲癇藥物(AEDs)的患兒比例。當描述性統計學未給出但是單獨的患者數據可及的情況下,進行臨床變量的薈萃回顧分析。
1.5 數據分析
使用綜合薈萃分析版本 2 軟件(Comprehensive Meta Analysis,CMA)進行薈萃分析。計算每個研究和集中每個認知因素的效應大小。也就是說,每個納入的研究均能產生出一個效應大小幅度以反應 BECTS 兒童和健康對照兒童在神經心理測試方面的標準化均值差異(Standardized mean difference,SMD)。用標準指南來解釋效應大小幅度(小效應 SMD=0.20,中等效應 SMD=0.50,大效應 SMD=0.80)。點估計的解釋合并其相關的 SMD 置信區間(CI)針對每個認知因素,均進行薈萃分析的隨機效應分析。隨機效應模型提供整體均值效應大小和其置信區間的估計值,建立在假設所有的研究均獨立完成的基礎上,并且每個研究反應一個隨機樣本的患者和認知能力。
納入研究效應大小的分布使用 Q 檢驗進行每個因素的檢驗,如統計顯著的 Q 與猜測的同質性相悖。重要的是,一個統計不顯著的 Q 并不必要等于效應之間存在一致性,并且 Q 也不是研究異質性程度的可靠測量。計算 tau 平方提供研究之間的差異分布及真正效應的變化。并且,計算 I2,它反應真正而非虛假的效應估計的百分比分布。
目前還沒有對觀察性研究的方法學研究質量評價的金標準。本研究采用紐卡斯爾-渥太華量表(Newcastle-Ottawa Scale,NOS)作為評價納入研究質量的工具。NOS 是一個評價非隨機觀察性研究的工具,并且在一些已發表包含病例對照和隊列研究的系統評價和/或薈萃分析中進行過應用。這個量表采用了一個星級評價系統,如果滿足 3 個維度:選擇、比較能力和暴露/結果的所有標準,每個研究最多能夠得到 9 顆星。
選擇變量表現了病例和對照的確證和代表性,因此提供了一種對選擇偏倚的測量方法。選擇性地,比較能力決定了符合標準的樣本,即一個研究是否進行了年齡對照和/或在設計研究中對照了其他因素。第三個變量,暴露,是評價質量(比如盲法)和確定試驗數據相似性的最重要的一項,以幫助減少可能的表現偏倚。除此之外,暴露變量也能表現樣本的代表性,這是通過一個研究是否提供了關于樣本對測試的反應率的足夠信息(例如描述無反應或者拒絕參加的百分率)。
雖然研究建議 NOS 有足夠的測試與再測試的可靠性,評價者之間的可靠性卻較差,并且曾有人質疑其可信度。因此,本研究將他用于方法學質量的相對評價而非絕對評價。我們還對質量評價行進一步檢驗,以發現是否有 NOS 沒有捕捉到的有其他偏倚風險。為了評價發表偏倚,對每個認知因素我們都做了漏斗圖,其中干預效應估計的標準誤差相對研究樣本大小進行作圖。
2 結果
2.1 研究人口學
在去除重復研究之后(圖 1),436 篇文章被進行篩查是否滿足合格標準。基于標題和摘要排除了 295 篇文章。在剩下的 146 篇文章中,42 篇滿足了合格標準。額外有 2 篇文章被鑒定出使用同一樣本,盡管包含針對不同認知因素的數據,因此 2 篇文章被納入且被認為是一個 ECTS 患兒樣本。在最初篩查之后,許多研究因以下原因被排除:研究由混合的癲癇樣本組成或者包含中央顳區棘波但是無癲癇的樣本(n=8),全文不可獲得(n=13)或者全文無英文形式(n=3),沒有對照組(n=25)或者對照為一個非癲癇但診斷陽性的對照組(偏頭痛或者周圍系統問題,n=3),數據匯報不充分(n=19),未使用神經心理學測試或者不全是已經發表的神經心理學測試(n=13),患者年齡偏大(>16 歲,n=3),或者研究中有其他文章中已經描述過的一個樣本(n=15)。當數據不全或者未被匯報,或者全文不可獲得,我們通過郵件試圖聯系作者尋求數據,這樣使額外有一篇文章的數據被納入。在納入的研究中,人口學和疾病相關變量有所不同。所有的研究在匯報變量角度被混合。納入的研究反映出不同的語言和文化背景。總樣本包括 1 188 ECTS 患兒和 1 074 名對照者。ECTS 樣本的平均年齡(9.82±0.96)歲,其中有 3 個研究沒有匯報樣本的平均年齡。總體來說,30 個研究均匯報了發病年齡,發病年齡 4.17~9.6 歲。大多數研究定義發病年齡為發生第一次癇性發作的年齡,然而有些定義為癲癇發病年齡(即診斷年齡),還有一些研究并不清楚。重要的是,因為發病癥狀學的原因,發病年齡常常很難估計。11 個研究包含了在進行神經心理學評估時沒有使用抗驚厥藥物的 ECTS 個體,并且大多數研究均包含一部分使用抗驚厥藥物的 ECTS 兒童,尤其是使用卡馬西平,舒噻嗪或者丙戊酸鈉。

2.2 研究質量
整體質量的評價分數,即 NOS,得分 1~9,平均分為 5.4(SD=1.68)。整體來說,研究的質量中等,許多研究都展現出了一些潛在方法學來源的偏倚。在選擇病例和對照的角度,研究存在選擇或者代表性偏倚。針對被認為定義明確并且外向性可確證的病例樣本,研究能夠明確的引用 ILAE 的診斷標準或者能夠明確應用每個 ILAE 的核心標準(包括存在睡眠誘發的刻板性的高電壓鈍中央顳區棘波,正常背景 EEG,經歷過典型的 BECTS 發作,并且沒有其他神經系統癥狀)和提供電生理信息的外部參考。整體來說,68% 的研究滿足這些對病例定義和確證的情況。然而,約 45% 的納入研究不是連續采樣或者對病人樣本采集的過程提供清晰信息(所有的病例都有一個確定的來源或者在一個確定的時間框內),并且因此造成了樣本偏倚的潛在風險。
潛在的代表偏倚可能存在于納入和排除標準不一致。納入研究在基于智商的排除上不一致,為>60~>90。基于對患者人群認知功能更差的預測,以智能的整體標準進行排除也許會低估這些兒童認知結果的受損情況。類似的,有 15 個研究設定排除標準為基于心理學共病排除病例(存在發育障礙或者有臨床意義的心理疾病),也許也會導致對病例人群的不當呈現,況且確實在患者人群中存在高心理共病率。
關于對照組,很多研究對采樣(47%)和健康狀況信息(27%)并未清晰提及。病例組和對照組一般均進行較好的年齡匹配,或者表明兩者之間不存在差異。并且,約 58% 樣本也進行了對額外因素的匹配,最常見的為性別或者社會經濟水平。產生偏倚的一個重要來源為未實施盲法,或者在評估時未匯報病例-對照的情況。值得注意的是這種情況比較常見,因為 ECTS 兒童的狀態并不顯而易見。因此,少數研究在病例-對照情況方面對測試管理員實施盲法(25%),大多數研究則進行計算機化評估。很好的是,大多數研究對病例和對照使用一樣的神經心理學評估方法(90%)。匯報偏倚很明顯,38% 研究都未提及應答率。
2.3 薈萃分析結果
對所有認知因素進行的隨機效應薈萃分析展示出顯著的標準化均值差異,指出有 ECTS 的兒童認知功能更差,效應大小從中到大(表 2)。

從 27 個研究集中的整體智力因素數據,表示為 CHC 因素 G。所有研究僅包含一種測量整體認知功能的方法。大多數研究使用完整 Wechsler IQ 量表評估這個因素,其中存在一些使用版本的差異。標準均值差異顯示出中等效應,指示出有 ECTS 的兒童相比健康對照存在顯著更低的整體智力[SMD=0.62,95% CI(0.83,0.41),P<0.001]。Gc 包含最多的研究(k=29)。該因素評估了一系列狹義 Gc 能力的測試,包括檢測語言能力,語言能力和整體獲得知識。針對 Gc 的薈萃分析顯示有 ECTS 的兒童和對照相比為中等效應大小[SMD=0.79,95%CI(1.00,0.57),P<0.001]。在 Glr 中結果也類似,雖然從 12 個研究中集中的數據表明病例和對照之間為大效應大小[SMD=0.81,95%CI(1.13,0.48),P<0.001]。相關的,流利因素的結果也為類似的中等到大效應大小[k=10,SMD =–0.79,95%CI(–1.18,–0.40),P<0.001) 。
流體推理[k=27,SMD=0.54,95% CI(0.74,0.33),P<0.001],信息處理速度[k=22,SMD=0.60,95%CI(0.85,0.34),P<0.001]和短期記憶[k=18,SMD=0.52,95%CI(0.80,0.24),P=0.001]因素顯示出在有 ECTS 的兒童和對照中存在中等標準均值差異。有 ECTS 患兒和對照相比,視覺信息處理顯示出有小效應大小,但是存在顯著意義[k=12,SMD=0.42,95% CI(0.71,0.13),P<0.001]。盡管在點估計值效應大小中存在可觀測到的差異,所有認知因素效應與 0 有明顯差異且展現出相互覆蓋的CI。
所有薈萃分析結果顯示出顯著的 Q 值,提示研究之間存在顯著異質性。I2 為 64.84~80.36,展現出有很大一部分的效應估計差異來自于研究之間的異質性。針對每個認知因素的漏斗圖均大致為對稱點,提示沒有明顯的發表偏倚(見原文鏈接 S1 漏斗圖)。
為了檢驗研究之間差異的來源,我們進行了薈萃回歸分析,包括 CMA 針對臨床變量(評估時的平均年齡,發病平均年齡,使用抗驚厥藥物的樣本比例),研究質量(整體 NOS 質量評分)和基于 IQ 的研究排除標準(分類為是和否),和/或存在心理或者發育障礙(分類為是和否,見表 3)。鑒于匯報臨床信息的差異,針對每個認知因素都分別進行了針對每個變量的薈萃回歸分析。為了保證每個分析中有足夠的研究數量,并未進行多因素分析。矯正多重比較之后,所有的分析均無統計學意義(所有 P 均>0.001)。總 NOS 評分能夠解釋 Gsm 因素中不同研究之間效應差異變異的 30%,接近矯正意義(Q[1]=6.04,P=0.014,R2=0.30) ,顯示出高質量研究具有更大的效應。

3 討論
3.1 對主要結果總結
雖然 ECTS 兒童相比對照認知更差是一般共識,但本文是第一篇研究系統評價并且以一個綜合認知模型量化合成的文獻。每個認知因素均進行了評價,覆蓋了大多數臨床工作者和研究者常用于評估的主要廣義認知因素,結果表明 ECTS 患兒相比健康對照存在顯著更差的認知功能。具體來說,認知因素 Glr 展現出大效應,而 G、Gc、Gsm、Gs 和 Gr 顯示出中等范圍效應,在 Gv 中為小效應。雖然在效應大小的點估計值存在觀測到的差異,所有認知因素均與 0 顯著不同,因此指示存在可能缺陷,并且展現出相互覆蓋的 CI。整體來說,本薈萃分析的結果提示 ECTS 患兒在變化的范圍內呈現出廣泛的認知缺陷,因此對認為 ECTS 是良性疾病或者僅存在特定/局限性的認知損害的觀念提出了挑戰。
3.2 結合文獻解讀結果
目前,有一種常見的斷定 ECTS 患兒在存在特定認知困難背景下展現出正常范圍內的 IQ。本研究量化整合的結果指出這些患兒在一系列認知因素下相比正常同齡人均存在更差的結果,盡管存在整體智力首要因素的問題。有意思的是,觀測到有 ECTS 患兒 IQ 在正常范圍內是因為許多研究排除了低 IQ 患兒。
在 ECTS 文獻中,語言功能障礙不斷被重點提及。最近的一篇薈萃分析,Smith 等匯報相比對照數據,ECTS 患兒聽覺信息處理、單字閱讀和表達,以及接收語言的能力均較差,均為中等效應大小。本分析的結果類似地揭示了 Gc 因素—廣泛反映獲得語言能力和以語言為基礎的能力有更差結果的大效應。并不意外的是,Smith 等研究中納入的研究和本研究的 Gc 薈萃分析是相互覆蓋的。Smith 等發現狹義 Gc 能力(表達和接受能力)和聽覺信息處理(Ga)以及閱讀能力(Grw)均有中等效應。目前的結果擴展了 Smith 等的結果,支持了 ECTS 存在廣泛認知缺陷的觀念。
除了語言缺陷,系統評價還得出 ECTS 患兒相比正常對照展現出更差的記憶和注意力能力的結論。因此,本研究結果對這些內容提供了量化性的支持,以及在其他主要認知因素中存在更差的認知結果,包括視覺信息處理、語言流暢度、處理速度和流體推理。有趣的是,在后面這篇質量性的回顧中,Kavros 等在以注意力為基礎的理論中分配了不同的測試。作者得出在所有理論性的注意系統中均存在缺陷,包括警覺、定向和執行網絡,提示廣泛的皮質功能異常。在一個認知的綜合模型中,相同類型的“注意力測試”主要被分配到 CHC 因素 Gsm、Gs 和 Gf。因此,在 Posener 模型框架下的注意力因素合并就被避免了。
Loughman 等發現與對照但相比特發性/基因性全面性癲癇(Idopathic/genetic generalized epilepsy,IGE)存在廣泛認知問題,且很大程度上與 IGE 的亞型無關。IGE 代表一個異質性的癲癇綜合征,且有廣泛性的電生理問題,然而 ECTS 是局灶性的癲癇綜合征,且存在特征性的表現和局限性的電生理障礙。考慮到 ECTS 的局灶本質,兩種癲癇都展現出廣泛性但是不同的認知障礙模式。研究發現不同形式的兒童局部癲癇雖然電生理障礙的位置不同,包括兒童額葉癲癇和顳葉癲癇,均存在廣泛的認知問題。這些證據表明癲癇性疾病過程的普遍影響。
ECTS 是與年齡相關的癲癇,發病年齡相對限定且傾向于在青春期停止。因此成熟因素在發育和疾病的表現中具有重要作用這一點很明確。就像正常的內源性神經活動與環境相互作用促進認知發展一樣,反復癇性活動也會影響和干預大腦發育。兒童的神經可塑性更強與特定神經網絡的功能尚不完全共同決定了病理過程的多樣性。且越來越多的研究認為智能是由復雜的神經網絡呈現的。近期靜息態功能磁共振證據表明 ECTS 的大腦系統性失去組織性,且中央溝區的功能降低影響了大范圍的腦網絡。因此,ECTS 廣泛皮質功能障礙假說與目前認知研究結果是相互印證的。
3.3 研究局限性
必須考慮以廣泛層面的級別去表達認知功能是否恰當。此種數據整合方法的首要限制就是將狹義能力匯合成潛在的框架,因此不能解釋更狹義、更細致的能力障礙。然而,可用研究有限且樣本數量少,應用的神經心理學測試多樣均一定程度阻止了整合更狹義能力的可行性。而且,并不是所有整體智力測定中包含處理速度(如縮減版的 Wechsler 智力量表),這個限制也讓我們對整體智力效應的解釋額外謹慎,因為這也是研究之間異質性的來源。
研究類型不同往往導致每個研究認知因素效應在研究之間存在顯著異質性。本文不能夠量化分析研究之間的異質性。不同的薈萃回歸分析(如使用藥物的樣本比例、平均年齡、平均發病年齡、研究排除標準)均未展現出顯著效應,但是這樣的結果也會因為多次比較導致。重要的是,這些分析必須小心謹慎地進行解讀,因為都是局限于分析研究之間的水平而不能反映任何研究內部的變異。
有趣的是,在單獨研究層面,顯著的發病年齡效應,比如在語言功能、長期記憶的存儲和獲取、處理速度、工作記憶和流體智力方面,更早的發病年齡與更差的結果相關。這些結果有一定爭議,因為其他研究未能發現與發病年齡相關顯著效應。研究結果之間的不一致也許是為什么在研究層面不能得出任何效應的可能原因。
另一個需要考慮的限制是納入的研究總體來說方法學質量中等。可獲得的研究展現出一些潛在偏倚,包括取樣、代表性和匯報偏倚,這些都有可能導致對效應大小的不準確估計。在大多數認知因素中,整體的 NOS 評分并不是顯著與研究之間的差異相關。一個單一效應,接近顯著意義,表現出在 Gsm 因素中更高的方法學質量與更大的效應大小相關。雖然這個發現很可能表示一個因大量分析導致的 I 型錯誤,但是這個發現也指出了一般情況下需要更高質量研究的必要性。原始研究的目標和重點以及認知測試的功能存在差異是公認的,潛在的質量因素包括選擇、比較性和暴露均被用于評估研究,這樣任何在研究目標/重點基礎上產生的質量差異均可能是匯報不足導致的作用而非質量變量的疏漏。有些與納入研究的樣本大小范圍相當的研究未被納入是因為缺乏對照組。因此,本薈萃分析是已發表研究中樣本量相對較小的。值得注意的是,雖然規范的數據對于解釋個體患兒的結果是非常重要的,對照樣本能在臨床研究背景中無關變量的角度保證更好的對照(如人口學、測試環境和隊列因素)作用。
未來的研究需要在測量和匯報疾病變量、診斷標準和取樣方法方面保證一致性。取樣的代表性能通過連續納入的方式進行提升。基于夜發癥狀學的本質,研究者應該對病例或者對照的情況實施盲法以減少實驗偏倚。而且,需要仔細考慮研究排除標準的影響,因為有可能影響研究結果的代表性。
3.4 未來應用和方向
綜合所有不同認知能力,對比健康對照,平均標準均值差異為–0.42~–0.81。以臨床更易理解的角度來說,即與健康同齡相比,ECTS 患兒 IQ 平均約有 6~12 點的下降,是一個顯著的差異。因此,雖然在組水平觀測到屬于正常水平的評分,與健康同齡人相比,患病個體有更高的風險經歷認知困難。我們斷定研究如果只是簡單的匯報 ECTS 患兒一般智商在“平均”或者“正常”水平將會低估他們相比同齡人遇到的困難。考慮到不同研究之間所有認知因素效應大小的實質性差異是很重要的。因此 ECTS 患兒更可能有更差的認知結果,如此高的差異提示認知功能障礙不是該疾病的統一結局。與正常個體相比差異,ECTS 患兒認知層面的長處與弱點也是有差異的。除了本研究之外,集合患兒的結果,ECTS 患兒的報告也反應認知障礙的異質性。因此,認知到這些患兒可能有認知障礙的風險增高并且進行監測是很迫切的。重要的是,本文的綜合整合數據向臨床工作者表明這種情況的效應是廣泛的,即使是在最近對此種效應概念的修正中也有提到。
本研究的局限是不能研究在癲癇活動期的認知狀況。一個相關的臨床問題即是否在恢復期(在停止發作和 EEG 正常化之后)時存在殘余的損害。雖然很有限,一些研究已經著眼于認知結果的發展,他們通過前瞻性縱向或者回顧性隨訪設計進行研究,結果也不盡相同。目前很突出的一個爭論是是否 ECTS 的認知損害能在大多數情況隨著癲癇緩解全面恢復。另外,有些證據指出更嚴重或者存在不典型 EEG 特征的患兒更有可能有殘余的口頭/語言類的缺陷和較差恢復。有殘余 Gc 缺陷的傾向性可能是由這個因素的損害更突出有關。
然而,考慮癲癇活動期的認知結果等研究是應該以批判性眼光來看待的。縱向研究方法學也是局限的,比如小樣本量、缺乏對照組和/或有個體失訪。因此,這個階段的結論仍是個傾向性的,目前可用研究較少且得出的結果缺乏統計學意義均可能導致對殘余損害的低估。最近,Garcia-Ramos 和同事們隨訪了一組新診斷 ECTS 患兒在診斷前兩年的認知功能軌跡。他們發現病例值和對照值的認知功能均持續發展,而組間的差異卻一直穩定。也就是說,ECTS 患兒相比其健康同齡人持續存在更差的認知結果。需要批判性看待的是,只有約一半的 ECTS 樣本在隨訪期間達到發作緩解,并且 EEG 是否正常化并沒有進行評估。
需要更多針對認知結果的超過癲癇活動期時間范圍的縱向研究。在已經確定有認知缺陷的患兒中,未來需要研究在活動期和緩解期如何使用臨床干預減小認知損害,無論是非藥物的還是結合 AEDs 治療。Eom 等進行了一項針對 10 例 ECTS 患兒為期 35 周鍛煉療法的前期研究,提示認知功能有顯著的提升并且父母評價內化和行為問題及生活質量均有改善。需要小心解讀這個前期試驗的數據,因為樣本量小且無對照組,但還是應該鼓勵進一步的對照研究。
4 結論
本研究整合了不同類型的研究并且對目前認為 ECTS 認知功能障礙是局限性或者特定的觀點提出了挑戰。盡管在語言和記憶編碼方面的效應相對更大,所有的認知能力都展現出相互覆蓋的置信區間,點估計值在小至大之間。正如預料,不同認知因素研究之間的效應存在本質性的不一致和異質性。因此結論為,ECTS 患兒展現出廣泛差異性的認知缺陷,與廣泛皮質功能障礙模型相一致。
聲明 本文作者表示沒有任何的利益沖突。確認我們已經仔細閱讀了本刊關于發表倫理的條例,并且確定本文符合這些內容。
要點
? 與健康對照相比,良性癲癇伴中央顳區棘波患兒明顯展現出更差的認知功能,且存在于所有被檢測的認知能力因素
? 雖然效應大小不同,點估計值和相應的置信區間指示出一系列普遍和廣泛存在的認知障礙
? 研究之間顯著的異質性提示對良性癲癇伴中央顳區棘波患兒的取樣不同會產生不同的結果
Rolandic(Rolandic epilepsy,RE)是兒童特發性癲癇最常見的形式,據估測占到所有兒童癲癇約 16%。常見發病年齡為 6~10 歲,RE 患者會有相對來說不算頻繁的局灶性發作:表現為知覺保留、主要為夜間發生的、半側面部運動性合并感覺特征、也許繼發全面的發作。之前被稱為良性癲癇伴中央顳區棘波(Benign epilepsy with centrotemporal spikes,BECTS),腦電圖(EEG)以中央顳區、中央溝區刻板存在地高電壓鈍棘-慢復合波放電為特征。目前認為 BECTS 的發病原因還不清楚。雖然被認為可能有潛在的基因學背景導致中央顳區棘波,同卵雙生子的研究卻指出該病的基因因素并不顯著。由此,表觀基因學和環境因素也許對該癲癇綜合征的出現起到一定作用。
雖然非特征性表現可存在,該情況特征性良性本質建立在絕大多數患者能夠達到完全發作緩解之上。然而,鑒于廣泛且常常頻繁出現的發作間期皮質高興奮性,尤其是睡眠期活躍,并且一般來說出現在敏感的發育期,眾多研究都探索了 BECTS 對行為和神經心理功能的影響。一系列研究均揭示了認知缺陷、行為障礙、學習能力異常、特定語言功能損害、語言-發聲異常和教育學習能力問題等在 BECTS 患兒中患病率增高。為此,修正版術語避免了對該種情況良性的錯誤解讀,將“良性”更換為“自限性”。因此,我們將在之后引用 ECTS 而非 BECTS 為縮寫。ECTS 患兒與對照相比也有更高的風險發展為注意缺陷多動障礙癥狀和存在外化問題行為。心理疾病的患病率升高,研究表明 64.5% 和 81% 的 ECTS 患兒呈現出至少一種精神病診斷與統計手冊第四版(DSM-IV)中定義的精神疾病,建立在相對應的 DSM-IV 或者情感障礙以及精神分裂癥的兒童診斷標準診斷之上。鑒于一系列損害均風險增高,這些兒童的生活質量下降就并不奇怪了。與認知結果相關,文獻中常見的內容是 ECTS 患兒一般智力功能在正常界限內,雖然比健康同齡人低。系統評價指出值得注意的語言及視覺記憶,以及注意力相關過程的問題。雖然大多數系統評價也指出其他認知區域比如處理速度、視覺空間能力、視覺運動協調及執行能力的缺陷。一項研究關注點在語言功能和視覺及聽覺信息處理起源于 ECTS 癇樣放電位置,且與語言能力相關的重要皮質區域— Rolandic 區有明顯相關性。相應的,研究發現一系列不同的表達性和接受性語言過程相關,有些認為存在廣泛性語言功能失常,然而有些則支持局限性的語言障礙。這條推理路線促使一些研究者提出記憶缺陷甚至也許是因為功能失調的語言系統導致的,因為在將語言信息編碼并組織成長期記憶中存在一定困難。目前,Smith 等量化整合了 ECTS 認知功能的研究,對 ECTS 患兒語言和讀寫能力進行薈萃分析。作者發現在所有分析的語言功能均有中等差異,包括單字閱讀、語音加工以及表達和接受語言。雖然 Smith 等的薈萃分析有重要貢獻,提供了 ECTS 患兒發生語言缺陷可能性增高的清晰證據,然而目前仍不清楚這些缺陷在更廣泛的神經心理范圍中所占據的位置。同時該研究者們沒有評估納入研究的方法學質量也是個值得注意的問題。雖然 ECTS 患兒存在認知損害的風險更高已是共識,解釋和對目前發現進行歸因卻并不明確。不同特定或者更廣泛的疾病相關特征的影響已經被進行了相關的探索,例如發病年齡、電生理特點,和抗驚厥藥物影響;癲癇的認知損害很可能是一個多因素導致的現象。然而,相關認知損害的理解,以有力的心理學理論為背景,也許會為探究損害明顯異質性提供必要的基礎。一些方法學上的問題限制了能夠使用的研究。許多研究樣本容量小,納入或者排除標準不統一,缺乏對照或者對照差,或者未能足夠匯報數據。因此,許多研究有樣本選擇,范圍或者報告偏倚的風險增高。并且一些研究評估了認知能力中有限的一部分,因此增加了確認偏倚或者將差表現歸因于局灶性功能失常的可能性增加。因此,所有認知因素的結果被混合起來匯報,ECTS 神經心理學的清晰情況仍有待被闡明。
目前還沒有研究以結合性和綜合性的認知框架量化整合可用研究。本研究在 ECTS 患兒中進行了關于認知結果的系統評價和薈萃分析,同時與被廣泛接受、綜合性強,并被經驗證實的認知框架—智力 Cattell-Horn-Carroll(CHC)模型進行關聯。CHC 模型近期被用于評估特發性和基因相關全面性癲癇的認知功能,研究發現它能夠提供合理的,在廣泛的神經心理學方面能提供狹義范圍的認知能力,包括執行能力。我們假設 ECTS 患兒與健康對照相比會展現出認知功能缺陷,更進一步探索這些困難的程度。我們研究是否會有特定神經心理學功能方面被偏好性影響,探索方法學或者臨床因素是否能夠解釋研究之間對認知影響結果的差異性。
1 資料與方法
1.1 方案注冊
本系統評價的方案已經在國際前瞻性系統評價注冊中心(International Prospective Register of Systematic Reviews)注冊(PROSPERO 注冊號碼 CRD42015024457)。本系統評價是以 PRISMA 指南為原則進行的。
1.2 搜索策略
使用 MEDLINE 和 Scopus 數據庫搜索 2016 年 12 月 31 日之前的文章。輸入關鍵詞包括綜合征( Rolandic 癲癇,良性癲癇伴中央顳區棘波,BECTS,BCECTS,BRE,BECRS)和神經心理學結果(認知的,認知,神經心理學,神經心理學的,智力,語言,記憶,注意力,執行力)。符合條件研究的參考文獻列表也被檢索以發現額外研究。
1.3 選擇標準
滿足以下所有標準的研究則被納入:① 發表在同行評議雜志上的原創性研究;② 對照或者隊列研究,包含診斷為 ECTS 的樣本和一組年齡匹配的健康對照;③ 研究參與者年齡 6~16 歲之間,以促進分組的同質性和結果測量方面的可比性;④ 結果包含以已發表的神經心理學測試測量認知功能中的任何因素。排除標準:① 患兒組包含存在中央溝放電但無癇性發作史的情況;② 患兒組包含其他異質性的癲癇綜合征;③ 對照組是非癲癇但是其他診斷陽性的樣本(不是健康對照);④ 全文不可獲得或者不是英文;⑤ 實驗的均值和標準差(Standard deviation,SD)無法獲得。本系統評價和薈萃分析使用的研究以星號在引文列表中標示出來。
1.4 數據提取
本研究包含的研究中神經心理學測試數據以測試均值和標準差的形式被提取。測試參照 CHC 模型的廣泛因素,即在這些因素中測試被認為是負荷最高的(分類的細節具體見原文鏈接信息表 S3)。測試分類到 CHC 因素是按照在之前文獻中提及的最新測試變量或者因素結構進行的,且由兩名獨立的評價者(S.W.和 S.C.B.)進行判定。更精確地說,分類測試按照由 McGrew 撰寫的 CHC 框架的詳細實施定義。為了促進研究之間的連續性,許多測試以他們的相對因素進行分類,與之前 Loughman 等系統評價一致。智力的 CHC 模型是最綜合性和經驗性確認的人類認知模型。CHC 框架在一個等級性的、三層模型上作用。最重要的,一個整體智力功能(G)的首要因素包含一些廣義的認知能力,包含但是不限于獲得知識(Gc),流體推理(Gf),工作/短期記憶能力(Gsm),處理速度(Gs)和長期存儲及獲取(Glr),見表 1。一系列狹義能力在廣義因素之下。

雖然 CHC 框架并不是僅僅指執行能力,它仍是許多研究者和臨床工作者認為的要點。因此,CHC 模型中執行能力占幾個廣義層面能力或者為多個 CHC 因素的合并。詞匯的提取,也被稱為語言流暢度,也常常被認為是一個執行功能。在傳統的 CHC 理論中,流暢度被認為是 Glr 的一個狹義能力,然而,最近的研究提示流暢度也許最好被展示為一個獨立的廣義因素,以代表提取過程和編碼過程相獨立。相對應本研究將流暢度(Gr)認為是一個獨立的廣義層面能力。
提取神經心理學測試數據從以下角度:
當一個單研究匯報多個測試反應一個廣義 CHC 因素(如數字廣度和區塊廣度),每個測試均被提取并被集中在其相對應的因素下(如 Gsm);當一個測試對一組刺激物有對個結果時,一個單獨的代表性結果則被選出[如 Rey 聽覺語言學習測試(Rey Auditory Verbal Learning Test,RAVLT) RAVLT 中的延遲回想];當一個單獨的神經心理學測試數據在一項研究中的亞組中匯報(如 EEG 集中點,存在抗癲癇藥物,存在間期癇樣放電),每組的數據均被提取并且在本研究中進行集中;當測試數據以對個時間點進行收集和匯報,針對患者和對照的數據均僅在第一個時間點提取。鑒于縱向研究的缺乏,目前研究數據均只限于活躍癲癇期的結果;當一個研究包含多個對照比較(如社區對照和患者同胞兄弟姐妹),則選擇社區對照組。
當多篇文章存在交叉,使樣本神經心理學測試重復,則選擇單篇研究。選取的研究是其中最全面匯報且最具代表性的一篇。然而,當以同一樣本的多篇文章存在不同的神經心理學測試時,文章均被納入并且被認為是同一研究(如 Riva 等和 Vago 等,Lopes 等和 Lopes 等)。
許多臨床變量同時也從納入的研究中被提取。包括病例和對照樣本大小,使用 ILAE 的診斷標準,癲癇患者樣本的平均年齡,癲癇或者癇性發作的起始平均,中央顳區棘波的位置和使用抗癲癇藥物(AEDs)的患兒比例。當描述性統計學未給出但是單獨的患者數據可及的情況下,進行臨床變量的薈萃回顧分析。
1.5 數據分析
使用綜合薈萃分析版本 2 軟件(Comprehensive Meta Analysis,CMA)進行薈萃分析。計算每個研究和集中每個認知因素的效應大小。也就是說,每個納入的研究均能產生出一個效應大小幅度以反應 BECTS 兒童和健康對照兒童在神經心理測試方面的標準化均值差異(Standardized mean difference,SMD)。用標準指南來解釋效應大小幅度(小效應 SMD=0.20,中等效應 SMD=0.50,大效應 SMD=0.80)。點估計的解釋合并其相關的 SMD 置信區間(CI)針對每個認知因素,均進行薈萃分析的隨機效應分析。隨機效應模型提供整體均值效應大小和其置信區間的估計值,建立在假設所有的研究均獨立完成的基礎上,并且每個研究反應一個隨機樣本的患者和認知能力。
納入研究效應大小的分布使用 Q 檢驗進行每個因素的檢驗,如統計顯著的 Q 與猜測的同質性相悖。重要的是,一個統計不顯著的 Q 并不必要等于效應之間存在一致性,并且 Q 也不是研究異質性程度的可靠測量。計算 tau 平方提供研究之間的差異分布及真正效應的變化。并且,計算 I2,它反應真正而非虛假的效應估計的百分比分布。
目前還沒有對觀察性研究的方法學研究質量評價的金標準。本研究采用紐卡斯爾-渥太華量表(Newcastle-Ottawa Scale,NOS)作為評價納入研究質量的工具。NOS 是一個評價非隨機觀察性研究的工具,并且在一些已發表包含病例對照和隊列研究的系統評價和/或薈萃分析中進行過應用。這個量表采用了一個星級評價系統,如果滿足 3 個維度:選擇、比較能力和暴露/結果的所有標準,每個研究最多能夠得到 9 顆星。
選擇變量表現了病例和對照的確證和代表性,因此提供了一種對選擇偏倚的測量方法。選擇性地,比較能力決定了符合標準的樣本,即一個研究是否進行了年齡對照和/或在設計研究中對照了其他因素。第三個變量,暴露,是評價質量(比如盲法)和確定試驗數據相似性的最重要的一項,以幫助減少可能的表現偏倚。除此之外,暴露變量也能表現樣本的代表性,這是通過一個研究是否提供了關于樣本對測試的反應率的足夠信息(例如描述無反應或者拒絕參加的百分率)。
雖然研究建議 NOS 有足夠的測試與再測試的可靠性,評價者之間的可靠性卻較差,并且曾有人質疑其可信度。因此,本研究將他用于方法學質量的相對評價而非絕對評價。我們還對質量評價行進一步檢驗,以發現是否有 NOS 沒有捕捉到的有其他偏倚風險。為了評價發表偏倚,對每個認知因素我們都做了漏斗圖,其中干預效應估計的標準誤差相對研究樣本大小進行作圖。
2 結果
2.1 研究人口學
在去除重復研究之后(圖 1),436 篇文章被進行篩查是否滿足合格標準。基于標題和摘要排除了 295 篇文章。在剩下的 146 篇文章中,42 篇滿足了合格標準。額外有 2 篇文章被鑒定出使用同一樣本,盡管包含針對不同認知因素的數據,因此 2 篇文章被納入且被認為是一個 ECTS 患兒樣本。在最初篩查之后,許多研究因以下原因被排除:研究由混合的癲癇樣本組成或者包含中央顳區棘波但是無癲癇的樣本(n=8),全文不可獲得(n=13)或者全文無英文形式(n=3),沒有對照組(n=25)或者對照為一個非癲癇但診斷陽性的對照組(偏頭痛或者周圍系統問題,n=3),數據匯報不充分(n=19),未使用神經心理學測試或者不全是已經發表的神經心理學測試(n=13),患者年齡偏大(>16 歲,n=3),或者研究中有其他文章中已經描述過的一個樣本(n=15)。當數據不全或者未被匯報,或者全文不可獲得,我們通過郵件試圖聯系作者尋求數據,這樣使額外有一篇文章的數據被納入。在納入的研究中,人口學和疾病相關變量有所不同。所有的研究在匯報變量角度被混合。納入的研究反映出不同的語言和文化背景。總樣本包括 1 188 ECTS 患兒和 1 074 名對照者。ECTS 樣本的平均年齡(9.82±0.96)歲,其中有 3 個研究沒有匯報樣本的平均年齡。總體來說,30 個研究均匯報了發病年齡,發病年齡 4.17~9.6 歲。大多數研究定義發病年齡為發生第一次癇性發作的年齡,然而有些定義為癲癇發病年齡(即診斷年齡),還有一些研究并不清楚。重要的是,因為發病癥狀學的原因,發病年齡常常很難估計。11 個研究包含了在進行神經心理學評估時沒有使用抗驚厥藥物的 ECTS 個體,并且大多數研究均包含一部分使用抗驚厥藥物的 ECTS 兒童,尤其是使用卡馬西平,舒噻嗪或者丙戊酸鈉。

2.2 研究質量
整體質量的評價分數,即 NOS,得分 1~9,平均分為 5.4(SD=1.68)。整體來說,研究的質量中等,許多研究都展現出了一些潛在方法學來源的偏倚。在選擇病例和對照的角度,研究存在選擇或者代表性偏倚。針對被認為定義明確并且外向性可確證的病例樣本,研究能夠明確的引用 ILAE 的診斷標準或者能夠明確應用每個 ILAE 的核心標準(包括存在睡眠誘發的刻板性的高電壓鈍中央顳區棘波,正常背景 EEG,經歷過典型的 BECTS 發作,并且沒有其他神經系統癥狀)和提供電生理信息的外部參考。整體來說,68% 的研究滿足這些對病例定義和確證的情況。然而,約 45% 的納入研究不是連續采樣或者對病人樣本采集的過程提供清晰信息(所有的病例都有一個確定的來源或者在一個確定的時間框內),并且因此造成了樣本偏倚的潛在風險。
潛在的代表偏倚可能存在于納入和排除標準不一致。納入研究在基于智商的排除上不一致,為>60~>90。基于對患者人群認知功能更差的預測,以智能的整體標準進行排除也許會低估這些兒童認知結果的受損情況。類似的,有 15 個研究設定排除標準為基于心理學共病排除病例(存在發育障礙或者有臨床意義的心理疾病),也許也會導致對病例人群的不當呈現,況且確實在患者人群中存在高心理共病率。
關于對照組,很多研究對采樣(47%)和健康狀況信息(27%)并未清晰提及。病例組和對照組一般均進行較好的年齡匹配,或者表明兩者之間不存在差異。并且,約 58% 樣本也進行了對額外因素的匹配,最常見的為性別或者社會經濟水平。產生偏倚的一個重要來源為未實施盲法,或者在評估時未匯報病例-對照的情況。值得注意的是這種情況比較常見,因為 ECTS 兒童的狀態并不顯而易見。因此,少數研究在病例-對照情況方面對測試管理員實施盲法(25%),大多數研究則進行計算機化評估。很好的是,大多數研究對病例和對照使用一樣的神經心理學評估方法(90%)。匯報偏倚很明顯,38% 研究都未提及應答率。
2.3 薈萃分析結果
對所有認知因素進行的隨機效應薈萃分析展示出顯著的標準化均值差異,指出有 ECTS 的兒童認知功能更差,效應大小從中到大(表 2)。

從 27 個研究集中的整體智力因素數據,表示為 CHC 因素 G。所有研究僅包含一種測量整體認知功能的方法。大多數研究使用完整 Wechsler IQ 量表評估這個因素,其中存在一些使用版本的差異。標準均值差異顯示出中等效應,指示出有 ECTS 的兒童相比健康對照存在顯著更低的整體智力[SMD=0.62,95% CI(0.83,0.41),P<0.001]。Gc 包含最多的研究(k=29)。該因素評估了一系列狹義 Gc 能力的測試,包括檢測語言能力,語言能力和整體獲得知識。針對 Gc 的薈萃分析顯示有 ECTS 的兒童和對照相比為中等效應大小[SMD=0.79,95%CI(1.00,0.57),P<0.001]。在 Glr 中結果也類似,雖然從 12 個研究中集中的數據表明病例和對照之間為大效應大小[SMD=0.81,95%CI(1.13,0.48),P<0.001]。相關的,流利因素的結果也為類似的中等到大效應大小[k=10,SMD =–0.79,95%CI(–1.18,–0.40),P<0.001) 。
流體推理[k=27,SMD=0.54,95% CI(0.74,0.33),P<0.001],信息處理速度[k=22,SMD=0.60,95%CI(0.85,0.34),P<0.001]和短期記憶[k=18,SMD=0.52,95%CI(0.80,0.24),P=0.001]因素顯示出在有 ECTS 的兒童和對照中存在中等標準均值差異。有 ECTS 患兒和對照相比,視覺信息處理顯示出有小效應大小,但是存在顯著意義[k=12,SMD=0.42,95% CI(0.71,0.13),P<0.001]。盡管在點估計值效應大小中存在可觀測到的差異,所有認知因素效應與 0 有明顯差異且展現出相互覆蓋的CI。
所有薈萃分析結果顯示出顯著的 Q 值,提示研究之間存在顯著異質性。I2 為 64.84~80.36,展現出有很大一部分的效應估計差異來自于研究之間的異質性。針對每個認知因素的漏斗圖均大致為對稱點,提示沒有明顯的發表偏倚(見原文鏈接 S1 漏斗圖)。
為了檢驗研究之間差異的來源,我們進行了薈萃回歸分析,包括 CMA 針對臨床變量(評估時的平均年齡,發病平均年齡,使用抗驚厥藥物的樣本比例),研究質量(整體 NOS 質量評分)和基于 IQ 的研究排除標準(分類為是和否),和/或存在心理或者發育障礙(分類為是和否,見表 3)。鑒于匯報臨床信息的差異,針對每個認知因素都分別進行了針對每個變量的薈萃回歸分析。為了保證每個分析中有足夠的研究數量,并未進行多因素分析。矯正多重比較之后,所有的分析均無統計學意義(所有 P 均>0.001)。總 NOS 評分能夠解釋 Gsm 因素中不同研究之間效應差異變異的 30%,接近矯正意義(Q[1]=6.04,P=0.014,R2=0.30) ,顯示出高質量研究具有更大的效應。

3 討論
3.1 對主要結果總結
雖然 ECTS 兒童相比對照認知更差是一般共識,但本文是第一篇研究系統評價并且以一個綜合認知模型量化合成的文獻。每個認知因素均進行了評價,覆蓋了大多數臨床工作者和研究者常用于評估的主要廣義認知因素,結果表明 ECTS 患兒相比健康對照存在顯著更差的認知功能。具體來說,認知因素 Glr 展現出大效應,而 G、Gc、Gsm、Gs 和 Gr 顯示出中等范圍效應,在 Gv 中為小效應。雖然在效應大小的點估計值存在觀測到的差異,所有認知因素均與 0 顯著不同,因此指示存在可能缺陷,并且展現出相互覆蓋的 CI。整體來說,本薈萃分析的結果提示 ECTS 患兒在變化的范圍內呈現出廣泛的認知缺陷,因此對認為 ECTS 是良性疾病或者僅存在特定/局限性的認知損害的觀念提出了挑戰。
3.2 結合文獻解讀結果
目前,有一種常見的斷定 ECTS 患兒在存在特定認知困難背景下展現出正常范圍內的 IQ。本研究量化整合的結果指出這些患兒在一系列認知因素下相比正常同齡人均存在更差的結果,盡管存在整體智力首要因素的問題。有意思的是,觀測到有 ECTS 患兒 IQ 在正常范圍內是因為許多研究排除了低 IQ 患兒。
在 ECTS 文獻中,語言功能障礙不斷被重點提及。最近的一篇薈萃分析,Smith 等匯報相比對照數據,ECTS 患兒聽覺信息處理、單字閱讀和表達,以及接收語言的能力均較差,均為中等效應大小。本分析的結果類似地揭示了 Gc 因素—廣泛反映獲得語言能力和以語言為基礎的能力有更差結果的大效應。并不意外的是,Smith 等研究中納入的研究和本研究的 Gc 薈萃分析是相互覆蓋的。Smith 等發現狹義 Gc 能力(表達和接受能力)和聽覺信息處理(Ga)以及閱讀能力(Grw)均有中等效應。目前的結果擴展了 Smith 等的結果,支持了 ECTS 存在廣泛認知缺陷的觀念。
除了語言缺陷,系統評價還得出 ECTS 患兒相比正常對照展現出更差的記憶和注意力能力的結論。因此,本研究結果對這些內容提供了量化性的支持,以及在其他主要認知因素中存在更差的認知結果,包括視覺信息處理、語言流暢度、處理速度和流體推理。有趣的是,在后面這篇質量性的回顧中,Kavros 等在以注意力為基礎的理論中分配了不同的測試。作者得出在所有理論性的注意系統中均存在缺陷,包括警覺、定向和執行網絡,提示廣泛的皮質功能異常。在一個認知的綜合模型中,相同類型的“注意力測試”主要被分配到 CHC 因素 Gsm、Gs 和 Gf。因此,在 Posener 模型框架下的注意力因素合并就被避免了。
Loughman 等發現與對照但相比特發性/基因性全面性癲癇(Idopathic/genetic generalized epilepsy,IGE)存在廣泛認知問題,且很大程度上與 IGE 的亞型無關。IGE 代表一個異質性的癲癇綜合征,且有廣泛性的電生理問題,然而 ECTS 是局灶性的癲癇綜合征,且存在特征性的表現和局限性的電生理障礙。考慮到 ECTS 的局灶本質,兩種癲癇都展現出廣泛性但是不同的認知障礙模式。研究發現不同形式的兒童局部癲癇雖然電生理障礙的位置不同,包括兒童額葉癲癇和顳葉癲癇,均存在廣泛的認知問題。這些證據表明癲癇性疾病過程的普遍影響。
ECTS 是與年齡相關的癲癇,發病年齡相對限定且傾向于在青春期停止。因此成熟因素在發育和疾病的表現中具有重要作用這一點很明確。就像正常的內源性神經活動與環境相互作用促進認知發展一樣,反復癇性活動也會影響和干預大腦發育。兒童的神經可塑性更強與特定神經網絡的功能尚不完全共同決定了病理過程的多樣性。且越來越多的研究認為智能是由復雜的神經網絡呈現的。近期靜息態功能磁共振證據表明 ECTS 的大腦系統性失去組織性,且中央溝區的功能降低影響了大范圍的腦網絡。因此,ECTS 廣泛皮質功能障礙假說與目前認知研究結果是相互印證的。
3.3 研究局限性
必須考慮以廣泛層面的級別去表達認知功能是否恰當。此種數據整合方法的首要限制就是將狹義能力匯合成潛在的框架,因此不能解釋更狹義、更細致的能力障礙。然而,可用研究有限且樣本數量少,應用的神經心理學測試多樣均一定程度阻止了整合更狹義能力的可行性。而且,并不是所有整體智力測定中包含處理速度(如縮減版的 Wechsler 智力量表),這個限制也讓我們對整體智力效應的解釋額外謹慎,因為這也是研究之間異質性的來源。
研究類型不同往往導致每個研究認知因素效應在研究之間存在顯著異質性。本文不能夠量化分析研究之間的異質性。不同的薈萃回歸分析(如使用藥物的樣本比例、平均年齡、平均發病年齡、研究排除標準)均未展現出顯著效應,但是這樣的結果也會因為多次比較導致。重要的是,這些分析必須小心謹慎地進行解讀,因為都是局限于分析研究之間的水平而不能反映任何研究內部的變異。
有趣的是,在單獨研究層面,顯著的發病年齡效應,比如在語言功能、長期記憶的存儲和獲取、處理速度、工作記憶和流體智力方面,更早的發病年齡與更差的結果相關。這些結果有一定爭議,因為其他研究未能發現與發病年齡相關顯著效應。研究結果之間的不一致也許是為什么在研究層面不能得出任何效應的可能原因。
另一個需要考慮的限制是納入的研究總體來說方法學質量中等。可獲得的研究展現出一些潛在偏倚,包括取樣、代表性和匯報偏倚,這些都有可能導致對效應大小的不準確估計。在大多數認知因素中,整體的 NOS 評分并不是顯著與研究之間的差異相關。一個單一效應,接近顯著意義,表現出在 Gsm 因素中更高的方法學質量與更大的效應大小相關。雖然這個發現很可能表示一個因大量分析導致的 I 型錯誤,但是這個發現也指出了一般情況下需要更高質量研究的必要性。原始研究的目標和重點以及認知測試的功能存在差異是公認的,潛在的質量因素包括選擇、比較性和暴露均被用于評估研究,這樣任何在研究目標/重點基礎上產生的質量差異均可能是匯報不足導致的作用而非質量變量的疏漏。有些與納入研究的樣本大小范圍相當的研究未被納入是因為缺乏對照組。因此,本薈萃分析是已發表研究中樣本量相對較小的。值得注意的是,雖然規范的數據對于解釋個體患兒的結果是非常重要的,對照樣本能在臨床研究背景中無關變量的角度保證更好的對照(如人口學、測試環境和隊列因素)作用。
未來的研究需要在測量和匯報疾病變量、診斷標準和取樣方法方面保證一致性。取樣的代表性能通過連續納入的方式進行提升。基于夜發癥狀學的本質,研究者應該對病例或者對照的情況實施盲法以減少實驗偏倚。而且,需要仔細考慮研究排除標準的影響,因為有可能影響研究結果的代表性。
3.4 未來應用和方向
綜合所有不同認知能力,對比健康對照,平均標準均值差異為–0.42~–0.81。以臨床更易理解的角度來說,即與健康同齡相比,ECTS 患兒 IQ 平均約有 6~12 點的下降,是一個顯著的差異。因此,雖然在組水平觀測到屬于正常水平的評分,與健康同齡人相比,患病個體有更高的風險經歷認知困難。我們斷定研究如果只是簡單的匯報 ECTS 患兒一般智商在“平均”或者“正常”水平將會低估他們相比同齡人遇到的困難。考慮到不同研究之間所有認知因素效應大小的實質性差異是很重要的。因此 ECTS 患兒更可能有更差的認知結果,如此高的差異提示認知功能障礙不是該疾病的統一結局。與正常個體相比差異,ECTS 患兒認知層面的長處與弱點也是有差異的。除了本研究之外,集合患兒的結果,ECTS 患兒的報告也反應認知障礙的異質性。因此,認知到這些患兒可能有認知障礙的風險增高并且進行監測是很迫切的。重要的是,本文的綜合整合數據向臨床工作者表明這種情況的效應是廣泛的,即使是在最近對此種效應概念的修正中也有提到。
本研究的局限是不能研究在癲癇活動期的認知狀況。一個相關的臨床問題即是否在恢復期(在停止發作和 EEG 正常化之后)時存在殘余的損害。雖然很有限,一些研究已經著眼于認知結果的發展,他們通過前瞻性縱向或者回顧性隨訪設計進行研究,結果也不盡相同。目前很突出的一個爭論是是否 ECTS 的認知損害能在大多數情況隨著癲癇緩解全面恢復。另外,有些證據指出更嚴重或者存在不典型 EEG 特征的患兒更有可能有殘余的口頭/語言類的缺陷和較差恢復。有殘余 Gc 缺陷的傾向性可能是由這個因素的損害更突出有關。
然而,考慮癲癇活動期的認知結果等研究是應該以批判性眼光來看待的。縱向研究方法學也是局限的,比如小樣本量、缺乏對照組和/或有個體失訪。因此,這個階段的結論仍是個傾向性的,目前可用研究較少且得出的結果缺乏統計學意義均可能導致對殘余損害的低估。最近,Garcia-Ramos 和同事們隨訪了一組新診斷 ECTS 患兒在診斷前兩年的認知功能軌跡。他們發現病例值和對照值的認知功能均持續發展,而組間的差異卻一直穩定。也就是說,ECTS 患兒相比其健康同齡人持續存在更差的認知結果。需要批判性看待的是,只有約一半的 ECTS 樣本在隨訪期間達到發作緩解,并且 EEG 是否正常化并沒有進行評估。
需要更多針對認知結果的超過癲癇活動期時間范圍的縱向研究。在已經確定有認知缺陷的患兒中,未來需要研究在活動期和緩解期如何使用臨床干預減小認知損害,無論是非藥物的還是結合 AEDs 治療。Eom 等進行了一項針對 10 例 ECTS 患兒為期 35 周鍛煉療法的前期研究,提示認知功能有顯著的提升并且父母評價內化和行為問題及生活質量均有改善。需要小心解讀這個前期試驗的數據,因為樣本量小且無對照組,但還是應該鼓勵進一步的對照研究。
4 結論
本研究整合了不同類型的研究并且對目前認為 ECTS 認知功能障礙是局限性或者特定的觀點提出了挑戰。盡管在語言和記憶編碼方面的效應相對更大,所有的認知能力都展現出相互覆蓋的置信區間,點估計值在小至大之間。正如預料,不同認知因素研究之間的效應存在本質性的不一致和異質性。因此結論為,ECTS 患兒展現出廣泛差異性的認知缺陷,與廣泛皮質功能障礙模型相一致。
聲明 本文作者表示沒有任何的利益沖突。確認我們已經仔細閱讀了本刊關于發表倫理的條例,并且確定本文符合這些內容。