引用本文: 茍馨云, 李涓, 鐘冬靈, 李雨谿, 趙靜, 劉小菠, 夏海莎, 艾雙春, 金榮疆. MRI用于診斷學齡前孤獨癥譜系障礙準確性的Meta分析. 中國循證醫學雜志, 2022, 22(4): 422-429. doi: 10.7507/1672-2531.202111011 復制
孤獨癥譜系障礙(autism spectrum disorder,ASD)是一組3歲前起病的復雜性神經發育障礙,具體表現為早期出現的社會溝通交往障礙、刻板興趣和行為,是中國0~6歲兒童精神致殘的首要原因[1]。ASD全球發病率約為1%~2%[2],目前確診多采用行為觀察和量表評估,但該方法存在一定的主觀性,且確診周期長;其次,受患兒行為、癥狀差異性影響,早期確診難以實現。在我國已確診ASD中,首次確診平均年齡多在3~4歲,但由于存在漏診及家屬故意隱瞞等問題,我國報告的ASD患病率遠低于全球平均水平[3-5];國外研究顯示,ASD首次確診平均年齡多在4歲后,79%的ASD患兒在入學后才得到確診[6-8]。而ASD早期診斷能在促進我們了解ASD早期發展進程的同時,也促進患兒的早期治療。由于嬰幼兒時期大腦可塑性強,學齡前是進行康復干預的黃金時期,能幫助患兒降低自閉癥嚴重程度,改善遠期結局指標,因此需要一種更為客觀有效的手段作為學齡前ASD診斷的輔助證據[7,9-11]。磁共振成像(magnetic resonance imaging,MRI)是一種非侵入性神經生理標志物檢測工具。有研究表明,2~4歲是大腦異常生長最為明顯的時期,而大腦成像在6個月時即可被識別,故MRI有望作為ASD早期診斷的輔助工具[12-14]。目前已有相關研究在多站點神經圖像存儲庫,如國家自閉癥研究數據庫(national database for autism research,NDAR)和自閉癥腦成像交換(autism brain imaging data exchange,ABIDE)等的基礎上,較為準確地對學齡前ASD進行了診斷,但仍需更大的樣本量以應對不同ASD的診斷異質性[15]。本研究系統評價MRI診斷學齡前ASD的準確性,為臨床實踐提供參考依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
診斷性研究。
1.1.2 研究對象
從出生至學齡前(平均年齡≤7歲)的ASD患兒。
1.1.3 診斷方法
待評價方法為MRI,包含彌散張量成像(diffusion tensor imaging,DTI)、擴散加權成像(diffusion-weighted imaging,DWI)、fMRI和sMRI,診斷金標準為孤獨癥診斷訪談量表(autism diagnostic interview-revised,ADI-R)和孤獨癥診斷觀察量表(autism diagnostic observation schedule,ADOS)。
1.1.4 結局指標
合并敏感度(pooled sensitivity,Sen合并)、合并特異度(pooled specificity,Spe合并)、合并陽性似然比(pooled positive likelihood ratio,+LR合并)、合并陰性似然比(pooled negative likelihood ratio,?LR合并)、合并診斷比值比(pooled diagnosis odds ratio,DOR合并)、受試者工作特征曲線下面積(area under the curve,AUC)。
1.1.5 排除標準
① 納入了注意力缺陷或阿斯伯格綜合征患兒的研究;② 動物實驗等基礎研究;③ 無法獲得全文或重復發表的研究;④ 無法直接或間接獲得四格表數據;⑤ 非中、英文文獻。
1.2 文獻檢索策略
計算機檢索Web of Science、PubMed、The Cochrane Library、EMbase、CBM、CNKI、WanFang Data和VIP數據庫,搜集MRI診斷ASD的相關研究,檢索時限均從建庫至2022年1月29日。此外,追溯納入文獻的參考文獻,以補充獲取相關文獻。檢索采取主題詞和自由詞相結合的方式。中文檢索詞包括:孤獨癥、自閉癥譜系障礙、經典自閉癥、自閉癥嬰兒、核磁、神經成像、MRI、核磁共振成像、MR、機器學習等;英文檢索式包括:autism spectrum disorder、classical-autis、sensitivity、specificity、magnetic resonance imaging、machine learning等。以PubMed為例,其具體檢索策略見框1。

1.3 文獻篩選與資料提取
由2位評價員獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:研究特征(作者、發表年份、樣本量等)、參與者特征(年齡范圍、診斷方法、來源等)、方法特征(預測方法、分析特征等)、診斷性試驗結果[真陽性(true positive,TP)、假陽性(false positive,FP)、假陰性(false negative,FN)、真陰性(true negative,TN)]。
1.4 納入研究的偏倚風險評價
由2名評價員獨立采用QUADAS-2質量評價工具評價納入研究的偏倚風險。如遇分歧,討論解決,或由第3名評價員參與確認。
1.5 統計分析
采用Meta-Disc、RevMan 5.4和Stata 16.0軟件進行Meta分析。Spearman相關系數用于探討是否存在閾值效應,I2統計量探討是否存在非閾值效應所致異質性,若I2>50%或P<0.05則代表納入研究間異質性顯著,使用隨機效應模型進行處理或只行描述性分析,并進一步探索異質性來源。若無明顯異質性,則采用固定效應模型合并敏感度、特異度、陽性似然比、陰性似然比、診斷比值比、曲線下面積。各效應量均提供95%CI,Meta分析的檢驗水準為α=0.05。根據受試者年齡、來源、預測方法及分析特征進行亞組分析。由于各研究分析特征的多樣性,亞組分析將按照皮質特征(皮質體積、厚度等)、神經特征(功能連接、神經激活等)及腦脊液進行。通過Stata 16.0統計軟件繪制Deek’s漏斗圖,評價納入研究的發表偏倚,P<0.05表示存在發表偏倚。最后對研究結果進行敏感性分析,采用逐一排除方法,并利用二元箱線圖對異質性大的文獻進行排除。
2 結果
2.1 文獻篩選流程及結果
初檢出相關文獻3 759篇,經逐層篩選后,最終納入17篇文獻[13,15-30],其中2篇文獻[29-30]可分別提取2個可用數據集,共19個數據集。文獻篩選流程及結果見圖1。

2.2 納入研究的基本特征與偏倚風險評價結果


2.3 Meta分析結果
2.3.1 異質性分析
經Spearman相關分析,其相關系數為ρ=?0.322(P=0.179),表明本研究不存在閾值效應,可合并分析。Cochran-Q=75.76(P<0.001),表明納入文獻間存在由非閾值效應引起的異質性。敏感度、特異性、DOR值的異質性結果分別為I2=59.1%(P=0.001),I2=89.1%(P<0.001),I2=76.2%(P<0.001),表明納入研究間存在較大異質性。
2.3.2 合并效應量
隨機效應模型Meta分析結果顯示:MRI對學齡前ASD診斷的Sen合并、Spe合并、+LR合并、?LR合并、DOR合并和AUC分別為:0.78[95%CI(0.76,0.81)]、0.77[95%CI(0.75,0.79)]、3.92[95%CI(2.83,5.41)]、0.28[95%CI(0.23,0.35)]、14.8[95%CI(9.31,23.52)]和0.86。
2.3.3 亞組分析
亞組分析結果顯示,受試者年齡、來源、預測方法及分析特征均是異質性的可能來源。1~3歲亞組異質性較小,固定效應模型Meta分析結果顯示:Sen合并、Spe合并和AUC分別為0.81[95%CI(0.76,0.85)]、0.82[95%CI(0.78,0.86)]和0.87;非站點研究間異質性較低,Meta分析結果顯示Sen合并、Spe合并和AUC分別為0.80[95%CI(0.75,0.84)]、0.80[95%CI(0.76,0.85)]和0.86。其余亞組均存在一定異質性,采用隨機效應模型合并效應量,結果見表3。

2.4 發表偏倚檢驗
由Deek’s漏斗圖可知,P=0.01<0.05,提示可能存在發表偏倚(篇幅所限,漏斗圖可聯系通訊作者獲取)。
2.5 敏感性分析
采用逐一剔除納入研究進行敏感性分析,未發現對結果有較大影響的研究,統計結果較為穩健。排除4個[15,17,26-27]異質性較大的研究后,結果顯示MRI診斷學齡前ASD的Sen合并、Spe合并和AUC分別為:0.77[95%CI(0.74,0.80)]、0.81[95%CI(0.78,0.83)]和0.87,表明結果較為穩健。
3 討論
ASD患者存在神經可塑性異常,這將導致大腦發育敏感期的持續時間和強度異常[31-32]。早期干預有可能幫助調節敏感期,阻止某些行為和功能障礙的發展[33]。Pickles等[34]研究證實,在6歲前對ASD患兒進行干預更容易實現語言軌跡的改變。目前已有研究表明MRI可用于ASD早期診斷。本研究結果顯示,采用MRI診斷學齡前ASD的敏感度為78%,特異度為77%;+LR為3.92>1,?LR為0.28<1,說明MRI診斷出ASD真陽性和真陰性可能性大[35];AUC為0.86,表明其診斷效能較高,但仍然存在漏診和誤診可能性;Song等[36]的研究也報道了相似結果(AUC為0.89),但該研究中只納入了使用機器學習識別ASD的研究。因此,MRI可作為學齡前ASD量表行為評估的輔助診斷方法。
亞組分析結果表明:① 非站點研究(AUC=0.86)和站點研究(AUC=0.85)結果無明顯差異,但基于站點研究的研究間存在一定異質性,原因可能是多中心站點研究導致了站點間差異。多站點神經圖像存儲庫由多中心上傳的MRI數據集合而成,Li等[37]指出這容易引起各站點間由于掃描儀制造商及受試者招募標準不同所造成的數據生成和收集方法、校準方法、掃描過程的不同[38]。② 年齡可能是影響MRI診斷ASD患兒準確性的因素。但這與Song等[36]的研究結果相悖,該研究將ASD患者年齡組分為:幼兒(<2歲)、兒童和青少年(<19歲)、成人(>20歲),組間和組內年齡跨度較大,這可能是造成該研究與其他研究存在差異的原因。而不同年齡組間MRI診斷的準確性還需更多研究加以探討。③ 本研究中針對腦脊液的預測方法僅包含了RUSBoost trees及傳統MRI檢測,得到AUC為0.79,相較于皮質及神經特征的診斷效能更低,這可能提示針對腦脊液的預測方法目前仍有待改善,需要研究進一步予以論證。④ 機器學習算法的應用提高了MRI的診斷準確度,本研究中機器學習的預測結果與Moon等[39]研究相類似,但并未發現SVM和CNN對學齡前ASD診斷精確度的差異。
盡管MRI診斷學齡前ASD準確性較高,但仍有一些問題需要克服。由于患兒腦體積較小,出生后8~12個月期間白質灰質分化較差,大腦重量在10~12歲才會達到成人值,因此成人的大腦成像分析在嬰幼兒腦成像中可能并不適宜[40];其次,在成像過程中,幼兒頭部運動難以避免,故而常導致成像質量低或不完整,需要一種更穩健的分割方式[41];由于男性患ASD比例更高,大多數ASD分類模型偏向男性建立,性別差異會導致大腦成像差異,對女性受試者的預測也可能會因此產生偏差[38,42],未來研究還需進一步建立針對女性患兒的分類模型,并納入更多的女性,擴大樣本量以增強其代表性。此外,ASD患兒共病及特征表現(如智力障礙、低語言能力等)具有多樣性和變異性[43-44],不同個體間大腦功能存在差異,在未來的試驗設計中應將該差異納入分析[45-47]。
本研究存在的局限性:① 本文納入研究少并且只包含中英文文獻,不足以反映ASD患者的生物多樣性。② 根據漏斗圖顯示本文存在一定發表偏倚,可能是受異質性等原因所影響[48],需要更多高質量研究予以論證。③ 由于研究數量限制,本文僅關注了機器學習算法中SVM和CNN對學齡前ASD兒童的預測準確度,未來還需更多研究。
綜上所述,MRI可用于ASD的早期診斷,但其針對嬰幼兒的成像及分割方式、預測手段目前仍處于研究階段,還需進一步結合ASD異質性探討MRI的臨床應用。受納入研究數量和質量的限性,上述結論尚需開展更多高質量研究予以驗證。
孤獨癥譜系障礙(autism spectrum disorder,ASD)是一組3歲前起病的復雜性神經發育障礙,具體表現為早期出現的社會溝通交往障礙、刻板興趣和行為,是中國0~6歲兒童精神致殘的首要原因[1]。ASD全球發病率約為1%~2%[2],目前確診多采用行為觀察和量表評估,但該方法存在一定的主觀性,且確診周期長;其次,受患兒行為、癥狀差異性影響,早期確診難以實現。在我國已確診ASD中,首次確診平均年齡多在3~4歲,但由于存在漏診及家屬故意隱瞞等問題,我國報告的ASD患病率遠低于全球平均水平[3-5];國外研究顯示,ASD首次確診平均年齡多在4歲后,79%的ASD患兒在入學后才得到確診[6-8]。而ASD早期診斷能在促進我們了解ASD早期發展進程的同時,也促進患兒的早期治療。由于嬰幼兒時期大腦可塑性強,學齡前是進行康復干預的黃金時期,能幫助患兒降低自閉癥嚴重程度,改善遠期結局指標,因此需要一種更為客觀有效的手段作為學齡前ASD診斷的輔助證據[7,9-11]。磁共振成像(magnetic resonance imaging,MRI)是一種非侵入性神經生理標志物檢測工具。有研究表明,2~4歲是大腦異常生長最為明顯的時期,而大腦成像在6個月時即可被識別,故MRI有望作為ASD早期診斷的輔助工具[12-14]。目前已有相關研究在多站點神經圖像存儲庫,如國家自閉癥研究數據庫(national database for autism research,NDAR)和自閉癥腦成像交換(autism brain imaging data exchange,ABIDE)等的基礎上,較為準確地對學齡前ASD進行了診斷,但仍需更大的樣本量以應對不同ASD的診斷異質性[15]。本研究系統評價MRI診斷學齡前ASD的準確性,為臨床實踐提供參考依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
診斷性研究。
1.1.2 研究對象
從出生至學齡前(平均年齡≤7歲)的ASD患兒。
1.1.3 診斷方法
待評價方法為MRI,包含彌散張量成像(diffusion tensor imaging,DTI)、擴散加權成像(diffusion-weighted imaging,DWI)、fMRI和sMRI,診斷金標準為孤獨癥診斷訪談量表(autism diagnostic interview-revised,ADI-R)和孤獨癥診斷觀察量表(autism diagnostic observation schedule,ADOS)。
1.1.4 結局指標
合并敏感度(pooled sensitivity,Sen合并)、合并特異度(pooled specificity,Spe合并)、合并陽性似然比(pooled positive likelihood ratio,+LR合并)、合并陰性似然比(pooled negative likelihood ratio,?LR合并)、合并診斷比值比(pooled diagnosis odds ratio,DOR合并)、受試者工作特征曲線下面積(area under the curve,AUC)。
1.1.5 排除標準
① 納入了注意力缺陷或阿斯伯格綜合征患兒的研究;② 動物實驗等基礎研究;③ 無法獲得全文或重復發表的研究;④ 無法直接或間接獲得四格表數據;⑤ 非中、英文文獻。
1.2 文獻檢索策略
計算機檢索Web of Science、PubMed、The Cochrane Library、EMbase、CBM、CNKI、WanFang Data和VIP數據庫,搜集MRI診斷ASD的相關研究,檢索時限均從建庫至2022年1月29日。此外,追溯納入文獻的參考文獻,以補充獲取相關文獻。檢索采取主題詞和自由詞相結合的方式。中文檢索詞包括:孤獨癥、自閉癥譜系障礙、經典自閉癥、自閉癥嬰兒、核磁、神經成像、MRI、核磁共振成像、MR、機器學習等;英文檢索式包括:autism spectrum disorder、classical-autis、sensitivity、specificity、magnetic resonance imaging、machine learning等。以PubMed為例,其具體檢索策略見框1。

1.3 文獻篩選與資料提取
由2位評價員獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:研究特征(作者、發表年份、樣本量等)、參與者特征(年齡范圍、診斷方法、來源等)、方法特征(預測方法、分析特征等)、診斷性試驗結果[真陽性(true positive,TP)、假陽性(false positive,FP)、假陰性(false negative,FN)、真陰性(true negative,TN)]。
1.4 納入研究的偏倚風險評價
由2名評價員獨立采用QUADAS-2質量評價工具評價納入研究的偏倚風險。如遇分歧,討論解決,或由第3名評價員參與確認。
1.5 統計分析
采用Meta-Disc、RevMan 5.4和Stata 16.0軟件進行Meta分析。Spearman相關系數用于探討是否存在閾值效應,I2統計量探討是否存在非閾值效應所致異質性,若I2>50%或P<0.05則代表納入研究間異質性顯著,使用隨機效應模型進行處理或只行描述性分析,并進一步探索異質性來源。若無明顯異質性,則采用固定效應模型合并敏感度、特異度、陽性似然比、陰性似然比、診斷比值比、曲線下面積。各效應量均提供95%CI,Meta分析的檢驗水準為α=0.05。根據受試者年齡、來源、預測方法及分析特征進行亞組分析。由于各研究分析特征的多樣性,亞組分析將按照皮質特征(皮質體積、厚度等)、神經特征(功能連接、神經激活等)及腦脊液進行。通過Stata 16.0統計軟件繪制Deek’s漏斗圖,評價納入研究的發表偏倚,P<0.05表示存在發表偏倚。最后對研究結果進行敏感性分析,采用逐一排除方法,并利用二元箱線圖對異質性大的文獻進行排除。
2 結果
2.1 文獻篩選流程及結果
初檢出相關文獻3 759篇,經逐層篩選后,最終納入17篇文獻[13,15-30],其中2篇文獻[29-30]可分別提取2個可用數據集,共19個數據集。文獻篩選流程及結果見圖1。

2.2 納入研究的基本特征與偏倚風險評價結果


2.3 Meta分析結果
2.3.1 異質性分析
經Spearman相關分析,其相關系數為ρ=?0.322(P=0.179),表明本研究不存在閾值效應,可合并分析。Cochran-Q=75.76(P<0.001),表明納入文獻間存在由非閾值效應引起的異質性。敏感度、特異性、DOR值的異質性結果分別為I2=59.1%(P=0.001),I2=89.1%(P<0.001),I2=76.2%(P<0.001),表明納入研究間存在較大異質性。
2.3.2 合并效應量
隨機效應模型Meta分析結果顯示:MRI對學齡前ASD診斷的Sen合并、Spe合并、+LR合并、?LR合并、DOR合并和AUC分別為:0.78[95%CI(0.76,0.81)]、0.77[95%CI(0.75,0.79)]、3.92[95%CI(2.83,5.41)]、0.28[95%CI(0.23,0.35)]、14.8[95%CI(9.31,23.52)]和0.86。
2.3.3 亞組分析
亞組分析結果顯示,受試者年齡、來源、預測方法及分析特征均是異質性的可能來源。1~3歲亞組異質性較小,固定效應模型Meta分析結果顯示:Sen合并、Spe合并和AUC分別為0.81[95%CI(0.76,0.85)]、0.82[95%CI(0.78,0.86)]和0.87;非站點研究間異質性較低,Meta分析結果顯示Sen合并、Spe合并和AUC分別為0.80[95%CI(0.75,0.84)]、0.80[95%CI(0.76,0.85)]和0.86。其余亞組均存在一定異質性,采用隨機效應模型合并效應量,結果見表3。

2.4 發表偏倚檢驗
由Deek’s漏斗圖可知,P=0.01<0.05,提示可能存在發表偏倚(篇幅所限,漏斗圖可聯系通訊作者獲取)。
2.5 敏感性分析
采用逐一剔除納入研究進行敏感性分析,未發現對結果有較大影響的研究,統計結果較為穩健。排除4個[15,17,26-27]異質性較大的研究后,結果顯示MRI診斷學齡前ASD的Sen合并、Spe合并和AUC分別為:0.77[95%CI(0.74,0.80)]、0.81[95%CI(0.78,0.83)]和0.87,表明結果較為穩健。
3 討論
ASD患者存在神經可塑性異常,這將導致大腦發育敏感期的持續時間和強度異常[31-32]。早期干預有可能幫助調節敏感期,阻止某些行為和功能障礙的發展[33]。Pickles等[34]研究證實,在6歲前對ASD患兒進行干預更容易實現語言軌跡的改變。目前已有研究表明MRI可用于ASD早期診斷。本研究結果顯示,采用MRI診斷學齡前ASD的敏感度為78%,特異度為77%;+LR為3.92>1,?LR為0.28<1,說明MRI診斷出ASD真陽性和真陰性可能性大[35];AUC為0.86,表明其診斷效能較高,但仍然存在漏診和誤診可能性;Song等[36]的研究也報道了相似結果(AUC為0.89),但該研究中只納入了使用機器學習識別ASD的研究。因此,MRI可作為學齡前ASD量表行為評估的輔助診斷方法。
亞組分析結果表明:① 非站點研究(AUC=0.86)和站點研究(AUC=0.85)結果無明顯差異,但基于站點研究的研究間存在一定異質性,原因可能是多中心站點研究導致了站點間差異。多站點神經圖像存儲庫由多中心上傳的MRI數據集合而成,Li等[37]指出這容易引起各站點間由于掃描儀制造商及受試者招募標準不同所造成的數據生成和收集方法、校準方法、掃描過程的不同[38]。② 年齡可能是影響MRI診斷ASD患兒準確性的因素。但這與Song等[36]的研究結果相悖,該研究將ASD患者年齡組分為:幼兒(<2歲)、兒童和青少年(<19歲)、成人(>20歲),組間和組內年齡跨度較大,這可能是造成該研究與其他研究存在差異的原因。而不同年齡組間MRI診斷的準確性還需更多研究加以探討。③ 本研究中針對腦脊液的預測方法僅包含了RUSBoost trees及傳統MRI檢測,得到AUC為0.79,相較于皮質及神經特征的診斷效能更低,這可能提示針對腦脊液的預測方法目前仍有待改善,需要研究進一步予以論證。④ 機器學習算法的應用提高了MRI的診斷準確度,本研究中機器學習的預測結果與Moon等[39]研究相類似,但并未發現SVM和CNN對學齡前ASD診斷精確度的差異。
盡管MRI診斷學齡前ASD準確性較高,但仍有一些問題需要克服。由于患兒腦體積較小,出生后8~12個月期間白質灰質分化較差,大腦重量在10~12歲才會達到成人值,因此成人的大腦成像分析在嬰幼兒腦成像中可能并不適宜[40];其次,在成像過程中,幼兒頭部運動難以避免,故而常導致成像質量低或不完整,需要一種更穩健的分割方式[41];由于男性患ASD比例更高,大多數ASD分類模型偏向男性建立,性別差異會導致大腦成像差異,對女性受試者的預測也可能會因此產生偏差[38,42],未來研究還需進一步建立針對女性患兒的分類模型,并納入更多的女性,擴大樣本量以增強其代表性。此外,ASD患兒共病及特征表現(如智力障礙、低語言能力等)具有多樣性和變異性[43-44],不同個體間大腦功能存在差異,在未來的試驗設計中應將該差異納入分析[45-47]。
本研究存在的局限性:① 本文納入研究少并且只包含中英文文獻,不足以反映ASD患者的生物多樣性。② 根據漏斗圖顯示本文存在一定發表偏倚,可能是受異質性等原因所影響[48],需要更多高質量研究予以論證。③ 由于研究數量限制,本文僅關注了機器學習算法中SVM和CNN對學齡前ASD兒童的預測準確度,未來還需更多研究。
綜上所述,MRI可用于ASD的早期診斷,但其針對嬰幼兒的成像及分割方式、預測手段目前仍處于研究階段,還需進一步結合ASD異質性探討MRI的臨床應用。受納入研究數量和質量的限性,上述結論尚需開展更多高質量研究予以驗證。