引用本文: 吳婷婷, 陳孝利, 魏曉琴, 錢曉玲, 張梓堯, 韓琳, 馬玉霞. MMSE用于卒中后認知障礙診斷準確性的Meta分析. 中國循證醫學雜志, 2023, 23(8): 923-929. doi: 10.7507/1672-2531.202302088 復制
卒中后認知障礙(poststroke cognitive impairment,PSCI)是指在卒中事件后出現,卒中6個月時仍持續存在的以認知損害為特征的臨床綜合征。根據認知受損的嚴重程度,PSCI可分為卒中后認知障礙非癡呆和卒中后癡呆[1]。已有研究顯示,卒中后認知障礙發病率高達80.97%[2-3]。此外,還有研究顯示,卒中后癡呆患者1.5年的病死率高達50%[4],5年生存率僅為39%[5],70%的卒中患者工作能力和社會功能明顯受損[6]。
針對該現狀,有研究指出,對PSCI進行早期識別和干預可以延緩認知障礙的進展甚至逆轉認知結果[7],現有指南[8]和專家共識[9]均提倡對PSCI進行早期篩查和管理。簡易精神狀態檢查量表(mini-mental state examination,MMSE)作為國內外應用最廣的認知評估工具在PSCI的診斷中被廣泛應用。該量表對記憶力、定向力、注意力及計算力、回憶能力、語言能力5個方面進行篩查評分,量表總分30分,得分越高,說明認知功能越好[10]。
雖然MMSE應用廣泛,但國內外研究對MMSE量表截斷值的選擇卻各有差異,目前尚無被大眾認可的統一截斷值,MMSE診斷PSCI診斷準確性如何也尚不清楚。Shen等[11]針對急性缺血性卒中人群的相關研究發現,該量表的最佳截斷值為27/28,Cumming等[12]認為在急性缺血或出血性卒中人群中,MMSE的最佳截斷值為26/27。而我國臨床實踐中最常用的截斷值為23/24,且不同民族、不同地區、不同翻譯版本選擇的截斷值也不同。因此,本研究全面檢索MMSE量表診斷PSCI的診斷性試驗并評估該量表不同截斷值的診斷價值,為MMSE量表截斷值的臨床選擇提供參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
MMSE量表診斷PSCI的診斷性試驗。
1.1.2 研究對象
PSCI患者。
1.1.3 診斷方法
待評價診斷試驗為MMSE量表,包括被翻譯后應用到各個國家和地區的不同版本。診斷金標準:神經心理學評估。
1.1.4 結局指標
靈敏度(Sen)、特異度(Spe)、陽性似然比(+LR)、陰性似然比(?LR)、診斷比值比(DOR)及合并受試者工作特征曲線下面積(AUC)。
1.1.5 排除標準
① 診斷金標準采用MMSE或醫師的主觀判斷;② 年齡≤18歲;③ 無法提取診斷試驗四格表數據;⑤ 重復發表的文獻;⑥ 會議、碩博論文。
1.2 文獻檢索策略
計算機檢索PubMed、EMbase、Cochrane Library、Web of Science、CINAHL、CBM、VIP、CNKI和WanFang Data數據庫,搜集與研究目的相關的診斷性試驗,檢索采用主題詞結合自由詞的方式,檢索時限均為建庫至2022年11月。英文檢索詞包括:stroke、cognitive dysfunction、post-stroke cognitive impairment、MMSE、mini-mental state examination等;中文檢索詞包括:中風、卒中、神經行為障礙、認知功能障礙、簡易精神狀態檢查表等。以PubMed為例,其具體檢索策略見附件框1。
1.3 文獻篩選與資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。采用自制資料提取表提取資料,資料提取中原文缺乏的信息與原作者聯系進行補充。資料提取內容主要包括:① 納入研究的信息:如標題、作者、發表年份等;② 研究對象基本特征(年齡、性別);③ 研究設計類型;④ 結局指標:MMSE量表診斷的不同截斷值、教育水平校正標準及其校正后的準確性數據。
1.4 納入研究的偏倚風險評價
由兩名研究者獨立評價納入研究的偏倚風險并交叉核對結果,如有分歧,則由第三位資深研究者仲裁解決。偏倚風險評價采用QUADAS-2工具[13]。
1.5 統計分析
本研究采用Stata 16.0軟件進行數據分析。① 采用層次綜合受試者工作特征曲線(hierarchical summary receive operating characteristic,HSROC)模型[14]對不同截斷值進行Meta分析,以擬合HSROC曲線的AUC值評價診斷價值大小。并根據貝葉斯原理,運用Fagan圖評價分析結果的臨床應用價值;② 采用雙變量混合效應模型[15]進行相同截斷值的Meta分析,計算Sen、Spe、AUC及95%CI。AUC>0.5表明有診斷價值,AUC值為0.5~0.7表明診斷價值較低,0.7~0.9表示診斷價值中等,AUC>0.9則表示診斷價值較高。若某一截斷值研究納入文獻≥10篇,則采用Deek’s漏斗圖[16]評價發表偏倚。
2 結果
2.1 文獻篩選流程及結果
初檢獲得相關文獻10 844篇,包括:PubMed(n=1 041)、EMbase(n=1 922)、Cochrane Library(n=695)、Web of Science(n=1 734)、CINAHL(n=165)、CBM(n=2 603)、VIP(n=75)、WanFang Data(n=462)、CNKI(n=2 149)。經逐層篩選后,最終納入23篇,其中2篇文獻[17-18]因只提供了不同教育程度下MMSE量表截斷值及其合并Sen及Spe,不能分別進行各截斷值下的點值合并,故只進行定性分析。共21篇文獻[11, 12, 19-37]采用雙變量混合效應模型進行定量分析,23篇文獻[11, 12, 17-37]采用HSROC模型進行定量分析。
2.2 納入研究的基本特征及偏倚風險評價結果

2.3 Meta分析結果
2.3.1 基于HSROC模型的診斷準確性
HSROC模型的分析結果顯示,Sen合并=0.77,95%CI(0.70,0.83);Spe合并=0.76,95%CI(0.69,0.83),Beta=0.1,95%CI(?0.13,0.33),Z=0.82,P=0.41>0.1,Lambda=2.38,95%CI(2.12,2.64)。繪制HSROC曲線,AUC=0.84,95%CI(0.80,0.87)(圖1)。

2.3.2 Fagan圖分析結果
采用Fagan圖評價該診斷工具的臨床應用價值,見附件圖2。Fagan驗前概率為38%,+LR=3.3,陽性驗后概率為67%,?LR=0.3,陰性驗后概率=16%。
2.3.3 不同截斷值的Meta分析結果
通過對23/24~29/30的不同截斷值進行Meta分析,綜合考量AUC值、Sen、Spe,結果顯示23/24為MMSE量表診斷PSCI的最佳截斷值,見表2。該截斷值的Sen合并=0.75,95%CI(0.52,0.89);Spe合并=0.90,95%CI(0.81,0.95);+LR=7.8,95%CI(4.3,14.4);?LR=0.28,95%CI(0.13,0.57);DOR=28,95%CI(12,65);AUC=0.92,95%CI(0.89,0.94),見附件圖3和圖4。

2.3.4 發表偏倚
MMSE量表不同截斷值的漏斗圖基本對稱,均顯示P值>0.05,提示無明顯發表偏倚。
3 討論
PSCI發展隱匿,易被忽視,但伴隨中國卒中患者數量的快速增長,該病也受到了越來越多的關注。MMSE作為世界范圍內應用最廣的認知評估工具對該疾病的診斷價值如何也備受臨床關注。本研究基于HSROC模型的結果顯示,MMSE作為PSCI的診斷工具有一定診斷價值,總體診斷效能中等。對不同截斷值經雙變量混合效應模型的結果顯示,截斷值取23/24時診斷價值最高。
3.1 MMSE用于評估PSCI的診斷價值方面
本研究結果顯示,MMSE診斷PSCI的Sen合并為0.77,表明MMSE量表可以診斷出77%的PSCI患者,漏診率為23%;Spe合并為0.76,表明24%可能被誤診,擬合HSROC曲線,其AUC值為0.84,表明該量表具有中等診斷效能。同時Fagan圖結果顯示:當使用MMSE診斷后,量表得分小于診斷截斷值時,診斷為PSCI的可能性上升至67%,若MMSE得分大于診斷截斷值,則診斷為PSCI的概率降低至16%。結合臨床實踐反饋,我們發現MMSE作為PSCI的診斷工具雖然具有一定的診斷價值,但總體診斷效能不高。可能的原因在于MMSE量表并非PSCI的特異性診斷工具,其量表編制最初是用于社區老年癡呆癥的診斷,隨后作為評估認知功能的普適性診斷工具被廣泛應用于PSCI患者中。其次,基于疾病自身特點,由于PSCI累及的病灶區域不同于其他疾病,腦卒中一般不引起全面性的認知損害,且PSCI發病時間也存在較大差異,輕度卒中后認知障礙可以在出院后相對較長一段時間出現。相關研究[38-40]認為,MMSE在腦卒中患者的PSCI評估中存在局限性,尤其是對卒中發病1年后的認知功能障礙評估的靈敏性較低。這也進一步提示,雖然MMSE作為PSCI的診斷工具被廣為接受并應用,但該量表對PSCI診斷缺乏特異性。為提高PSCI的早期診斷率,應盡可能聯合其他診斷工具,實現優勢互補,以此提高診斷的準確性。有關共識[41]也指出應盡快編制符合我國文化背景的腦卒中認知功能評估工具。同時,隨著社區康復服務的快速發展,卒中患者住院時間大大縮短,輕度認知障礙可能在出院后逐步顯現,因此,關注PSCI早期篩查的同時也應注重長期隨訪,以此促進相關研究的干預及發展。
3.2 MMSE評估PSCI最佳截斷界值的診斷價值方面
在不同截斷值中綜合考量AUC值、靈敏度、特異度,發現23/24為MMSE量表診斷PSCI的最佳截斷值,與以往研究[23, 28]結果一致。但這與Dong[24]、Ciesielska等[42]研究的最佳截斷值分別為26/27、27/28不同,可能的原因是本研究為減少不同研究間異質性,選取的研究對象均為住院患者。因此,相較于社區、門診患者及其他人群,住院患者受疾病本身影響程度更深,認知障礙更為嚴重,運用MMSE量表診斷時較低截斷值即可判斷患者存在認知障礙風險。同時,根據疾病劃分類型,卒中包括缺血性卒中和出血性卒中,出血性卒中雖占比較小,但在卒中后認知障礙群體中仍是不容忽視的重要組成部分,本研究納入對象包括缺血性及出血性卒中后認知障礙患者,這與大多數研究只納入了缺血性卒中后認知障礙患者的人群構成不同,因此,與其它研究相比,本研究結果得出的最佳截斷值也不同。此外,量表編譯及應用存在明顯的文化差異。不同國家、不同種族在診斷同一卒中后認知障礙患者時其最佳截斷值選擇也可能不同。
3.3 研究的優勢與不足
本研究的優點:本研究采用了統計學上更為嚴密的雙變量模型和HSROC模型,雙變量模型擺脫了固定效應模型可能給出有偏估計及低估標準誤的明顯缺陷;HSROC模型擴展了Logistic回歸模型,更完整地解釋了真陽性率和假陰性率研究內和研究間的變異,使得最終的統計結果更為可靠。
本研究的局限性:① 由于納入研究較少,故在做不同截斷值下點值合并時因入選研究過少而未能進行全部截斷值下的合并分析。② 以不同分類標準做亞組分析時因受同一截斷值標準限制病例較少、結果不可靠而未做進一步分析及研究。③ 現階段卒中患者年輕化趨勢明顯,但本文針對不同年齡做分層分析時因原始文獻無統一年齡分層,故未進行年齡的亞組分析,造成一定程度的偏倚,在未來的研究中仍有待于進一步補充完善。
綜上所述,本研究結果顯示MMSE作為PSCI的篩查工具有一定的診斷價值,且截斷值取23/24時診斷價值最高。但受納入研究數量和質量的限制,上述結論尚待更多高質量研究予以驗證。其次,雖然神經心理學評估問卷及量表被廣泛應用于疾病篩查中,但均屬于主觀性評價工具。近年來隨著對PSCI評價工具的深入研究,事件相關誘發電位、功能性近紅外光譜分析等客觀評估工具也得到了快速發展,因此,我們應該將主客觀評價工具相結合,挖掘出PSCI評估工具的最佳組合方案,為PSCI病人診斷、治療和護理提供方向。
卒中后認知障礙(poststroke cognitive impairment,PSCI)是指在卒中事件后出現,卒中6個月時仍持續存在的以認知損害為特征的臨床綜合征。根據認知受損的嚴重程度,PSCI可分為卒中后認知障礙非癡呆和卒中后癡呆[1]。已有研究顯示,卒中后認知障礙發病率高達80.97%[2-3]。此外,還有研究顯示,卒中后癡呆患者1.5年的病死率高達50%[4],5年生存率僅為39%[5],70%的卒中患者工作能力和社會功能明顯受損[6]。
針對該現狀,有研究指出,對PSCI進行早期識別和干預可以延緩認知障礙的進展甚至逆轉認知結果[7],現有指南[8]和專家共識[9]均提倡對PSCI進行早期篩查和管理。簡易精神狀態檢查量表(mini-mental state examination,MMSE)作為國內外應用最廣的認知評估工具在PSCI的診斷中被廣泛應用。該量表對記憶力、定向力、注意力及計算力、回憶能力、語言能力5個方面進行篩查評分,量表總分30分,得分越高,說明認知功能越好[10]。
雖然MMSE應用廣泛,但國內外研究對MMSE量表截斷值的選擇卻各有差異,目前尚無被大眾認可的統一截斷值,MMSE診斷PSCI診斷準確性如何也尚不清楚。Shen等[11]針對急性缺血性卒中人群的相關研究發現,該量表的最佳截斷值為27/28,Cumming等[12]認為在急性缺血或出血性卒中人群中,MMSE的最佳截斷值為26/27。而我國臨床實踐中最常用的截斷值為23/24,且不同民族、不同地區、不同翻譯版本選擇的截斷值也不同。因此,本研究全面檢索MMSE量表診斷PSCI的診斷性試驗并評估該量表不同截斷值的診斷價值,為MMSE量表截斷值的臨床選擇提供參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
MMSE量表診斷PSCI的診斷性試驗。
1.1.2 研究對象
PSCI患者。
1.1.3 診斷方法
待評價診斷試驗為MMSE量表,包括被翻譯后應用到各個國家和地區的不同版本。診斷金標準:神經心理學評估。
1.1.4 結局指標
靈敏度(Sen)、特異度(Spe)、陽性似然比(+LR)、陰性似然比(?LR)、診斷比值比(DOR)及合并受試者工作特征曲線下面積(AUC)。
1.1.5 排除標準
① 診斷金標準采用MMSE或醫師的主觀判斷;② 年齡≤18歲;③ 無法提取診斷試驗四格表數據;⑤ 重復發表的文獻;⑥ 會議、碩博論文。
1.2 文獻檢索策略
計算機檢索PubMed、EMbase、Cochrane Library、Web of Science、CINAHL、CBM、VIP、CNKI和WanFang Data數據庫,搜集與研究目的相關的診斷性試驗,檢索采用主題詞結合自由詞的方式,檢索時限均為建庫至2022年11月。英文檢索詞包括:stroke、cognitive dysfunction、post-stroke cognitive impairment、MMSE、mini-mental state examination等;中文檢索詞包括:中風、卒中、神經行為障礙、認知功能障礙、簡易精神狀態檢查表等。以PubMed為例,其具體檢索策略見附件框1。
1.3 文獻篩選與資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。采用自制資料提取表提取資料,資料提取中原文缺乏的信息與原作者聯系進行補充。資料提取內容主要包括:① 納入研究的信息:如標題、作者、發表年份等;② 研究對象基本特征(年齡、性別);③ 研究設計類型;④ 結局指標:MMSE量表診斷的不同截斷值、教育水平校正標準及其校正后的準確性數據。
1.4 納入研究的偏倚風險評價
由兩名研究者獨立評價納入研究的偏倚風險并交叉核對結果,如有分歧,則由第三位資深研究者仲裁解決。偏倚風險評價采用QUADAS-2工具[13]。
1.5 統計分析
本研究采用Stata 16.0軟件進行數據分析。① 采用層次綜合受試者工作特征曲線(hierarchical summary receive operating characteristic,HSROC)模型[14]對不同截斷值進行Meta分析,以擬合HSROC曲線的AUC值評價診斷價值大小。并根據貝葉斯原理,運用Fagan圖評價分析結果的臨床應用價值;② 采用雙變量混合效應模型[15]進行相同截斷值的Meta分析,計算Sen、Spe、AUC及95%CI。AUC>0.5表明有診斷價值,AUC值為0.5~0.7表明診斷價值較低,0.7~0.9表示診斷價值中等,AUC>0.9則表示診斷價值較高。若某一截斷值研究納入文獻≥10篇,則采用Deek’s漏斗圖[16]評價發表偏倚。
2 結果
2.1 文獻篩選流程及結果
初檢獲得相關文獻10 844篇,包括:PubMed(n=1 041)、EMbase(n=1 922)、Cochrane Library(n=695)、Web of Science(n=1 734)、CINAHL(n=165)、CBM(n=2 603)、VIP(n=75)、WanFang Data(n=462)、CNKI(n=2 149)。經逐層篩選后,最終納入23篇,其中2篇文獻[17-18]因只提供了不同教育程度下MMSE量表截斷值及其合并Sen及Spe,不能分別進行各截斷值下的點值合并,故只進行定性分析。共21篇文獻[11, 12, 19-37]采用雙變量混合效應模型進行定量分析,23篇文獻[11, 12, 17-37]采用HSROC模型進行定量分析。
2.2 納入研究的基本特征及偏倚風險評價結果

2.3 Meta分析結果
2.3.1 基于HSROC模型的診斷準確性
HSROC模型的分析結果顯示,Sen合并=0.77,95%CI(0.70,0.83);Spe合并=0.76,95%CI(0.69,0.83),Beta=0.1,95%CI(?0.13,0.33),Z=0.82,P=0.41>0.1,Lambda=2.38,95%CI(2.12,2.64)。繪制HSROC曲線,AUC=0.84,95%CI(0.80,0.87)(圖1)。

2.3.2 Fagan圖分析結果
采用Fagan圖評價該診斷工具的臨床應用價值,見附件圖2。Fagan驗前概率為38%,+LR=3.3,陽性驗后概率為67%,?LR=0.3,陰性驗后概率=16%。
2.3.3 不同截斷值的Meta分析結果
通過對23/24~29/30的不同截斷值進行Meta分析,綜合考量AUC值、Sen、Spe,結果顯示23/24為MMSE量表診斷PSCI的最佳截斷值,見表2。該截斷值的Sen合并=0.75,95%CI(0.52,0.89);Spe合并=0.90,95%CI(0.81,0.95);+LR=7.8,95%CI(4.3,14.4);?LR=0.28,95%CI(0.13,0.57);DOR=28,95%CI(12,65);AUC=0.92,95%CI(0.89,0.94),見附件圖3和圖4。

2.3.4 發表偏倚
MMSE量表不同截斷值的漏斗圖基本對稱,均顯示P值>0.05,提示無明顯發表偏倚。
3 討論
PSCI發展隱匿,易被忽視,但伴隨中國卒中患者數量的快速增長,該病也受到了越來越多的關注。MMSE作為世界范圍內應用最廣的認知評估工具對該疾病的診斷價值如何也備受臨床關注。本研究基于HSROC模型的結果顯示,MMSE作為PSCI的診斷工具有一定診斷價值,總體診斷效能中等。對不同截斷值經雙變量混合效應模型的結果顯示,截斷值取23/24時診斷價值最高。
3.1 MMSE用于評估PSCI的診斷價值方面
本研究結果顯示,MMSE診斷PSCI的Sen合并為0.77,表明MMSE量表可以診斷出77%的PSCI患者,漏診率為23%;Spe合并為0.76,表明24%可能被誤診,擬合HSROC曲線,其AUC值為0.84,表明該量表具有中等診斷效能。同時Fagan圖結果顯示:當使用MMSE診斷后,量表得分小于診斷截斷值時,診斷為PSCI的可能性上升至67%,若MMSE得分大于診斷截斷值,則診斷為PSCI的概率降低至16%。結合臨床實踐反饋,我們發現MMSE作為PSCI的診斷工具雖然具有一定的診斷價值,但總體診斷效能不高。可能的原因在于MMSE量表并非PSCI的特異性診斷工具,其量表編制最初是用于社區老年癡呆癥的診斷,隨后作為評估認知功能的普適性診斷工具被廣泛應用于PSCI患者中。其次,基于疾病自身特點,由于PSCI累及的病灶區域不同于其他疾病,腦卒中一般不引起全面性的認知損害,且PSCI發病時間也存在較大差異,輕度卒中后認知障礙可以在出院后相對較長一段時間出現。相關研究[38-40]認為,MMSE在腦卒中患者的PSCI評估中存在局限性,尤其是對卒中發病1年后的認知功能障礙評估的靈敏性較低。這也進一步提示,雖然MMSE作為PSCI的診斷工具被廣為接受并應用,但該量表對PSCI診斷缺乏特異性。為提高PSCI的早期診斷率,應盡可能聯合其他診斷工具,實現優勢互補,以此提高診斷的準確性。有關共識[41]也指出應盡快編制符合我國文化背景的腦卒中認知功能評估工具。同時,隨著社區康復服務的快速發展,卒中患者住院時間大大縮短,輕度認知障礙可能在出院后逐步顯現,因此,關注PSCI早期篩查的同時也應注重長期隨訪,以此促進相關研究的干預及發展。
3.2 MMSE評估PSCI最佳截斷界值的診斷價值方面
在不同截斷值中綜合考量AUC值、靈敏度、特異度,發現23/24為MMSE量表診斷PSCI的最佳截斷值,與以往研究[23, 28]結果一致。但這與Dong[24]、Ciesielska等[42]研究的最佳截斷值分別為26/27、27/28不同,可能的原因是本研究為減少不同研究間異質性,選取的研究對象均為住院患者。因此,相較于社區、門診患者及其他人群,住院患者受疾病本身影響程度更深,認知障礙更為嚴重,運用MMSE量表診斷時較低截斷值即可判斷患者存在認知障礙風險。同時,根據疾病劃分類型,卒中包括缺血性卒中和出血性卒中,出血性卒中雖占比較小,但在卒中后認知障礙群體中仍是不容忽視的重要組成部分,本研究納入對象包括缺血性及出血性卒中后認知障礙患者,這與大多數研究只納入了缺血性卒中后認知障礙患者的人群構成不同,因此,與其它研究相比,本研究結果得出的最佳截斷值也不同。此外,量表編譯及應用存在明顯的文化差異。不同國家、不同種族在診斷同一卒中后認知障礙患者時其最佳截斷值選擇也可能不同。
3.3 研究的優勢與不足
本研究的優點:本研究采用了統計學上更為嚴密的雙變量模型和HSROC模型,雙變量模型擺脫了固定效應模型可能給出有偏估計及低估標準誤的明顯缺陷;HSROC模型擴展了Logistic回歸模型,更完整地解釋了真陽性率和假陰性率研究內和研究間的變異,使得最終的統計結果更為可靠。
本研究的局限性:① 由于納入研究較少,故在做不同截斷值下點值合并時因入選研究過少而未能進行全部截斷值下的合并分析。② 以不同分類標準做亞組分析時因受同一截斷值標準限制病例較少、結果不可靠而未做進一步分析及研究。③ 現階段卒中患者年輕化趨勢明顯,但本文針對不同年齡做分層分析時因原始文獻無統一年齡分層,故未進行年齡的亞組分析,造成一定程度的偏倚,在未來的研究中仍有待于進一步補充完善。
綜上所述,本研究結果顯示MMSE作為PSCI的篩查工具有一定的診斷價值,且截斷值取23/24時診斷價值最高。但受納入研究數量和質量的限制,上述結論尚待更多高質量研究予以驗證。其次,雖然神經心理學評估問卷及量表被廣泛應用于疾病篩查中,但均屬于主觀性評價工具。近年來隨著對PSCI評價工具的深入研究,事件相關誘發電位、功能性近紅外光譜分析等客觀評估工具也得到了快速發展,因此,我們應該將主客觀評價工具相結合,挖掘出PSCI評估工具的最佳組合方案,為PSCI病人診斷、治療和護理提供方向。