引用本文: 黃菲蕓, 王艷紅, 李娟娟, 王麗, 江宇, 廖蘇蘇. 蒙特利爾認知評估量表在中國中老年人群篩查輕度認知功能障礙中的截斷值的系統評價. 中國循證醫學雜志, 2017, 17(4): 450-457. doi: 10.7507/1672-2531.201609052 復制
輕度認知損害(mild cognitive impairment,MCI)患者是阿爾茨海默氏病(Alzheimer's disease,AD)或其他癡呆癥的高危人群,有研究者指出 MCI 患者每年轉變為癡呆的比例約為 10%~25%,而正常老年人每年僅為 1%~2%[1]。有研究表明 MCI 患者具有腦和認知的可塑性[2-4],針對其認知損傷開展干預能有效延緩認知功能的下降,減少其向 AD 轉化。因此,在我國快速老年化的社會,尋找有效的 MCI 篩查工具是開展 MCI 早期篩查、早期干預,減低老年期癡呆發病率的重要基礎。
蒙特利爾認知評估量表(The Montreal Cognitive Assessment,MoCA)是 2004 年由 Nasreddine 等[5]在簡明認知評估量表(The Mini-Mental State Examination,MMSE)的基礎上修改制定的用于篩查 MCI 的量表工具,現已被翻譯推廣到 51 個國家共 83 個版本(
采用 MoCA 量表進行中老年人群篩查的重要前提是要預先確定特定人群中診斷的最佳截斷值。目前,國內外對 MoCA 在中老年人中使用的最佳截斷值大小有不同的看法。MoCA 量表最初推薦使用 25/26 分作為判斷 MCI 的截值[5],而 Zhao 等[7]認為在中國 50~80 歲人群的最佳截值為 23/24 分,易剛等[8]認為在中國≥60 歲人群最佳截值為 21/22 分。而國外 Ciesielska 等[9]對 60 歲以上人群進行的 Meta 分析結果得出 MoCA 量表的最佳截值為 24/25 分(合并靈敏度為 80.48%,合并特異度為 81.19%)。由于即便是在相似年齡人群中的診斷研究,也可能因研究設計差異、診斷金標準的差異、文化程度構成不同等影響 MoCA 截斷值測量,從而得出不同的最佳截斷值。故本研究收集中國 50 歲以上中老年人群中使用中文 MoCA 量表與 Petersen 診斷標準比較診斷 MCI 的研究進行 Meta 分析,以進一步評價在我國中老年人群中 MCI 篩查的最佳截斷值。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型 MoCA 量表診斷 MCI 的診斷性試驗。
1.1.2 研究對象 使用漢語為母語的中國中老年人群。
1.1.3 診斷方法 待評價試驗為中文完整版 MoCA 量表,包括各地區的不同版本,如北京版、長沙版、香港版、廣東版、臺灣版等。診斷金標準為 Petersen 診斷標準[10-12]。
1.1.4 結局指標 敏感度(Sen)、特異度(Spe)、陽性似然比(+LR)、陰性似然比(–LR)、診斷性比值比(DOR)及合并受試者工作特征曲線下面積(AUC)。
1.1.5 排除標準 ① 以缺血性腦卒中、短暫性腦缺血、尿毒癥、糖尿病等可能影響認知功能疾病患者為研究對象的文獻;② 無法提取診斷試驗原始數據的文獻;③ 重復發表的文獻。
1.2 文獻檢索
計算機檢索 PubMed、EMbase、Web of Science、The Cochrane Library(2016 年 5 期)、OVID、CBM、CNKI、VIP 和 WanFang Data 數據庫,搜集 MoCA 量表中文版本在中國中老年人群中以 Petersen 標準診斷 MCI 的相關診斷性試驗,檢索時限均為從 2005 年 4 月 9 日到 2015 年 12 月 31 日。英文檢索詞包括:Asian continental ancestry group、Chinese、China、Asia、montreal cognitive assessment、MoCA;中文檢索詞包括:蒙特利爾、MoCA、診斷、界值、靈敏度、特異度等。以 PubMed 為例,其具體檢索策略見框 1。
1.3 文獻篩選與資料提取
由 2 位評價者按納入與排除標準獨立進行文獻篩選,使用 EpiData3.1 軟件進行資料提取。若一致性檢查發現有誤則查看原文進行修改,如遇分歧則交由第三位研究者協助判斷。缺乏的資料盡量與作者聯系予以補充。資料提取內容主要包括:① 納入研究的信息:標題、作者、發表年份;② 研究對象特征(年齡、性別、教育程度)、研究設計類型、研究對象來源、樣本量、MoCA 量表版本;③ 方法學質量評價結果;④ 所關注的結局指標和結果測量數據:MoCA 量表診斷的不同截斷值、教育水平校正標準及其校正后的準確性數據。
1.4 納入研究的偏倚風險評價
由兩名研究者獨立采用 Cochrane 協作網推薦的 QUADAS-2 工具[13,14]評價納入診斷試驗的方法學質量。如遇分歧,則交由第三位研究者協助判斷。對每個條目做出“是”、“否”、“不清楚”的判斷。如果一個領域內,所有問題的回答均為“是”,那么此領域為“低偏倚風險”;若所有回答均為“否”和均為“否”或“不清楚”,則判斷為“高偏倚風險”;其余標記為“偏倚風險不清”。
1.5 統計分析
采用 Stata 14.0 軟件進行雙變量混合效應模型 Meta 分析[15]。計算 Sen合并、Spe合并、AUC 及其 95%CI。根據研究設計類型、病例來源、量表版本進行亞組分析。若納入文獻≥10 篇,采用 Deek’s 漏斗圖[16]評估納入研究的發表偏倚情況。
2 結果
2.1 文獻檢索結果
初檢共獲得相關文獻 3 815 篇,經逐層篩選后,最終納入 27 個研究,共 5 755 例研究對象,按 Petersen 標準其中 1 997 人被診斷為 MCI。2 個研究[17,18]的研究因提供的數據是不同教育程度下 MoCA 量表截值及其準確值,故只納入定性分析并未進入定量分析。文獻篩選流程及結果見圖 1。

2.2 納入研究的基本特征與偏倚風險評價
納入研究的基本特征見表 1。從表 1 可見,27 個納入研究的年齡范圍為 43~92 歲;其中 14 個是橫斷面研究[8,33-45],13 個是病例-對照研究[7,21-32];8 個研究的對象為社區來源[8,26,33,34,37,39,41,42],19 個研究的對象全部或部分為醫院來源[7,21-25,27-32,35,36,38,40,43-45]。14 個研究采用“北京版”MoCA[7,8,22-26,30,32,34,39,41,43,45],2 個研究采用“廣東版”MoCA[36,37],1 個研究采用“長沙版”MoCA[35]、1個研究采用“香港版”MoCA[38]和 1 個研究采用“臺灣版”MoCA[27];其余 8 個研究未說明具體的版本[21,28,29,31,33,40,42,44]。

納入研究的偏倚風險評價結果見圖 2。

2.3 Meta 分析結果
2.3.1 不同截斷值的 Meta 分析結果 見表 2。從表 2 可見,雖然 AUC 最大的截斷值有 26/27 分和 25/26 分兩個,但 26/27 分的特異度僅為 0.59,而 25/26 分的特異度為 0.83,故本研究認為診斷的最佳截斷值應選擇 25/26 分。
2.3.2 最佳截斷值的診斷價值 當截斷值為 25/26 分時,此截斷值診斷價值最大[Sen合并=0.96,95%CI(0.93,0.97);Spe合并=0.83,95%CI(0.75,0.89);+LR=5.7,95%CI(3.8,8.7);–LR=0.05,95%CI(0.04,0.08);DOC=107,95%CI(61,188);AUC=0.97,95%CI(0.95,0.98)](圖 3 和圖 4)。


2.3.3 亞組分析
2.3.3.1 不同研究設計 橫斷面研究中[8,33-45]盡管截值 25/26 與 26/27 截值的 AUC 均為 0.98,但 26/27 截值下合并特異度僅為 0.61,低于 25/26 截值的合并特異度 0.84,故該亞組的最佳截斷值仍為 25/26,此截值下的合并靈敏度為 0.97;病例對照研究中[7,21-32]25/26 截值下合并靈敏度為 0.94,合并特異度為 0.83,23/24 截值合并靈敏度為 0.73,合并特異度為 0.98,其他截值下由于入選研究例數過少未能合并分析。
2.3.3.2 不同人群來源 來源于社區人群的研究[8,26,33,34,37,39,41,42],與其他截值相比較,25/26 截值合并 AUC 最大(0.98,合并靈敏度 0.97,合并特異度 0.85)仍為最佳截值;來源于醫院的研究[7,21-25,27-32,35,36,38,40,43-45],22/23 截值、23/24 截值和 25/26 截值的合并靈敏度、特異度和曲線下面積點估計值接近,但 25/26 截值的可信區間更窄,估計結果的變異性相對較小,故 25/26 截值仍為最佳截值,此時合并靈敏度為 0.95,合并特異度為 0.83。
2.3.3.3 MoCA 不同版本 由于使用其他中文版本的研究數量過少,故僅對“北京版”MoCA 分析[7,8,22-26,30,32,34,39,41,43,45],25/26 截值和 26/27 截值處靈敏度(0.95,0.97)相近、曲線下面積(0.96,0.97)相近,但 25/26 截值特異度更高(25/26:0.82,26/27:0.57),故最佳截值同樣為 25/26。
2.3.4 發表偏倚 MoCA 量表不同截值的漏斗圖基本對稱,P值均>0.1,提示無明顯發表偏倚。
3 討論
目前 MoCA 應用于中國中老年人群篩查輕度認知障礙的診斷研究中最佳截斷值結果各不相同,本研究系統收集了截止 2015 年 12 月發表的、在使用中文 MoCA 量表并且以 Petersen 標準為診斷金標準有關診斷準確性的 27 篇研究,這些研究的中老年人群年齡范圍在 43~92 歲。針對從 20/21 到 27/28 數個截斷值進行了 Meta 分析。考慮到這些研究存在不同研究設計和對象來源等差異,我們使用以隨機效應模型為理論基礎的雙變量模型,估算了不同截斷值的合并敏感度和特異度等準確性指標。定量分析結果顯示,雖然 MoCA 量表各截值 AUC 基本上都大于 0.9,但進一步考慮不同截值的合并敏感度/特異度值大小及其可信區間,國際推薦 MoCA 截值 25/26 仍是在我國 50 歲以上中老年人群中篩查 MCI 的相對最佳截值。
2012 年姚燕等[19]曾對 MoCA 量表 25/26 截斷點診斷準確性問題進行了 Meta 分析。這個研究報告 25/26 截斷點的合并靈敏度為 0.98,合并特異度為 0.55。但是,該研究納入的 13 篇研究中,診斷 MCI 的金標準既有 Petersen 標準也有 DSM-IV-R 標準,而且該研究采用 Meta-disc 軟件的簡單合并模型,這個模型的理論基礎是固定效應模型,不適合對有異質性研究進行 Meta 分析。這些差異或許可以部分解釋我們的分析結果和姚燕研究的不同。
本研究存在的一定局限性:① 認知能力是與年齡和受教育程度有關的。本研究合并的 27 個研究研究對象的年齡跨度大約 50~80 歲,因此這樣大的年齡變異仍舊采用同樣的篩查截斷值可能不妥,所以在使用 25/26 截斷值時要考慮這個問題。② 沈銀等[17,20]、張雪晴等[18]研究都報告了不同文化程度的人應該采用不同的最佳截值,本研究入選的 27 個研究,這些文獻中提供了按文化程度分層的截斷值的研究很少,故本研究未對不同教育程度 MoCA 截斷值進行亞組分析。此外,盡管分析中我們使用了雙變量隨機效應模型進行匯總,并嘗試采用亞組分析探討不同研究設計類型(橫斷面研究和病例對照研究)和不同對象來源(社區和醫院)MoCA 量表篩查 MCI 最佳截值,但由于受入選研究數目限制,未能對 MoCA 不同版本、不同人口特征等其他可能的異質性來源對截斷值的影響進行探討。
綜上所述,本研究結果顯示 MoCA 量表用于中國中老年人群 MCI 診斷時,25/26 截值為最佳截值,此時靈敏度為 0.96,特異度為 0.83。
輕度認知損害(mild cognitive impairment,MCI)患者是阿爾茨海默氏病(Alzheimer's disease,AD)或其他癡呆癥的高危人群,有研究者指出 MCI 患者每年轉變為癡呆的比例約為 10%~25%,而正常老年人每年僅為 1%~2%[1]。有研究表明 MCI 患者具有腦和認知的可塑性[2-4],針對其認知損傷開展干預能有效延緩認知功能的下降,減少其向 AD 轉化。因此,在我國快速老年化的社會,尋找有效的 MCI 篩查工具是開展 MCI 早期篩查、早期干預,減低老年期癡呆發病率的重要基礎。
蒙特利爾認知評估量表(The Montreal Cognitive Assessment,MoCA)是 2004 年由 Nasreddine 等[5]在簡明認知評估量表(The Mini-Mental State Examination,MMSE)的基礎上修改制定的用于篩查 MCI 的量表工具,現已被翻譯推廣到 51 個國家共 83 個版本(
采用 MoCA 量表進行中老年人群篩查的重要前提是要預先確定特定人群中診斷的最佳截斷值。目前,國內外對 MoCA 在中老年人中使用的最佳截斷值大小有不同的看法。MoCA 量表最初推薦使用 25/26 分作為判斷 MCI 的截值[5],而 Zhao 等[7]認為在中國 50~80 歲人群的最佳截值為 23/24 分,易剛等[8]認為在中國≥60 歲人群最佳截值為 21/22 分。而國外 Ciesielska 等[9]對 60 歲以上人群進行的 Meta 分析結果得出 MoCA 量表的最佳截值為 24/25 分(合并靈敏度為 80.48%,合并特異度為 81.19%)。由于即便是在相似年齡人群中的診斷研究,也可能因研究設計差異、診斷金標準的差異、文化程度構成不同等影響 MoCA 截斷值測量,從而得出不同的最佳截斷值。故本研究收集中國 50 歲以上中老年人群中使用中文 MoCA 量表與 Petersen 診斷標準比較診斷 MCI 的研究進行 Meta 分析,以進一步評價在我國中老年人群中 MCI 篩查的最佳截斷值。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型 MoCA 量表診斷 MCI 的診斷性試驗。
1.1.2 研究對象 使用漢語為母語的中國中老年人群。
1.1.3 診斷方法 待評價試驗為中文完整版 MoCA 量表,包括各地區的不同版本,如北京版、長沙版、香港版、廣東版、臺灣版等。診斷金標準為 Petersen 診斷標準[10-12]。
1.1.4 結局指標 敏感度(Sen)、特異度(Spe)、陽性似然比(+LR)、陰性似然比(–LR)、診斷性比值比(DOR)及合并受試者工作特征曲線下面積(AUC)。
1.1.5 排除標準 ① 以缺血性腦卒中、短暫性腦缺血、尿毒癥、糖尿病等可能影響認知功能疾病患者為研究對象的文獻;② 無法提取診斷試驗原始數據的文獻;③ 重復發表的文獻。
1.2 文獻檢索
計算機檢索 PubMed、EMbase、Web of Science、The Cochrane Library(2016 年 5 期)、OVID、CBM、CNKI、VIP 和 WanFang Data 數據庫,搜集 MoCA 量表中文版本在中國中老年人群中以 Petersen 標準診斷 MCI 的相關診斷性試驗,檢索時限均為從 2005 年 4 月 9 日到 2015 年 12 月 31 日。英文檢索詞包括:Asian continental ancestry group、Chinese、China、Asia、montreal cognitive assessment、MoCA;中文檢索詞包括:蒙特利爾、MoCA、診斷、界值、靈敏度、特異度等。以 PubMed 為例,其具體檢索策略見框 1。
1.3 文獻篩選與資料提取
由 2 位評價者按納入與排除標準獨立進行文獻篩選,使用 EpiData3.1 軟件進行資料提取。若一致性檢查發現有誤則查看原文進行修改,如遇分歧則交由第三位研究者協助判斷。缺乏的資料盡量與作者聯系予以補充。資料提取內容主要包括:① 納入研究的信息:標題、作者、發表年份;② 研究對象特征(年齡、性別、教育程度)、研究設計類型、研究對象來源、樣本量、MoCA 量表版本;③ 方法學質量評價結果;④ 所關注的結局指標和結果測量數據:MoCA 量表診斷的不同截斷值、教育水平校正標準及其校正后的準確性數據。
1.4 納入研究的偏倚風險評價
由兩名研究者獨立采用 Cochrane 協作網推薦的 QUADAS-2 工具[13,14]評價納入診斷試驗的方法學質量。如遇分歧,則交由第三位研究者協助判斷。對每個條目做出“是”、“否”、“不清楚”的判斷。如果一個領域內,所有問題的回答均為“是”,那么此領域為“低偏倚風險”;若所有回答均為“否”和均為“否”或“不清楚”,則判斷為“高偏倚風險”;其余標記為“偏倚風險不清”。
1.5 統計分析
采用 Stata 14.0 軟件進行雙變量混合效應模型 Meta 分析[15]。計算 Sen合并、Spe合并、AUC 及其 95%CI。根據研究設計類型、病例來源、量表版本進行亞組分析。若納入文獻≥10 篇,采用 Deek’s 漏斗圖[16]評估納入研究的發表偏倚情況。
2 結果
2.1 文獻檢索結果
初檢共獲得相關文獻 3 815 篇,經逐層篩選后,最終納入 27 個研究,共 5 755 例研究對象,按 Petersen 標準其中 1 997 人被診斷為 MCI。2 個研究[17,18]的研究因提供的數據是不同教育程度下 MoCA 量表截值及其準確值,故只納入定性分析并未進入定量分析。文獻篩選流程及結果見圖 1。

2.2 納入研究的基本特征與偏倚風險評價
納入研究的基本特征見表 1。從表 1 可見,27 個納入研究的年齡范圍為 43~92 歲;其中 14 個是橫斷面研究[8,33-45],13 個是病例-對照研究[7,21-32];8 個研究的對象為社區來源[8,26,33,34,37,39,41,42],19 個研究的對象全部或部分為醫院來源[7,21-25,27-32,35,36,38,40,43-45]。14 個研究采用“北京版”MoCA[7,8,22-26,30,32,34,39,41,43,45],2 個研究采用“廣東版”MoCA[36,37],1 個研究采用“長沙版”MoCA[35]、1個研究采用“香港版”MoCA[38]和 1 個研究采用“臺灣版”MoCA[27];其余 8 個研究未說明具體的版本[21,28,29,31,33,40,42,44]。

納入研究的偏倚風險評價結果見圖 2。

2.3 Meta 分析結果
2.3.1 不同截斷值的 Meta 分析結果 見表 2。從表 2 可見,雖然 AUC 最大的截斷值有 26/27 分和 25/26 分兩個,但 26/27 分的特異度僅為 0.59,而 25/26 分的特異度為 0.83,故本研究認為診斷的最佳截斷值應選擇 25/26 分。
2.3.2 最佳截斷值的診斷價值 當截斷值為 25/26 分時,此截斷值診斷價值最大[Sen合并=0.96,95%CI(0.93,0.97);Spe合并=0.83,95%CI(0.75,0.89);+LR=5.7,95%CI(3.8,8.7);–LR=0.05,95%CI(0.04,0.08);DOC=107,95%CI(61,188);AUC=0.97,95%CI(0.95,0.98)](圖 3 和圖 4)。


2.3.3 亞組分析
2.3.3.1 不同研究設計 橫斷面研究中[8,33-45]盡管截值 25/26 與 26/27 截值的 AUC 均為 0.98,但 26/27 截值下合并特異度僅為 0.61,低于 25/26 截值的合并特異度 0.84,故該亞組的最佳截斷值仍為 25/26,此截值下的合并靈敏度為 0.97;病例對照研究中[7,21-32]25/26 截值下合并靈敏度為 0.94,合并特異度為 0.83,23/24 截值合并靈敏度為 0.73,合并特異度為 0.98,其他截值下由于入選研究例數過少未能合并分析。
2.3.3.2 不同人群來源 來源于社區人群的研究[8,26,33,34,37,39,41,42],與其他截值相比較,25/26 截值合并 AUC 最大(0.98,合并靈敏度 0.97,合并特異度 0.85)仍為最佳截值;來源于醫院的研究[7,21-25,27-32,35,36,38,40,43-45],22/23 截值、23/24 截值和 25/26 截值的合并靈敏度、特異度和曲線下面積點估計值接近,但 25/26 截值的可信區間更窄,估計結果的變異性相對較小,故 25/26 截值仍為最佳截值,此時合并靈敏度為 0.95,合并特異度為 0.83。
2.3.3.3 MoCA 不同版本 由于使用其他中文版本的研究數量過少,故僅對“北京版”MoCA 分析[7,8,22-26,30,32,34,39,41,43,45],25/26 截值和 26/27 截值處靈敏度(0.95,0.97)相近、曲線下面積(0.96,0.97)相近,但 25/26 截值特異度更高(25/26:0.82,26/27:0.57),故最佳截值同樣為 25/26。
2.3.4 發表偏倚 MoCA 量表不同截值的漏斗圖基本對稱,P值均>0.1,提示無明顯發表偏倚。
3 討論
目前 MoCA 應用于中國中老年人群篩查輕度認知障礙的診斷研究中最佳截斷值結果各不相同,本研究系統收集了截止 2015 年 12 月發表的、在使用中文 MoCA 量表并且以 Petersen 標準為診斷金標準有關診斷準確性的 27 篇研究,這些研究的中老年人群年齡范圍在 43~92 歲。針對從 20/21 到 27/28 數個截斷值進行了 Meta 分析。考慮到這些研究存在不同研究設計和對象來源等差異,我們使用以隨機效應模型為理論基礎的雙變量模型,估算了不同截斷值的合并敏感度和特異度等準確性指標。定量分析結果顯示,雖然 MoCA 量表各截值 AUC 基本上都大于 0.9,但進一步考慮不同截值的合并敏感度/特異度值大小及其可信區間,國際推薦 MoCA 截值 25/26 仍是在我國 50 歲以上中老年人群中篩查 MCI 的相對最佳截值。
2012 年姚燕等[19]曾對 MoCA 量表 25/26 截斷點診斷準確性問題進行了 Meta 分析。這個研究報告 25/26 截斷點的合并靈敏度為 0.98,合并特異度為 0.55。但是,該研究納入的 13 篇研究中,診斷 MCI 的金標準既有 Petersen 標準也有 DSM-IV-R 標準,而且該研究采用 Meta-disc 軟件的簡單合并模型,這個模型的理論基礎是固定效應模型,不適合對有異質性研究進行 Meta 分析。這些差異或許可以部分解釋我們的分析結果和姚燕研究的不同。
本研究存在的一定局限性:① 認知能力是與年齡和受教育程度有關的。本研究合并的 27 個研究研究對象的年齡跨度大約 50~80 歲,因此這樣大的年齡變異仍舊采用同樣的篩查截斷值可能不妥,所以在使用 25/26 截斷值時要考慮這個問題。② 沈銀等[17,20]、張雪晴等[18]研究都報告了不同文化程度的人應該采用不同的最佳截值,本研究入選的 27 個研究,這些文獻中提供了按文化程度分層的截斷值的研究很少,故本研究未對不同教育程度 MoCA 截斷值進行亞組分析。此外,盡管分析中我們使用了雙變量隨機效應模型進行匯總,并嘗試采用亞組分析探討不同研究設計類型(橫斷面研究和病例對照研究)和不同對象來源(社區和醫院)MoCA 量表篩查 MCI 最佳截值,但由于受入選研究數目限制,未能對 MoCA 不同版本、不同人口特征等其他可能的異質性來源對截斷值的影響進行探討。
綜上所述,本研究結果顯示 MoCA 量表用于中國中老年人群 MCI 診斷時,25/26 截值為最佳截值,此時靈敏度為 0.96,特異度為 0.83。