高質量系統評價與Meta分析作為循證醫學的高級別證據,影響臨床實踐與臨床指南的制定[1-3]。1904年Pearson[4]發表了第一個醫學研究領域的Meta分析,其后Meta分析發文數量快速增長,但研究質量表現參差不齊,這引發了國內外學者的普遍關注與擔憂[5-7]。學術界較多采用PRISMA聲明[8]與AMSTAR 2[9]質量評價工具來規范報告和評估Meta分析的質量。PRISMA聲明從題目、摘要、前方、方法、結果、討論和經費7個方面規范了Meta分析的撰寫與報告,是評估Meta分析報告質量高低的重要工具。AMSTAR是一種清單評分工具,主要包括對納入研究質量、檢索策略全面性與偏倚風險評估等項目。在醫學領域,一項歷經方法學質量與報告質量評價而脫穎而出的“高質量”研究,往往成為臨床決策和指南制定的重要依據,直接或間接影響著臨床實踐,同時極大程度影響著學術界的發展和研究方向。然而,此類評價工具未能對結果穩健性進行考量。不穩健研究的結論因研究內包含的少數幾個研究對象的研究結果事件狀態的改變,而使整個研究結論發生改變,這樣的研究是不適宜應用與推廣的,更不能作為實踐的指導依據。因此,對研究結果穩健性的評估顯得十分重要。與報告質量和方法學質量評價工具不同,脆性指數作為Meta分析穩健性評價指標,指“想要改變某項研究的統計學意義所依賴的研究對象事件狀態改變的最小數量”[10],以直觀、易于理解與溝通為特點,有助于臨床醫生在“文獻海洋”中快速建立起“某項干預措施對于某種疾病是否有效”結論的信心與把握度[11]。
1990年Feinstein首次提出“脆性指數”[12],2014年Walsh等[11]激發了脆性指數新的活力,賦予了其更簡化更直觀的內涵,也就是目前學術界頗為流行的針對1∶1雙臂試驗中具有統計學意義的二分類結果的脆性指數的釋義與計算方式。在此基礎上,2019年Atal等[10]發展出了對Meta分析中脆性指數的定義,將脆性指數從僅適用于結果有統計學意義的研究,拓展到了可包括結果無統計學意義研究在內的所有Meta分析。
脆性指數作為結果穩健性評價指標,較多應用于醫學研究領域的隨機對照試驗,如腫瘤學[13]、顱內出血[14]、兒科麻醉學[15]、血管外科手術[16]、癲癇[17]、神經外科[18]、髖關節鏡[19]、早產兒相關[20]、新冠人群與非新冠人群中皮質類固醇治療急性呼吸窘迫綜合征的效果[21]等。但在心血管領域,脆性指數的應用進展緩慢[22],尚未有專門針對心血管Meta分析進行穩健性評估的研究。Meta分析作為指導臨床實踐的重要證據和指南制定的重要來源,研究結果穩健性評估尤為重要。因此,本研究主要是針對心血管領域的Meta分析,應用脆性指數并對其研究穩健性進行評價。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
(1)隨機對照試驗的Meta分析:題目中包含了“systematic review”或“Meta”,且納入研究均為隨機對照試驗的。
(2)與以下任何心血管臨床亞專業有關:心力衰竭、介入心臟病學、預防心臟病學、電生理學、心臟成像等領域。
1.1.2 排除標準
(1)網狀Meta分析;(2)Meta回歸分析;(3)信息不全/方法不當[無匯總效應和亞組匯總效應結果,未使用或未表明使用Peto/Mantel-Haenszel/Inverse Variance/DerSimonian and Laird中任意一種方法,未使用或未表明使用RR/OR/RD中任意一種效應指標,未使用或未表明使用效應模型類型(固定/隨機),森林圖其他信息不全,有缺失值];(4)撤稿、勘誤表及修正類;(5)更新前版本。
1.2 檢索策略
以“meta analy*、metaanaly* AND Circulation、European heart journal、JAMA Cardiology、Journal of the American College of Cardiology、Circulation research、Lancet、The New England journal of medicine、JAMA、BMJ”為檢索詞,檢索PubMed、EMbase及Web of Science數據庫。檢索時限為2018年1月1日至2022年12月31日。
1.3 文獻篩選
檢索所得文獻導入文獻管理軟件Zotero進行整理。由兩名研究者(游月媛和張桂英)獨立閱讀標題、摘要和全文進行篩選,意見不一致時,與第三名研究者(李靜)討論確定。
1.4 數據提取與分析
1.4.1 數據提取
數據提取主要包括:題名、發表年份及雜志名、是否為研究主要結果、成對比較的兩組數據各自的事件數和總數、樣本量、總事件數、效應值(置信區間下限與上限)、用于匯總效應估計的方法類型(Peto/Mantel-Haenszel/Inverse Variance/DerSimonian and Laird)、效應模型類型(固定/隨機)、效應指標類型(RR/OR/RD)。以上均為公開數據,不需倫理委員會審查。
1.4.2 數據分析
Meta分析中脆性指數的計算主要由Atal教授及其團隊研發的在線計算器(
脆性指數與樣本量、總事件數、效應值大小及效應值置信區間寬度的關系采用Spearman相關分析。Spearman相關分析與文章作圖采用R(4.3.0)軟件。
脆性指數數值與樣本量的比值不超過1%表示若僅有100名受試者參與研究時,特定試驗中僅一位受試者的事件狀態發生改變(失去統計學意義或獲得統計學意義),整個Meta分析結果的統計學意義就會發生改變,該Meta分析原來的結論也將被推翻,表明研究結果穩健性不佳。
2 結果
2.1 Meta分析篩選結果
共檢索到5998個Meta分析,29篇文獻[23-51]的212個Meta分析符合納入標準。其中8篇來自綜合性雜志(LANCET 3篇,JAMA 3篇,BMJ 2篇),21篇來自專業心血管雜志(European Heart Journal 10篇,Circulation 5篇,JAMA Cardiology 4篇,Journal of the American College of Cardiology 1篇,Circulation Research 1篇)。入選29篇文獻較均勻分布于2018—2022年,平均每年4~7篇,平均影響因子為69.033。納入的212個Meta分析中,95個結果有統計學意義,117個結果無統計學意義;43個為研究的主要結果,其余169個為非主要結果或未明確表明該結果屬性。納入Meta分析數據的基本特征見表1。


2.2 脆性指數
納入Meta分析脆性指數普遍<100,主要集中分布于1~40之間。212個Meta分析的中位脆性指數為11(5,25),最小值為1,最大值為563;在95個有統計學意義結果的Meta分析中,中位脆性指數為9(5,35),最小值為1,最大值為563;在117個無統計學意義結果的Meta分析中,中位脆性指數為12(6,24),最小值為1,最大值為125;見圖2。

2.3 脆性指數與樣本量比值
無論Meta分析結果是否有統計學意義,>90%的Meta分析脆性指數與樣本量的比值≤1%,說明絕大多數心血管Meta分析的結果穩健性不佳;見圖3。

2.4 相關性分析
無論Meta分析結果是否有統計學意義,隨著樣本量增加,脆性指數值呈現增大的趨勢,說明樣本量越大的研究,其結果穩健性越好;見圖4。

脆性指數與樣本量、總事件數、效應值置信區間寬度的Spearman相關系數有統計學意義,脆性指數與效應值大小的Spearman相關系數無統計學意義;見表2。

3 討論
入選29篇文獻的212個Meta分析脆性指數普遍<100,主要集中分布于1~40之間,平均脆性指數值僅為11,表明心血管Meta分析相關研究結果的穩健性不高。Spearman相關分析表明,無論Meta分析結果是否有統計學意義,脆性指數與樣本量呈現正相關關系,即隨著樣本量增加,脆性指數值也增大,研究所得結果就越穩健;這與既往研究[52-56]所得結論相似。脆性指數與總事件數也呈正相關關系,即發生所研究結局事件越多的研究,其脆性指數數值也普遍更大,也就需要該Meta分析所納入的特定試驗中更多研究對象事件狀態的改變才能顛覆整個Meta分析結果的統計學意義,也就說明該研究結論越穩健。脆性指數與效應值置信區間寬度呈現負相關關系,表明置信區間上下限間隔越寬,脆性指數數值反而越小,這可能由于更寬泛的置信限來自較小樣本量的研究所致。
Anand等[57]對小兒泌尿外科近來發表的7篇文章的22個Meta分析研究進行調查發現,Meta分析的平均脆性指數僅為5。Schr?der等[58]針對Medline數據庫中近10年來發表的有關小兒外科手術領域Meta分析的研究結果顯示,符合納入標準的39篇文獻的79個Meta分析的平均脆性指數也僅為5。隨機對照試驗中也存在脆性指數普遍較低、研究結果穩健性不佳的情形。Walsh等[11]對發表在高影響力醫學期刊上的隨機對照試驗的調查結果顯示,平均脆性指數值為8,有大約25%的研究的脆性指數值≤3,超過一半的研究脆性指數值小于失訪人數。Ruzbarsky等[59]對近10年發表在11個高影響力期刊的調查研究發現,近一半研究的脆性指數≤2,且將近一半研究的失訪人數大于脆性指數數值,失訪對象是否發生結局事件具有不確定性,而脆性指數為更改整個研究統計學意義所需的研究對象事件狀態改變的最小數量;因此,失訪人數直接關系到研究的最終結論,尤其是當失訪人數大于脆性指數數值時。本研究所納入Meta分析的中位脆性指數為11(5,25),略高于上述關于小兒泌尿外科和小兒手術領域的Meta分析和其他領域的隨機對照試驗,但本研究脆性指數與樣本量的比值卻處于較低水平;無論Meta分析結果是否有統計學意義,>90%的研究脆性指數數與樣本量的比值<1%,表示在絕大多數情況下,若僅有100名受試者參與研究時,特定試驗中僅1名受試者的事件狀態發生改變(失去統計學意義或獲得統計學意義),整個Meta分析結果的統計學意義就會發生改變,該Meta分析原來的結論也將被推翻,因而穩健性不佳。
本研究基于影響因子,發行量,雜志業內知名度、專業度與認可度多方面考慮選擇期刊;其中Lancet、The New England Journal of Medicine、JAMA與BMJ雜志在綜合性醫學雜志中被公認為“四大頂刊”,而Circulation、European Heart Journal、JAMA Cardiology、Journal of the American College of Cardiology與Circulation Research雜志在心血管領域的影響因子最高,且擁有較高知名度和心血管醫學領域同行認可度,因此本研究所選Meta分析對于心血管領域Meta分析具有較強代表性。脆性指數在心血管領域應用緩慢,本研究是首篇針對心血管領域多本雜志Meta分析有關脆性指數應用的研究,有助于揭示近年來心血管相關研究的穩健性情況,為臨床實踐和后續研究提供啟示。本研究選擇脆性指數作為穩健性評價指標,直觀、易于理解與溝通,對P值和研究結論可較好進行補充說明。研究者們通過P值與檢驗水準的相對大小得出研究結果是否有統計學意義的結論,然而對此結論所持信心卻無法衡量。以檢驗水準為0.05為例,P值取0.049時小于此水準,認為研究結果有統計學意義;相反,若P值取0.051則認為研究結果無統計學意義。在這個例子中,較小的P值差別得出了截然不同的結論。試想若檢驗水準被設定為0.01或者0.10,那么研究結論也將被“顛覆”。學術界對于P值的“詬病”歷來有之[60-61],僅僅憑借P值難以較全面地把握對于結論的信心。通過脆性指數,有助于識別出研究結論改變所需研究對象事件狀態改變的數量,從而較直觀地明確該結果的穩健性。
本研究也有一定的局限性。首先,我們只納入兩組數據成對比較且結局類型為二分類的Meta分析,未能評價結局為連續型變量、網狀Meta分析或是生存資料分析等其他數據類型的研究,因此可能會遺漏一些重要的心血管研究。其次,本研究所納入Meta分析的效應指標僅為RR值與OR值,無危險度差(risk difference,RD)。盡管本研究所納入的29篇研究中有1篇同時涉及到效應指標RR值與RD值,但結果僅呈現了RR值。在后續研究中,有望進一步擴大檢索年限以獲得更多符合納入標準的研究與更全面的效應指標類型。再者,本研究在Atal教授[10]最初研究設計選用的3種匯總效應估計方法(Mantel-Haenszel方法、Inverse Variance方法與Peto法)的基礎上,提取了DerSimonian and Laird方法作為匯總效應估計方法之一,并以Inverse Variance方法的計算方式選擇DerSimonian and Laird方法的Meta分析進行脆性指數計算;DerSimonian and Laird方法作為Inverse Variance方法的簡單變體,常用于隨機效應模型Meta分析對于匯總效應的估計,盡管兩者略有不同,但在以Inverse Variance方法代替DerSimonian and Laird方法完成Meta分析匯總效應及其置信區間上下限的估計層面,兩種方法所得結果極為接近,在后續研究中,有望以更加符合DerSimonian and Laird方法的算法對采用該方法的Meta分析完成脆性指數計算。同時,脆性指數作為研究結果的輔助說明指標,學術界歷來沒有明確的標準劃分各個亞學科領域穩健與不穩健的分界點和區間值,但研究者們可以通過研究結果所示脆性指數數值大小明確該研究結果的統計學意義所取決的事件狀態改變的受試對象數量,該特點對沒有專業統計背景的臨床醫生尤為友好,也可以與同領域其他研究脆性指數數值相比,來衡量研究結果的穩健性。未來研究有望對結局為連續型變量資料、網狀Meta分析以及生存分析等研究展開評價,構建完整的心血管領域相關研究的穩健性評價體系。
綜上所述,發表在高影響力綜合性期刊與專業心血管雜志上的心血管領域Meta分析的脆性指數普遍較低,穩健性不高,少數研究對象事件狀態發生改變便可能導致整個研究結果統計學意義的顛覆,從而得出截然不同的結論。在醫學研究中可增加對脆性指數的報告,輔助說明P值。
利益沖突:無。
作者貢獻:游月媛負責數據分析和論文撰寫;張桂英負責數據整理、分析;王凌負責論文設計;李靜負責論文審閱與研究指導。
高質量系統評價與Meta分析作為循證醫學的高級別證據,影響臨床實踐與臨床指南的制定[1-3]。1904年Pearson[4]發表了第一個醫學研究領域的Meta分析,其后Meta分析發文數量快速增長,但研究質量表現參差不齊,這引發了國內外學者的普遍關注與擔憂[5-7]。學術界較多采用PRISMA聲明[8]與AMSTAR 2[9]質量評價工具來規范報告和評估Meta分析的質量。PRISMA聲明從題目、摘要、前方、方法、結果、討論和經費7個方面規范了Meta分析的撰寫與報告,是評估Meta分析報告質量高低的重要工具。AMSTAR是一種清單評分工具,主要包括對納入研究質量、檢索策略全面性與偏倚風險評估等項目。在醫學領域,一項歷經方法學質量與報告質量評價而脫穎而出的“高質量”研究,往往成為臨床決策和指南制定的重要依據,直接或間接影響著臨床實踐,同時極大程度影響著學術界的發展和研究方向。然而,此類評價工具未能對結果穩健性進行考量。不穩健研究的結論因研究內包含的少數幾個研究對象的研究結果事件狀態的改變,而使整個研究結論發生改變,這樣的研究是不適宜應用與推廣的,更不能作為實踐的指導依據。因此,對研究結果穩健性的評估顯得十分重要。與報告質量和方法學質量評價工具不同,脆性指數作為Meta分析穩健性評價指標,指“想要改變某項研究的統計學意義所依賴的研究對象事件狀態改變的最小數量”[10],以直觀、易于理解與溝通為特點,有助于臨床醫生在“文獻海洋”中快速建立起“某項干預措施對于某種疾病是否有效”結論的信心與把握度[11]。
1990年Feinstein首次提出“脆性指數”[12],2014年Walsh等[11]激發了脆性指數新的活力,賦予了其更簡化更直觀的內涵,也就是目前學術界頗為流行的針對1∶1雙臂試驗中具有統計學意義的二分類結果的脆性指數的釋義與計算方式。在此基礎上,2019年Atal等[10]發展出了對Meta分析中脆性指數的定義,將脆性指數從僅適用于結果有統計學意義的研究,拓展到了可包括結果無統計學意義研究在內的所有Meta分析。
脆性指數作為結果穩健性評價指標,較多應用于醫學研究領域的隨機對照試驗,如腫瘤學[13]、顱內出血[14]、兒科麻醉學[15]、血管外科手術[16]、癲癇[17]、神經外科[18]、髖關節鏡[19]、早產兒相關[20]、新冠人群與非新冠人群中皮質類固醇治療急性呼吸窘迫綜合征的效果[21]等。但在心血管領域,脆性指數的應用進展緩慢[22],尚未有專門針對心血管Meta分析進行穩健性評估的研究。Meta分析作為指導臨床實踐的重要證據和指南制定的重要來源,研究結果穩健性評估尤為重要。因此,本研究主要是針對心血管領域的Meta分析,應用脆性指數并對其研究穩健性進行評價。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
(1)隨機對照試驗的Meta分析:題目中包含了“systematic review”或“Meta”,且納入研究均為隨機對照試驗的。
(2)與以下任何心血管臨床亞專業有關:心力衰竭、介入心臟病學、預防心臟病學、電生理學、心臟成像等領域。
1.1.2 排除標準
(1)網狀Meta分析;(2)Meta回歸分析;(3)信息不全/方法不當[無匯總效應和亞組匯總效應結果,未使用或未表明使用Peto/Mantel-Haenszel/Inverse Variance/DerSimonian and Laird中任意一種方法,未使用或未表明使用RR/OR/RD中任意一種效應指標,未使用或未表明使用效應模型類型(固定/隨機),森林圖其他信息不全,有缺失值];(4)撤稿、勘誤表及修正類;(5)更新前版本。
1.2 檢索策略
以“meta analy*、metaanaly* AND Circulation、European heart journal、JAMA Cardiology、Journal of the American College of Cardiology、Circulation research、Lancet、The New England journal of medicine、JAMA、BMJ”為檢索詞,檢索PubMed、EMbase及Web of Science數據庫。檢索時限為2018年1月1日至2022年12月31日。
1.3 文獻篩選
檢索所得文獻導入文獻管理軟件Zotero進行整理。由兩名研究者(游月媛和張桂英)獨立閱讀標題、摘要和全文進行篩選,意見不一致時,與第三名研究者(李靜)討論確定。
1.4 數據提取與分析
1.4.1 數據提取
數據提取主要包括:題名、發表年份及雜志名、是否為研究主要結果、成對比較的兩組數據各自的事件數和總數、樣本量、總事件數、效應值(置信區間下限與上限)、用于匯總效應估計的方法類型(Peto/Mantel-Haenszel/Inverse Variance/DerSimonian and Laird)、效應模型類型(固定/隨機)、效應指標類型(RR/OR/RD)。以上均為公開數據,不需倫理委員會審查。
1.4.2 數據分析
Meta分析中脆性指數的計算主要由Atal教授及其團隊研發的在線計算器(
脆性指數與樣本量、總事件數、效應值大小及效應值置信區間寬度的關系采用Spearman相關分析。Spearman相關分析與文章作圖采用R(4.3.0)軟件。
脆性指數數值與樣本量的比值不超過1%表示若僅有100名受試者參與研究時,特定試驗中僅一位受試者的事件狀態發生改變(失去統計學意義或獲得統計學意義),整個Meta分析結果的統計學意義就會發生改變,該Meta分析原來的結論也將被推翻,表明研究結果穩健性不佳。
2 結果
2.1 Meta分析篩選結果
共檢索到5998個Meta分析,29篇文獻[23-51]的212個Meta分析符合納入標準。其中8篇來自綜合性雜志(LANCET 3篇,JAMA 3篇,BMJ 2篇),21篇來自專業心血管雜志(European Heart Journal 10篇,Circulation 5篇,JAMA Cardiology 4篇,Journal of the American College of Cardiology 1篇,Circulation Research 1篇)。入選29篇文獻較均勻分布于2018—2022年,平均每年4~7篇,平均影響因子為69.033。納入的212個Meta分析中,95個結果有統計學意義,117個結果無統計學意義;43個為研究的主要結果,其余169個為非主要結果或未明確表明該結果屬性。納入Meta分析數據的基本特征見表1。


2.2 脆性指數
納入Meta分析脆性指數普遍<100,主要集中分布于1~40之間。212個Meta分析的中位脆性指數為11(5,25),最小值為1,最大值為563;在95個有統計學意義結果的Meta分析中,中位脆性指數為9(5,35),最小值為1,最大值為563;在117個無統計學意義結果的Meta分析中,中位脆性指數為12(6,24),最小值為1,最大值為125;見圖2。

2.3 脆性指數與樣本量比值
無論Meta分析結果是否有統計學意義,>90%的Meta分析脆性指數與樣本量的比值≤1%,說明絕大多數心血管Meta分析的結果穩健性不佳;見圖3。

2.4 相關性分析
無論Meta分析結果是否有統計學意義,隨著樣本量增加,脆性指數值呈現增大的趨勢,說明樣本量越大的研究,其結果穩健性越好;見圖4。

脆性指數與樣本量、總事件數、效應值置信區間寬度的Spearman相關系數有統計學意義,脆性指數與效應值大小的Spearman相關系數無統計學意義;見表2。

3 討論
入選29篇文獻的212個Meta分析脆性指數普遍<100,主要集中分布于1~40之間,平均脆性指數值僅為11,表明心血管Meta分析相關研究結果的穩健性不高。Spearman相關分析表明,無論Meta分析結果是否有統計學意義,脆性指數與樣本量呈現正相關關系,即隨著樣本量增加,脆性指數值也增大,研究所得結果就越穩健;這與既往研究[52-56]所得結論相似。脆性指數與總事件數也呈正相關關系,即發生所研究結局事件越多的研究,其脆性指數數值也普遍更大,也就需要該Meta分析所納入的特定試驗中更多研究對象事件狀態的改變才能顛覆整個Meta分析結果的統計學意義,也就說明該研究結論越穩健。脆性指數與效應值置信區間寬度呈現負相關關系,表明置信區間上下限間隔越寬,脆性指數數值反而越小,這可能由于更寬泛的置信限來自較小樣本量的研究所致。
Anand等[57]對小兒泌尿外科近來發表的7篇文章的22個Meta分析研究進行調查發現,Meta分析的平均脆性指數僅為5。Schr?der等[58]針對Medline數據庫中近10年來發表的有關小兒外科手術領域Meta分析的研究結果顯示,符合納入標準的39篇文獻的79個Meta分析的平均脆性指數也僅為5。隨機對照試驗中也存在脆性指數普遍較低、研究結果穩健性不佳的情形。Walsh等[11]對發表在高影響力醫學期刊上的隨機對照試驗的調查結果顯示,平均脆性指數值為8,有大約25%的研究的脆性指數值≤3,超過一半的研究脆性指數值小于失訪人數。Ruzbarsky等[59]對近10年發表在11個高影響力期刊的調查研究發現,近一半研究的脆性指數≤2,且將近一半研究的失訪人數大于脆性指數數值,失訪對象是否發生結局事件具有不確定性,而脆性指數為更改整個研究統計學意義所需的研究對象事件狀態改變的最小數量;因此,失訪人數直接關系到研究的最終結論,尤其是當失訪人數大于脆性指數數值時。本研究所納入Meta分析的中位脆性指數為11(5,25),略高于上述關于小兒泌尿外科和小兒手術領域的Meta分析和其他領域的隨機對照試驗,但本研究脆性指數與樣本量的比值卻處于較低水平;無論Meta分析結果是否有統計學意義,>90%的研究脆性指數數與樣本量的比值<1%,表示在絕大多數情況下,若僅有100名受試者參與研究時,特定試驗中僅1名受試者的事件狀態發生改變(失去統計學意義或獲得統計學意義),整個Meta分析結果的統計學意義就會發生改變,該Meta分析原來的結論也將被推翻,因而穩健性不佳。
本研究基于影響因子,發行量,雜志業內知名度、專業度與認可度多方面考慮選擇期刊;其中Lancet、The New England Journal of Medicine、JAMA與BMJ雜志在綜合性醫學雜志中被公認為“四大頂刊”,而Circulation、European Heart Journal、JAMA Cardiology、Journal of the American College of Cardiology與Circulation Research雜志在心血管領域的影響因子最高,且擁有較高知名度和心血管醫學領域同行認可度,因此本研究所選Meta分析對于心血管領域Meta分析具有較強代表性。脆性指數在心血管領域應用緩慢,本研究是首篇針對心血管領域多本雜志Meta分析有關脆性指數應用的研究,有助于揭示近年來心血管相關研究的穩健性情況,為臨床實踐和后續研究提供啟示。本研究選擇脆性指數作為穩健性評價指標,直觀、易于理解與溝通,對P值和研究結論可較好進行補充說明。研究者們通過P值與檢驗水準的相對大小得出研究結果是否有統計學意義的結論,然而對此結論所持信心卻無法衡量。以檢驗水準為0.05為例,P值取0.049時小于此水準,認為研究結果有統計學意義;相反,若P值取0.051則認為研究結果無統計學意義。在這個例子中,較小的P值差別得出了截然不同的結論。試想若檢驗水準被設定為0.01或者0.10,那么研究結論也將被“顛覆”。學術界對于P值的“詬病”歷來有之[60-61],僅僅憑借P值難以較全面地把握對于結論的信心。通過脆性指數,有助于識別出研究結論改變所需研究對象事件狀態改變的數量,從而較直觀地明確該結果的穩健性。
本研究也有一定的局限性。首先,我們只納入兩組數據成對比較且結局類型為二分類的Meta分析,未能評價結局為連續型變量、網狀Meta分析或是生存資料分析等其他數據類型的研究,因此可能會遺漏一些重要的心血管研究。其次,本研究所納入Meta分析的效應指標僅為RR值與OR值,無危險度差(risk difference,RD)。盡管本研究所納入的29篇研究中有1篇同時涉及到效應指標RR值與RD值,但結果僅呈現了RR值。在后續研究中,有望進一步擴大檢索年限以獲得更多符合納入標準的研究與更全面的效應指標類型。再者,本研究在Atal教授[10]最初研究設計選用的3種匯總效應估計方法(Mantel-Haenszel方法、Inverse Variance方法與Peto法)的基礎上,提取了DerSimonian and Laird方法作為匯總效應估計方法之一,并以Inverse Variance方法的計算方式選擇DerSimonian and Laird方法的Meta分析進行脆性指數計算;DerSimonian and Laird方法作為Inverse Variance方法的簡單變體,常用于隨機效應模型Meta分析對于匯總效應的估計,盡管兩者略有不同,但在以Inverse Variance方法代替DerSimonian and Laird方法完成Meta分析匯總效應及其置信區間上下限的估計層面,兩種方法所得結果極為接近,在后續研究中,有望以更加符合DerSimonian and Laird方法的算法對采用該方法的Meta分析完成脆性指數計算。同時,脆性指數作為研究結果的輔助說明指標,學術界歷來沒有明確的標準劃分各個亞學科領域穩健與不穩健的分界點和區間值,但研究者們可以通過研究結果所示脆性指數數值大小明確該研究結果的統計學意義所取決的事件狀態改變的受試對象數量,該特點對沒有專業統計背景的臨床醫生尤為友好,也可以與同領域其他研究脆性指數數值相比,來衡量研究結果的穩健性。未來研究有望對結局為連續型變量資料、網狀Meta分析以及生存分析等研究展開評價,構建完整的心血管領域相關研究的穩健性評價體系。
綜上所述,發表在高影響力綜合性期刊與專業心血管雜志上的心血管領域Meta分析的脆性指數普遍較低,穩健性不高,少數研究對象事件狀態發生改變便可能導致整個研究結果統計學意義的顛覆,從而得出截然不同的結論。在醫學研究中可增加對脆性指數的報告,輔助說明P值。
利益沖突:無。
作者貢獻:游月媛負責數據分析和論文撰寫;張桂英負責數據整理、分析;王凌負責論文設計;李靜負責論文審閱與研究指導。