引用本文: 李濤, 魏娜沙, 傅崇德, 付生軍, 楊立, 王志平, 陳廣瑜, 程繼. 經尿道手術治療良性前列腺增生系統評價/Meta分析的方法學和報告質量評價. 中國循證醫學雜志, 2015, 15(10): 1224-1230. doi: 10.7507/1672-2531.20150202 復制
良性前列腺增生(benign prostatic hyperplasia,BPH)是老年男性常見的疾病之一,治療方法包括藥物治療和手術治療。其中經尿道前列腺電切術(TURP)是治療BPH的金標準,然而TURP后部分患者發生膀胱頸狹窄、性功能障礙等并發癥。隨著技術的發展,近年來經尿道腔內微創手術在臨床的應用增多,泌尿外科醫師也致力于尋找一種創傷更小,安全性更高的術式。目前,經尿道手術治療BPH的術式較多,包括經尿道前列腺等離子氣化電切術、經尿道等離子雙極電切術、經尿道鈥激光前列腺剜除術、銩激光前列腺剜除術等。系統評價是公認的最佳證據的來源,是評價臨床療效、制定指南及規范的基礎 [1]。近年來,BPH經尿道手術治療的系統評價/Meta分析(SR/MA)逐漸增多,然而其方法學和報告質量良莠不齊。而低質量SR/MA會降低結果的使用價值,且會誤導醫師、患者及其他使用者。因此,我們對BPH經尿道手術治療的SR/MA的方法學質量和報告質量進行綜合評價,以了解這一領域SR/MA研究的質量現狀,發現存在的問題,提出改進建議,同時也為臨床使用這些SR/MA結果提供決策參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
SR/MA。
1.1.2 研究對象
BPH患者,試驗組和對照組基線可比。
1.1.3 干預措施
所評價的干預措施包括了經尿道前列腺電切術,如等離子氣化電切術、經尿道等離子雙極電切術、經尿道鈥激光前列腺剜除術等。
1.1.4 結局指標
不限。
1.1.5 排除標準
① 重復發表的文獻;② 會議摘要。
1.2 檢索策略
計算機檢索PubMed、The Cochrane Library(2014年第12期)、Sciverse、CNKI、VIP和WanFang Data數據庫,搜集所有BPH經尿道手術治療的SR/MA,同時手工檢索《中國循證醫學雜志》、《循證醫學》、《現代泌尿外科雜志》、《臨床泌尿外科雜志》和《中華泌尿外科雜志》,并追溯納入研究的參考文獻,以補充獲取相關文獻。中文檢索詞包括薈萃分析、Meta分析、系統評價、前列腺增生、BPH;英文檢索詞包括meta-analysis、system evaluation、systematic review、benign prostatic hyperplasia、BPH。以PubMed為例,其具體檢索策略見框1。
框 1 PubMed檢索策略
#1 meta-analysis #2 system evaluation #3 systematic review #4 benign prostatic hyperplasia #5 BPH #6 #1 OR #2 OR #3 #7 #4 OR #5 #8 #6 AND #7
1.3 文獻篩選和資料提取
由2位研究者獨立進行文獻篩選和資料提取,并交叉核對,如遇分歧,與第三位研究者協商解決。資料提取內容主要包括:作者、發表年份、國籍、作者數目、質量評價工具、例數、期刊收錄情況、納入研究數目。
1.4 納入研究的質量評價
采用AMSTAR量表 [2, 3]評價納入SR/MA的方法學質量,各條目分別做出“是”、“否”或“不清楚”的評價,“是”記1分,“否”或“不清楚”記0分,總分11分,得分0~4為低質量,5~8為中等質量,9~11為高質量 [4];采用PRISMA清單評價納入SR/MA的報告質量,各條目分別做出“充分”、“部分符合”或“不符合”的評價。
1.5 統計分析
采用SPSS 18.0軟件進行統計分析,計算各條目報告的符合率,對于AMSTAR量表的評分結果采用均數±標準差(
2 結果
2.1 文獻檢索結果
初檢出相關文獻4 275篇,經逐層篩選,最終納入33個SR/MA [5-37]。文獻篩選流程及結果見圖 1。

2.2 納入研究的基本特征
見表 1。

2.2.1 發表時間分布
納入的33個SR/MA發表于2003~2014年間,2012年和2014年發表最多,各8篇(24.24%),具體見圖 2。

2.2.2 第一作者國籍分布
納入的33個SR/MA第一作者來自7個國家,其中中國25篇(75.75%),德國3篇(9.09%),美國、加拿大、澳大利亞、法國和英國各1篇(3.03%)。
2.2.3 納入研究數及樣本量
33個SR/MA納入研究數為3~35個,平均12個,中位數為9個;納入的病例數為260~3 669例,平均1 181例,中位數為991例。
2.2.4 作者數目
納入的SR/MA作者數為2~10人,平均5±2人,大于3人28篇,占84.84%。
2.2.5 期刊收錄類型
33個SR/MA發表在25種期刊上,其中國外期刊11種(44%),國內期刊14種(56%);16篇(48.48%)發表在SCI收錄期刊上。
2.2.6 SR/MA采用的方法學質量/偏倚風險評價工具
33個SR/MA中,27個(81.81%)報道了使用的方法學質量/偏倚風險評價工具,其中14個(42.42%)采用Jadad量表,10個(30.30%)采用Cochrane手冊的偏倚風險評價工具,3個(9.09%)采用自制評價工具。
2.3 AMSTAR量表評價結果
結果見表 2。AMSTAR量表的11個條目中,符合率最高的是條目9,達93.94%;條目1的符合率最低,僅9.09%。符合率超過80%的條目有2項,分別是條目2(90.3%)和條目9(93.94%);符合率為50%~80%的有5項:條目3(75.76%)、條目4(69.70%)、條目5(75.76%)、條目6(78.79%)、條目7(60.60%);符合率小于50% 的有4項:條目1(9.09%)、條目8(24.24%)、條目10(21.21%)、條目11(33.33%)。

AMSTAR量表評分有3篇 [20, 22, 32]為高質量,24篇 [5, 6-37]為中等質量,6篇為低質量 [11, 12, 17, 25, 30, 36]。33個SR/MA的AMSTAR量表平均得分為6.27±2.14分。影響AMSTAR量表評分的單因素分析結果顯示:① SCI期刊發表SR/MA的AMSTAR量表評分高于CSCD期刊,而CSCD期刊又高于一般期刊,但三類期刊發表SR/MA間差異無統計學意義;② 與2009年及以前相比,2010年及以后發表SR/MA的AMSTAR量表評分較高,差異有統計學意義;③ 與作者數≤ 5人的研究相比,作者數>5人的研究AMSTAR量表評分較高,其差異有統計學意義;④ 國內與國外作者發表的SR/MA間AMSTAR量表評分差異無統計學意義(表 3)。

2.4 PRISMA清單評價結果
結果見表 4。符合率超過80%的條目有11項,分別為標題(96.97%)、結構式摘要(90.91%)、目的(87.88%)、方案和注冊(90.91%)、納入標準(84.85%)、信息來源(87.88%)、概括效應指標(81.82%)、研究特征(87.88%)、單個研究的結果(84.85%)、結果的綜合(87.88%)、結論(93.94%);符合率50%~80%的條目有8項,分別為理論基礎(69.70%)、研究選擇(78.79%)、資料提取(72.73%)、資料條目(57.58%)、結果綜合(66.67%)、研究選擇(57.58%)、證據總結(66.67%)、局限性(57.58%);符合率小于50%的條目有8項,分別為檢索(6.06%)、單個研究存在的偏倚(33.33%)、研究偏倚(21.21%)、其他分析(15.15%)、研究內部偏倚風險(36.36%)、研究間偏倚(24.24%)、其他分析(21.21%)、資金支持(15.15%)。

3 討論
經尿道手術治療BPH是目前常用的方法,近年來經尿道腔內微創治療BPH得到快速發展和廣泛應用,目前應用較多的微創術式包括經尿道前列腺電切術、鈥激光前列腺剜除術等。近年來已發表大量針對經尿道手術治療BPH的SR/MA,為BPH治療方式的選擇提供了有力證據。SR/MA的質量取決于納入原始研究的質量 [38],若SR/MA存在質量問題,勢必會降低結果的可靠性,甚至給臨床決策產生誤導。
本研究納入的33篇SR/MA均為公開發表文獻,其中近半數論文發表在SCI收錄期刊上。本研究結果顯示,不同級別期刊發表的SR/MA的方法學質量雖然無統計學差異,但其AMSTAR量表評分呈現出SCI期刊>CSCD期刊>一般期刊的趨勢,造成這一差異的原因可能與研究者和期刊的水平有關,國內期刊發表的SR/MA方法學質量低于國外,應引起國內期刊的高度關注。本研究結果還顯示,作者數>5人的研究質量明顯更高,反映出制作SR/MA需要團隊協作,并且由不同領域的研究者如臨床、圖書情報、方法學人員的共同參與,有助于提高SR/MA的質量。此外,本研究納入SR/MA的第一作者最多來自中國,反映出近年來國內泌尿外科領域對生產高質量證據和循證決策的重視。
Cochrane系統評價員手冊推薦的偏倚風險評價工具是目前公認的質量最高、最嚴謹的偏倚風險評價工具 [39],但本研究結果顯示,納入SR/MA對Cochrane偏倚風險評價工具的使用率僅為30.30%,明顯偏低,反映出該領域對SR/MA方法學最新進展的跟蹤和使用仍然不足,缺乏方法學專家的參與和相關期刊編輯的認識不足也是重要影響因素。
從AMSTAR量表評價結果來看,納入研究的選擇和數據提取得分最高,說明此兩項得到了作者的高度重視。而實施廣泛全面的文獻檢索占75.76%,納入文獻是否考慮發表情況(如灰色文獻)占69.70%,這兩項結果并不高,其可能會造成部分研究未被納入,從而可能影響SR/MA結果的可靠性。提供前期設計方案僅占9.09%,且均發表在SCI收錄期刊上,需要引起國內外期刊尤其是國內期刊的高度重視。進行SR/MA注冊和前期發表研究方案,有助于提高SR/MA質量和透明性,也有助于使用者判斷SR/MA在制作過程中對方案進行過修改,是否存在選擇性報告等,從而幫助使用者對SR/MA的偏倚風險和結果的可靠性做出合理評估。
而從PRISMA清單評價結果來看,納入SR/MA的報告質量參差不齊,其中檢索、單個研究存在的偏倚、研究內部偏倚風險、研究間偏倚、其他分析、資金支持等條目的符合率均小于50%,需要引起研究者和醫學期刊的高度關注。
本研究的局限性:首先,本研究檢索語種僅限于中、英文,不排除以其他語種發表的SR/MA未被納入的可能;其次,本研究未檢索灰色文獻,不排除未發表的SR/MA未被納入的可能。
總之,當前經尿道手術治療BPH的SR/MA的方法學質量和報告質量均不高,在一定程度上降低了這一領域SR/MA結果的可靠性和使用價值。未來的SR/MA應該嚴格遵循相關報告規范,提高方法學質量和報告質量,從而為臨床決策提供更可靠的證據。
良性前列腺增生(benign prostatic hyperplasia,BPH)是老年男性常見的疾病之一,治療方法包括藥物治療和手術治療。其中經尿道前列腺電切術(TURP)是治療BPH的金標準,然而TURP后部分患者發生膀胱頸狹窄、性功能障礙等并發癥。隨著技術的發展,近年來經尿道腔內微創手術在臨床的應用增多,泌尿外科醫師也致力于尋找一種創傷更小,安全性更高的術式。目前,經尿道手術治療BPH的術式較多,包括經尿道前列腺等離子氣化電切術、經尿道等離子雙極電切術、經尿道鈥激光前列腺剜除術、銩激光前列腺剜除術等。系統評價是公認的最佳證據的來源,是評價臨床療效、制定指南及規范的基礎 [1]。近年來,BPH經尿道手術治療的系統評價/Meta分析(SR/MA)逐漸增多,然而其方法學和報告質量良莠不齊。而低質量SR/MA會降低結果的使用價值,且會誤導醫師、患者及其他使用者。因此,我們對BPH經尿道手術治療的SR/MA的方法學質量和報告質量進行綜合評價,以了解這一領域SR/MA研究的質量現狀,發現存在的問題,提出改進建議,同時也為臨床使用這些SR/MA結果提供決策參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
SR/MA。
1.1.2 研究對象
BPH患者,試驗組和對照組基線可比。
1.1.3 干預措施
所評價的干預措施包括了經尿道前列腺電切術,如等離子氣化電切術、經尿道等離子雙極電切術、經尿道鈥激光前列腺剜除術等。
1.1.4 結局指標
不限。
1.1.5 排除標準
① 重復發表的文獻;② 會議摘要。
1.2 檢索策略
計算機檢索PubMed、The Cochrane Library(2014年第12期)、Sciverse、CNKI、VIP和WanFang Data數據庫,搜集所有BPH經尿道手術治療的SR/MA,同時手工檢索《中國循證醫學雜志》、《循證醫學》、《現代泌尿外科雜志》、《臨床泌尿外科雜志》和《中華泌尿外科雜志》,并追溯納入研究的參考文獻,以補充獲取相關文獻。中文檢索詞包括薈萃分析、Meta分析、系統評價、前列腺增生、BPH;英文檢索詞包括meta-analysis、system evaluation、systematic review、benign prostatic hyperplasia、BPH。以PubMed為例,其具體檢索策略見框1。
框 1 PubMed檢索策略
#1 meta-analysis #2 system evaluation #3 systematic review #4 benign prostatic hyperplasia #5 BPH #6 #1 OR #2 OR #3 #7 #4 OR #5 #8 #6 AND #7
1.3 文獻篩選和資料提取
由2位研究者獨立進行文獻篩選和資料提取,并交叉核對,如遇分歧,與第三位研究者協商解決。資料提取內容主要包括:作者、發表年份、國籍、作者數目、質量評價工具、例數、期刊收錄情況、納入研究數目。
1.4 納入研究的質量評價
采用AMSTAR量表 [2, 3]評價納入SR/MA的方法學質量,各條目分別做出“是”、“否”或“不清楚”的評價,“是”記1分,“否”或“不清楚”記0分,總分11分,得分0~4為低質量,5~8為中等質量,9~11為高質量 [4];采用PRISMA清單評價納入SR/MA的報告質量,各條目分別做出“充分”、“部分符合”或“不符合”的評價。
1.5 統計分析
采用SPSS 18.0軟件進行統計分析,計算各條目報告的符合率,對于AMSTAR量表的評分結果采用均數±標準差(
2 結果
2.1 文獻檢索結果
初檢出相關文獻4 275篇,經逐層篩選,最終納入33個SR/MA [5-37]。文獻篩選流程及結果見圖 1。

2.2 納入研究的基本特征
見表 1。

2.2.1 發表時間分布
納入的33個SR/MA發表于2003~2014年間,2012年和2014年發表最多,各8篇(24.24%),具體見圖 2。

2.2.2 第一作者國籍分布
納入的33個SR/MA第一作者來自7個國家,其中中國25篇(75.75%),德國3篇(9.09%),美國、加拿大、澳大利亞、法國和英國各1篇(3.03%)。
2.2.3 納入研究數及樣本量
33個SR/MA納入研究數為3~35個,平均12個,中位數為9個;納入的病例數為260~3 669例,平均1 181例,中位數為991例。
2.2.4 作者數目
納入的SR/MA作者數為2~10人,平均5±2人,大于3人28篇,占84.84%。
2.2.5 期刊收錄類型
33個SR/MA發表在25種期刊上,其中國外期刊11種(44%),國內期刊14種(56%);16篇(48.48%)發表在SCI收錄期刊上。
2.2.6 SR/MA采用的方法學質量/偏倚風險評價工具
33個SR/MA中,27個(81.81%)報道了使用的方法學質量/偏倚風險評價工具,其中14個(42.42%)采用Jadad量表,10個(30.30%)采用Cochrane手冊的偏倚風險評價工具,3個(9.09%)采用自制評價工具。
2.3 AMSTAR量表評價結果
結果見表 2。AMSTAR量表的11個條目中,符合率最高的是條目9,達93.94%;條目1的符合率最低,僅9.09%。符合率超過80%的條目有2項,分別是條目2(90.3%)和條目9(93.94%);符合率為50%~80%的有5項:條目3(75.76%)、條目4(69.70%)、條目5(75.76%)、條目6(78.79%)、條目7(60.60%);符合率小于50% 的有4項:條目1(9.09%)、條目8(24.24%)、條目10(21.21%)、條目11(33.33%)。

AMSTAR量表評分有3篇 [20, 22, 32]為高質量,24篇 [5, 6-37]為中等質量,6篇為低質量 [11, 12, 17, 25, 30, 36]。33個SR/MA的AMSTAR量表平均得分為6.27±2.14分。影響AMSTAR量表評分的單因素分析結果顯示:① SCI期刊發表SR/MA的AMSTAR量表評分高于CSCD期刊,而CSCD期刊又高于一般期刊,但三類期刊發表SR/MA間差異無統計學意義;② 與2009年及以前相比,2010年及以后發表SR/MA的AMSTAR量表評分較高,差異有統計學意義;③ 與作者數≤ 5人的研究相比,作者數>5人的研究AMSTAR量表評分較高,其差異有統計學意義;④ 國內與國外作者發表的SR/MA間AMSTAR量表評分差異無統計學意義(表 3)。

2.4 PRISMA清單評價結果
結果見表 4。符合率超過80%的條目有11項,分別為標題(96.97%)、結構式摘要(90.91%)、目的(87.88%)、方案和注冊(90.91%)、納入標準(84.85%)、信息來源(87.88%)、概括效應指標(81.82%)、研究特征(87.88%)、單個研究的結果(84.85%)、結果的綜合(87.88%)、結論(93.94%);符合率50%~80%的條目有8項,分別為理論基礎(69.70%)、研究選擇(78.79%)、資料提取(72.73%)、資料條目(57.58%)、結果綜合(66.67%)、研究選擇(57.58%)、證據總結(66.67%)、局限性(57.58%);符合率小于50%的條目有8項,分別為檢索(6.06%)、單個研究存在的偏倚(33.33%)、研究偏倚(21.21%)、其他分析(15.15%)、研究內部偏倚風險(36.36%)、研究間偏倚(24.24%)、其他分析(21.21%)、資金支持(15.15%)。

3 討論
經尿道手術治療BPH是目前常用的方法,近年來經尿道腔內微創治療BPH得到快速發展和廣泛應用,目前應用較多的微創術式包括經尿道前列腺電切術、鈥激光前列腺剜除術等。近年來已發表大量針對經尿道手術治療BPH的SR/MA,為BPH治療方式的選擇提供了有力證據。SR/MA的質量取決于納入原始研究的質量 [38],若SR/MA存在質量問題,勢必會降低結果的可靠性,甚至給臨床決策產生誤導。
本研究納入的33篇SR/MA均為公開發表文獻,其中近半數論文發表在SCI收錄期刊上。本研究結果顯示,不同級別期刊發表的SR/MA的方法學質量雖然無統計學差異,但其AMSTAR量表評分呈現出SCI期刊>CSCD期刊>一般期刊的趨勢,造成這一差異的原因可能與研究者和期刊的水平有關,國內期刊發表的SR/MA方法學質量低于國外,應引起國內期刊的高度關注。本研究結果還顯示,作者數>5人的研究質量明顯更高,反映出制作SR/MA需要團隊協作,并且由不同領域的研究者如臨床、圖書情報、方法學人員的共同參與,有助于提高SR/MA的質量。此外,本研究納入SR/MA的第一作者最多來自中國,反映出近年來國內泌尿外科領域對生產高質量證據和循證決策的重視。
Cochrane系統評價員手冊推薦的偏倚風險評價工具是目前公認的質量最高、最嚴謹的偏倚風險評價工具 [39],但本研究結果顯示,納入SR/MA對Cochrane偏倚風險評價工具的使用率僅為30.30%,明顯偏低,反映出該領域對SR/MA方法學最新進展的跟蹤和使用仍然不足,缺乏方法學專家的參與和相關期刊編輯的認識不足也是重要影響因素。
從AMSTAR量表評價結果來看,納入研究的選擇和數據提取得分最高,說明此兩項得到了作者的高度重視。而實施廣泛全面的文獻檢索占75.76%,納入文獻是否考慮發表情況(如灰色文獻)占69.70%,這兩項結果并不高,其可能會造成部分研究未被納入,從而可能影響SR/MA結果的可靠性。提供前期設計方案僅占9.09%,且均發表在SCI收錄期刊上,需要引起國內外期刊尤其是國內期刊的高度重視。進行SR/MA注冊和前期發表研究方案,有助于提高SR/MA質量和透明性,也有助于使用者判斷SR/MA在制作過程中對方案進行過修改,是否存在選擇性報告等,從而幫助使用者對SR/MA的偏倚風險和結果的可靠性做出合理評估。
而從PRISMA清單評價結果來看,納入SR/MA的報告質量參差不齊,其中檢索、單個研究存在的偏倚、研究內部偏倚風險、研究間偏倚、其他分析、資金支持等條目的符合率均小于50%,需要引起研究者和醫學期刊的高度關注。
本研究的局限性:首先,本研究檢索語種僅限于中、英文,不排除以其他語種發表的SR/MA未被納入的可能;其次,本研究未檢索灰色文獻,不排除未發表的SR/MA未被納入的可能。
總之,當前經尿道手術治療BPH的SR/MA的方法學質量和報告質量均不高,在一定程度上降低了這一領域SR/MA結果的可靠性和使用價值。未來的SR/MA應該嚴格遵循相關報告規范,提高方法學質量和報告質量,從而為臨床決策提供更可靠的證據。