引用本文: 管慧, 戴國華, 高武霖, 任麗麗, 展志宏, 王群. 中醫藥臨床研究中應用德爾菲法的系統評價. 中國循證醫學雜志, 2021, 21(2): 186-190. doi: 10.7507/1672-2531.202009034 復制
中醫學理論體系是在長期的臨床實踐中逐步建立和發展的,中醫藥臨床工作多憑個案和各家經驗,存在很強的差異性和不確定性,這可能成為阻礙中醫藥向標準化、現代化發展的瓶頸。在保證中醫學特點、適應時代發展需要的前提下,疾病和證候診療標準制訂、評價指標體系構建等一系列復雜和繁重問題的解決,可極大改善中醫學向標準化、現代化發展面臨的困境。德爾菲法(Delphi 法)通過對未來事物發展的預測、評價和決策分析,形成相對優化和可靠的結論或方案,以期為決策者提供科學決策依據[1]。作為一種客觀綜合多數專家經驗和主觀判斷相結合的方法,Delphi 法符合中醫證候形成的本質特點,在中醫藥臨床研究中顯示出良好的應用前景。目前,關于中醫藥臨床應用 Delphi 法的具體情況尚不清楚。因此,本文系統評價 Delphi 法在中醫藥臨床研究中的應用現狀、實施情況,論述中醫藥臨床應用 Delphi 法存在的問題并提出針對性建議,為 Delphi 法在中醫藥臨床研究的應用提供參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
使用 Delphi 法的中醫藥臨床研究或方法學研究。
1.1.2 排除標準
① 非中英文文獻;② 重復發表的文獻;③ 原文無法獲取。
1.2 文獻檢索策略
計算機檢索 PubMed、EMbase、CNKI、WanFang Data 和 VIP 數據庫,搜集有關使用 Delphi 法的中醫藥臨床研究和方法學研究,檢索時限均為建庫至 2020 年 8 月 30 日。此外,追溯納入文獻的參考文獻,以補充獲取相關文獻。檢索采取主題詞和自由詞相結合的方式進行。中文檢索詞包括:中醫、中醫學、中醫藥、德爾菲法、專家調查、專家咨詢等;英文檢索詞包括:traditional Chinese medicine、Delphi、Delphi technique 等。以 PubMed 為例,其具體檢索策略見框 1。

1.3 文獻篩選與資料提取
由 2 名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。如有需要,通過郵件、電話聯系原始研究作者獲取未確定但對本研究非常重要的信息[2]。資料提取內容包括:文題、數據庫來源、發表年份、作者、文獻類型、研究疾病、研究目的、Delphi 法輪次、專家小組成立情況、預調查、專家數量、調查形式、統計分析情況(包括專家積極系數、權威系數、集中程度、協調程度等)。
1.4 統計分析
采用定性描述的方法進行分析。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻 1 505 篇,經逐層篩選,最終納入文獻 612 篇。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 中醫藥臨床研究應用 Delphi 法的現狀
2.2.1 文獻發表數量和趨勢
應用 Delphi 法的中醫藥臨床研究年度發文量見圖 2。2000~2006 年發表的研究較少,2007 年起開始增長,2016 年出現快速增長,考慮與該年制訂了大量兒科和婦科的中醫診療共識和指南有關,其后發文量處于相對穩定狀態。整體來看,Delphi 法在中醫藥臨床研究應用比較廣泛,隨著中醫藥研究現代化進程的加快,Delphi 法的應用可能會進一步增多[3, 4]。

2.2.2 文獻類型和研究領域
納入文獻包括原始研究 573 篇(94.75%)、方法學研究 39 篇(5.25%)。期刊論文 361 篇(58.99%)、碩博士論文 200 篇(32.68%)、會議論文 38 篇(6.21%)、其他 13 篇(2.12%)。原始研究中明確研究疾病的 540 篇(88.24%),涉及前 5 位的科室分別為兒科 78 篇(14.44%)、心血管內科 73 篇(13.52%)、呼吸內科 50 篇(9.26%)、婦科 31 篇(5.74%)、腫瘤科 28 篇(5.19%),其他依次為神經科、內分泌科、治未病科等。涉及具體疾病 167 種,前 5 位分別為冠心病 30 篇(5.56%)、高血壓 19 篇(3.52%)、慢性阻塞性肺疾病 17 篇(3.15%)、卒中 16 篇(2.96%)、呼吸道感染 13 篇(2.41%)。涉及中醫特色診療技術 45 篇(7.85%)(包括針法、灸法、穴位貼敷、熏蒸法等)。
2.2.3 根據主要研究目的對文獻歸類
Delphi 法在中醫藥臨床研究應用廣泛,每項研究目的各有不同且有交叉。以主要研究目的為依據,將文獻劃分為 8 大類[5-12],其中疾病診療(診療方案、規范、指南、專家共識)150 篇(24.51%),證候研究(證候診斷標準、規范)195 篇(31.86%),量表研制(包括證候診斷量表、生活質量量表、醫生報告結局量表、患者報告結局量表等)60 篇(9.80%),評價研究(包括療效評價、安全性評價、評價標準、評價指南、評價體系的構建)52 篇(8.50%),指標研究(包括各類評價核心指標、結局指標、風險預警指標、疾病危險因素、證候構成指標、試驗報告條目)37 篇(6.05%),臨床調查(包括臨床證候特征、診療規律、體質分類)32 篇(5.23%),方法學研究 39 篇(6.37%),其它研究(藥物、穴位、適宜技術、適宜病種優選)47 篇(7.68%),結果見圖 3。

2.3 Delphi 法的實施情況
納入的 487 篇文獻對 Delphi 法的實施過程和結果進行了不同程度的報告。
2.3.1 Delphi 法實施輪次
487 篇文獻對 Delphi 法的實施輪次進行了報告,其中實施一輪的 66 篇(13.55%)、二輪 300 篇(61.60%)、三輪 116 篇(23.82%)和四輪 5 篇(1.03%)。
2.3.2 工作小組成立情況
在 487 篇文獻中,180 篇(36.96%)報告了成立工作小組指導 Delphi 法的全程實施,其余文獻未對工作小組成立情況進行報告,也未在文中其它部分描述研究是否在工作小組的指導下進行。
2.3.3 問卷預調查情況
487 篇文獻幾乎均報告了函詢問卷制作,但僅 85 篇(17.45%)對問卷進行了預調查。
2.3.4 專家數量
487 篇文獻均對專家數量進行了報告,專家數量從 4~1 218 名不等,平均 41 名,其中專家數量為 20~50 名的有 364 篇(74.74%)。冠心病證候特征研究對 6 大區 41 家醫院的 1 218 名專家進行了較大規模的問卷調查,是專家數量最多的研究[13]。
2.3.5 問卷發放形式
409 篇(83.98%)文獻對問卷發放形式進行了報告,包括電子郵件、郵寄紙質信函、面呈、微信、網頁及兩種或三種形式的結合。其中以一種形式發放包括電子郵件 284 篇(58.32%)、郵寄紙質信函 24 篇(4.93%)、面呈 18 篇(3.70%)、微信或網頁 8 篇(1.64%),以其中兩種形式結合的 68 篇(13.96%),以三種形式結合的 7 篇(1.44%)。采用單一發放形式的問卷平均回收率為 91.61%,采用多種方式結合的問卷平均回收率為 95.77%。
2.3.6 統計分析結果
共 285 篇(58.52%)文獻展示了參與調查的專家基本信息。426 篇(87.47%)報告了專家積極系數,積極系數在 40%~100% 之間,其中第一輪平均積極系數為 92.56%、第二輪為 95.94%、第三輪為 94.81%、第四輪為 67.23%。193 篇(39.63%)對專家權威系數進行了報告,389 篇(79.88%)報告了集中程度,390 篇(80.08%)報告了協調程度。153 篇(31.42%)對專家積極系數、權威系數、集中程度和協調程度同時進行了報告。
3 討論
本研究結果發現,Delphi 法在中醫藥臨床研究中得到了較廣泛應用且取得了重要成果,但仍有待于改進。只有 36.96% 的研究成立了工作小組。工作小組是以科學研究和開發為目的,為共同的科研目標組成的研究群體,是交流研究進展、優化研究方案的形式,對研究工作的運行起著重要作用[14],其水平一定程度上決定了研究水平。強化頂層設計、全面統籌、良好溝通、及時反饋,提高信息交流效率,才能更好、更快地解決科研工作的難題。因此,建立負責整個研究規劃、統籌工作指導小組和具體方案實施的聯絡調查小組是非常必要的,是提高研究質量的第一步。
期刊論文限于篇幅一般不展示函詢問卷具體內容,從已發表的碩博論文看,函詢問卷的設計沒有統一規范,大部分針對某一研究問題結合文獻調查和頭腦風暴等方法搜集研究內容。存在內容簡單不能全面涵蓋研究內容,或者調查表異常復雜的問題,為專家填寫帶來困難,并且 80% 以上的研究未通過預調查對問卷行進一步修改和完善[15]。由于中醫藥臨床研究的不確定性、內容的廣泛性及證候的錯綜復雜和變動性,問卷的設計具有一定困難。其設計應遵循整體性、簡要性、導向性、可比性、均勻性、可操作性和實際性原則,并能體現中醫藥特色。應確定一名執筆人獨立撰寫和修改,成文后由小組成員集體討論定稿,避免集體撰寫的方式。然后,需根據問卷涉及的具體內容,梳理文獻,參照研究內容行業規范、標準、指南,形成原始問題清單,由指導小組專家對原始問題清單進行初篩、修改和補充,形成初始條目池,并對關鍵條目進行優先化排序和重要性分級。最后,按照條目的優先級排序形成初始咨詢表[16],實施預調查,修改完善,形成正式函詢問卷[17]。
專家遴選是 Delphi 法的重要環節,然而部分研究未對專家遴選的納入與排除標準進行詳細描述,缺乏嚴格性和科學性。專家遴選要考慮專家的權威性、代表性、廣泛性,代表性又需考慮區域代表性與學科代表性[18],還要結合專家的職業操守、學術造詣、行業影響及承擔工作的能力,選取覆蓋多個領域不同層次,能夠最廣泛的代表全國相關機構及從業人員意見的專家。專家的數量也是需要重點考慮的問題,人數過少,會限制學科領域的代表性;人數過多,會增加調查工作和數據收集、處理、分析的難度,本次系統評價結果顯示 75% 的研究專家數量在 20~50 名之間,比較合理。構建完備的中醫藥臨床研究專家庫是專家遴選的有效方法,建立健全的專家庫可有效提高 Delphi 法的研究效率和質量,然而目前國內尚未建立針對 Delphi 法的專家庫[19]。
有研究發現 85% 的研究采用了 2~3 輪調查,此時具有最佳的回收率,繼續增加調查輪次會使回收率大大下降[15],采用多種方式結合的調查形式可增加 4% 的回收率[20]。盡管分析結果顯示 1~3 輪調查平均回收率都在 90% 以上,實際在實施過程中問卷回收難度大、質量低一直是 Delphi 法面臨的難題。早期電子郵件因其成本低、容易建立與操作、填答時間具有彈性等優點而得到廣泛應用,如今電子郵件泛濫,大量寄發的電子問卷降低了專家填答意愿,回收率也隨之下降[21]。雖然隨著互聯網發展,問卷回收率有所提高,但很多問卷填寫質量并不高。有研究表明使用私人化親密用語表達邀請,至少可增加 5% 的回收率。受訪專家會受與實施者的熟識關系而影響作答意愿。應事先征詢專家意愿,盡可能選擇熟悉程度較高的專家。催復可有效提高回收率,如催復后仍不回復,可改變方式后再行訪問。
本次研究結果發現僅有 30% 的研究同時報告了專家積極系數、權威系數、集中程度和協調程度,部分研究選擇性地報告統計指標,極少有研究能夠全面詳細地報告專家基本信息、積極系數(即回收率)、專家權威程度(權威系數)、集中程度(包括均數、等級和、滿分比及不重要性百分比)、協調程度(包括變異系數、肯德爾和諧系數)[22-24]。中醫藥研究涉及條目較多,很多研究存在量化指標模糊不清、統計指標不全面、分析方法缺乏準確性等問題。作為一種定性與定量相結合的方法,定量處理是 Delphi 法的一個重要特點,首先要使用指標賦分量化方法對定性指標進行量化,再進一步采用統計學指標進行分析。統計分析過程是實現 Delphi 法定量化最為關鍵的一步,其準確性直接關系到條目的取舍。一般采用 Matlab 程序對判斷矩陣進行一致性檢驗,通過一致性檢驗的問卷方可進行統計分析[25]。
本次納入的 612 篇文獻,方法學文獻僅占 5.25%,數量較少。僅有不足 30% 的研究詳細描述了規范的實施過程,提供了較為詳盡的結果報告,多數研究選擇性報告了部分實施細節和統計分析結果。博碩士論文 Delphi 法實施和報告內容較為詳細,期刊論文限于篇幅報告內容不全面,有些會議論文只是簡單報告了使用 Delphi 法,但未對實施細節和結果進行任何報告。超過 60% 的研究未成立工作小組,研究多為一名或數名研究生完成,缺乏嚴格的質量控制標準。缺乏方法學指導是導致目前 Delphi 法在中醫藥臨床研究應用不規范,研究質量不高的重要原因。將臨床統計方法學與中醫藥臨床研究進行慎重、有機的結合,將有利于提高中醫藥臨床研究質量,促進產出高水平的研究結果和證據。
由于中醫學本身的主觀性和不確定性,很難找到足夠的符合現代循證醫學的高級別證據來進行中醫藥臨床研究,通過證據評價并將證據轉化成推薦建議的思路較難實現。中醫藥臨床行業標準的制訂,很難憑借個人經驗達成共識,加之實際中存在的流派差異、地域差異、自身學術水平限制等,亟需集思廣益,綜合具備一定學術水平專家的意見[26]。Delphi 法因其獨特的優勢更加符合中醫藥研究特色,是當前中醫藥臨床研究的較佳選擇,其結果是經過專家反復論證的,充分綜合了專家在多年理論研究與臨床實踐的經驗,且通過量化的方法,突破了傳統定性方法的限制,具有很強的科學性與實踐性。因此中醫藥臨床診療指南、證候診斷標準、評價指標等制訂多借助 Delphi 法,依賴高年資專家意見。
本研究存在一定的局限性:① 僅納入了已發表的研究,尚有正在進行的研究未被納入;② 考慮研究者語言限制,僅納入了中、英文研究,可能遺漏其他語種發表的研究;③ 本研究納入研究數量較多,未能展示全部文獻詳細內容。
綜上所述,目前我國采用 Delphi 法構建的中醫藥臨床診療方案、規范、指南、專家共識仍存在方法學不規范、過程不透明、程序不合規和利益沖突不聲明等硬傷,這都會對臨床診療工作的指導產生負面影響。因此有必要綜合中醫藥臨床、方法學、統計學等多方專家意見,制訂中醫藥領域 Delphi 法的具體實施步驟、報告規范、質量評價標準,以提高研究質量和報告的規范性。
中醫學理論體系是在長期的臨床實踐中逐步建立和發展的,中醫藥臨床工作多憑個案和各家經驗,存在很強的差異性和不確定性,這可能成為阻礙中醫藥向標準化、現代化發展的瓶頸。在保證中醫學特點、適應時代發展需要的前提下,疾病和證候診療標準制訂、評價指標體系構建等一系列復雜和繁重問題的解決,可極大改善中醫學向標準化、現代化發展面臨的困境。德爾菲法(Delphi 法)通過對未來事物發展的預測、評價和決策分析,形成相對優化和可靠的結論或方案,以期為決策者提供科學決策依據[1]。作為一種客觀綜合多數專家經驗和主觀判斷相結合的方法,Delphi 法符合中醫證候形成的本質特點,在中醫藥臨床研究中顯示出良好的應用前景。目前,關于中醫藥臨床應用 Delphi 法的具體情況尚不清楚。因此,本文系統評價 Delphi 法在中醫藥臨床研究中的應用現狀、實施情況,論述中醫藥臨床應用 Delphi 法存在的問題并提出針對性建議,為 Delphi 法在中醫藥臨床研究的應用提供參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
使用 Delphi 法的中醫藥臨床研究或方法學研究。
1.1.2 排除標準
① 非中英文文獻;② 重復發表的文獻;③ 原文無法獲取。
1.2 文獻檢索策略
計算機檢索 PubMed、EMbase、CNKI、WanFang Data 和 VIP 數據庫,搜集有關使用 Delphi 法的中醫藥臨床研究和方法學研究,檢索時限均為建庫至 2020 年 8 月 30 日。此外,追溯納入文獻的參考文獻,以補充獲取相關文獻。檢索采取主題詞和自由詞相結合的方式進行。中文檢索詞包括:中醫、中醫學、中醫藥、德爾菲法、專家調查、專家咨詢等;英文檢索詞包括:traditional Chinese medicine、Delphi、Delphi technique 等。以 PubMed 為例,其具體檢索策略見框 1。

1.3 文獻篩選與資料提取
由 2 名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。如有需要,通過郵件、電話聯系原始研究作者獲取未確定但對本研究非常重要的信息[2]。資料提取內容包括:文題、數據庫來源、發表年份、作者、文獻類型、研究疾病、研究目的、Delphi 法輪次、專家小組成立情況、預調查、專家數量、調查形式、統計分析情況(包括專家積極系數、權威系數、集中程度、協調程度等)。
1.4 統計分析
采用定性描述的方法進行分析。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻 1 505 篇,經逐層篩選,最終納入文獻 612 篇。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 中醫藥臨床研究應用 Delphi 法的現狀
2.2.1 文獻發表數量和趨勢
應用 Delphi 法的中醫藥臨床研究年度發文量見圖 2。2000~2006 年發表的研究較少,2007 年起開始增長,2016 年出現快速增長,考慮與該年制訂了大量兒科和婦科的中醫診療共識和指南有關,其后發文量處于相對穩定狀態。整體來看,Delphi 法在中醫藥臨床研究應用比較廣泛,隨著中醫藥研究現代化進程的加快,Delphi 法的應用可能會進一步增多[3, 4]。

2.2.2 文獻類型和研究領域
納入文獻包括原始研究 573 篇(94.75%)、方法學研究 39 篇(5.25%)。期刊論文 361 篇(58.99%)、碩博士論文 200 篇(32.68%)、會議論文 38 篇(6.21%)、其他 13 篇(2.12%)。原始研究中明確研究疾病的 540 篇(88.24%),涉及前 5 位的科室分別為兒科 78 篇(14.44%)、心血管內科 73 篇(13.52%)、呼吸內科 50 篇(9.26%)、婦科 31 篇(5.74%)、腫瘤科 28 篇(5.19%),其他依次為神經科、內分泌科、治未病科等。涉及具體疾病 167 種,前 5 位分別為冠心病 30 篇(5.56%)、高血壓 19 篇(3.52%)、慢性阻塞性肺疾病 17 篇(3.15%)、卒中 16 篇(2.96%)、呼吸道感染 13 篇(2.41%)。涉及中醫特色診療技術 45 篇(7.85%)(包括針法、灸法、穴位貼敷、熏蒸法等)。
2.2.3 根據主要研究目的對文獻歸類
Delphi 法在中醫藥臨床研究應用廣泛,每項研究目的各有不同且有交叉。以主要研究目的為依據,將文獻劃分為 8 大類[5-12],其中疾病診療(診療方案、規范、指南、專家共識)150 篇(24.51%),證候研究(證候診斷標準、規范)195 篇(31.86%),量表研制(包括證候診斷量表、生活質量量表、醫生報告結局量表、患者報告結局量表等)60 篇(9.80%),評價研究(包括療效評價、安全性評價、評價標準、評價指南、評價體系的構建)52 篇(8.50%),指標研究(包括各類評價核心指標、結局指標、風險預警指標、疾病危險因素、證候構成指標、試驗報告條目)37 篇(6.05%),臨床調查(包括臨床證候特征、診療規律、體質分類)32 篇(5.23%),方法學研究 39 篇(6.37%),其它研究(藥物、穴位、適宜技術、適宜病種優選)47 篇(7.68%),結果見圖 3。

2.3 Delphi 法的實施情況
納入的 487 篇文獻對 Delphi 法的實施過程和結果進行了不同程度的報告。
2.3.1 Delphi 法實施輪次
487 篇文獻對 Delphi 法的實施輪次進行了報告,其中實施一輪的 66 篇(13.55%)、二輪 300 篇(61.60%)、三輪 116 篇(23.82%)和四輪 5 篇(1.03%)。
2.3.2 工作小組成立情況
在 487 篇文獻中,180 篇(36.96%)報告了成立工作小組指導 Delphi 法的全程實施,其余文獻未對工作小組成立情況進行報告,也未在文中其它部分描述研究是否在工作小組的指導下進行。
2.3.3 問卷預調查情況
487 篇文獻幾乎均報告了函詢問卷制作,但僅 85 篇(17.45%)對問卷進行了預調查。
2.3.4 專家數量
487 篇文獻均對專家數量進行了報告,專家數量從 4~1 218 名不等,平均 41 名,其中專家數量為 20~50 名的有 364 篇(74.74%)。冠心病證候特征研究對 6 大區 41 家醫院的 1 218 名專家進行了較大規模的問卷調查,是專家數量最多的研究[13]。
2.3.5 問卷發放形式
409 篇(83.98%)文獻對問卷發放形式進行了報告,包括電子郵件、郵寄紙質信函、面呈、微信、網頁及兩種或三種形式的結合。其中以一種形式發放包括電子郵件 284 篇(58.32%)、郵寄紙質信函 24 篇(4.93%)、面呈 18 篇(3.70%)、微信或網頁 8 篇(1.64%),以其中兩種形式結合的 68 篇(13.96%),以三種形式結合的 7 篇(1.44%)。采用單一發放形式的問卷平均回收率為 91.61%,采用多種方式結合的問卷平均回收率為 95.77%。
2.3.6 統計分析結果
共 285 篇(58.52%)文獻展示了參與調查的專家基本信息。426 篇(87.47%)報告了專家積極系數,積極系數在 40%~100% 之間,其中第一輪平均積極系數為 92.56%、第二輪為 95.94%、第三輪為 94.81%、第四輪為 67.23%。193 篇(39.63%)對專家權威系數進行了報告,389 篇(79.88%)報告了集中程度,390 篇(80.08%)報告了協調程度。153 篇(31.42%)對專家積極系數、權威系數、集中程度和協調程度同時進行了報告。
3 討論
本研究結果發現,Delphi 法在中醫藥臨床研究中得到了較廣泛應用且取得了重要成果,但仍有待于改進。只有 36.96% 的研究成立了工作小組。工作小組是以科學研究和開發為目的,為共同的科研目標組成的研究群體,是交流研究進展、優化研究方案的形式,對研究工作的運行起著重要作用[14],其水平一定程度上決定了研究水平。強化頂層設計、全面統籌、良好溝通、及時反饋,提高信息交流效率,才能更好、更快地解決科研工作的難題。因此,建立負責整個研究規劃、統籌工作指導小組和具體方案實施的聯絡調查小組是非常必要的,是提高研究質量的第一步。
期刊論文限于篇幅一般不展示函詢問卷具體內容,從已發表的碩博論文看,函詢問卷的設計沒有統一規范,大部分針對某一研究問題結合文獻調查和頭腦風暴等方法搜集研究內容。存在內容簡單不能全面涵蓋研究內容,或者調查表異常復雜的問題,為專家填寫帶來困難,并且 80% 以上的研究未通過預調查對問卷行進一步修改和完善[15]。由于中醫藥臨床研究的不確定性、內容的廣泛性及證候的錯綜復雜和變動性,問卷的設計具有一定困難。其設計應遵循整體性、簡要性、導向性、可比性、均勻性、可操作性和實際性原則,并能體現中醫藥特色。應確定一名執筆人獨立撰寫和修改,成文后由小組成員集體討論定稿,避免集體撰寫的方式。然后,需根據問卷涉及的具體內容,梳理文獻,參照研究內容行業規范、標準、指南,形成原始問題清單,由指導小組專家對原始問題清單進行初篩、修改和補充,形成初始條目池,并對關鍵條目進行優先化排序和重要性分級。最后,按照條目的優先級排序形成初始咨詢表[16],實施預調查,修改完善,形成正式函詢問卷[17]。
專家遴選是 Delphi 法的重要環節,然而部分研究未對專家遴選的納入與排除標準進行詳細描述,缺乏嚴格性和科學性。專家遴選要考慮專家的權威性、代表性、廣泛性,代表性又需考慮區域代表性與學科代表性[18],還要結合專家的職業操守、學術造詣、行業影響及承擔工作的能力,選取覆蓋多個領域不同層次,能夠最廣泛的代表全國相關機構及從業人員意見的專家。專家的數量也是需要重點考慮的問題,人數過少,會限制學科領域的代表性;人數過多,會增加調查工作和數據收集、處理、分析的難度,本次系統評價結果顯示 75% 的研究專家數量在 20~50 名之間,比較合理。構建完備的中醫藥臨床研究專家庫是專家遴選的有效方法,建立健全的專家庫可有效提高 Delphi 法的研究效率和質量,然而目前國內尚未建立針對 Delphi 法的專家庫[19]。
有研究發現 85% 的研究采用了 2~3 輪調查,此時具有最佳的回收率,繼續增加調查輪次會使回收率大大下降[15],采用多種方式結合的調查形式可增加 4% 的回收率[20]。盡管分析結果顯示 1~3 輪調查平均回收率都在 90% 以上,實際在實施過程中問卷回收難度大、質量低一直是 Delphi 法面臨的難題。早期電子郵件因其成本低、容易建立與操作、填答時間具有彈性等優點而得到廣泛應用,如今電子郵件泛濫,大量寄發的電子問卷降低了專家填答意愿,回收率也隨之下降[21]。雖然隨著互聯網發展,問卷回收率有所提高,但很多問卷填寫質量并不高。有研究表明使用私人化親密用語表達邀請,至少可增加 5% 的回收率。受訪專家會受與實施者的熟識關系而影響作答意愿。應事先征詢專家意愿,盡可能選擇熟悉程度較高的專家。催復可有效提高回收率,如催復后仍不回復,可改變方式后再行訪問。
本次研究結果發現僅有 30% 的研究同時報告了專家積極系數、權威系數、集中程度和協調程度,部分研究選擇性地報告統計指標,極少有研究能夠全面詳細地報告專家基本信息、積極系數(即回收率)、專家權威程度(權威系數)、集中程度(包括均數、等級和、滿分比及不重要性百分比)、協調程度(包括變異系數、肯德爾和諧系數)[22-24]。中醫藥研究涉及條目較多,很多研究存在量化指標模糊不清、統計指標不全面、分析方法缺乏準確性等問題。作為一種定性與定量相結合的方法,定量處理是 Delphi 法的一個重要特點,首先要使用指標賦分量化方法對定性指標進行量化,再進一步采用統計學指標進行分析。統計分析過程是實現 Delphi 法定量化最為關鍵的一步,其準確性直接關系到條目的取舍。一般采用 Matlab 程序對判斷矩陣進行一致性檢驗,通過一致性檢驗的問卷方可進行統計分析[25]。
本次納入的 612 篇文獻,方法學文獻僅占 5.25%,數量較少。僅有不足 30% 的研究詳細描述了規范的實施過程,提供了較為詳盡的結果報告,多數研究選擇性報告了部分實施細節和統計分析結果。博碩士論文 Delphi 法實施和報告內容較為詳細,期刊論文限于篇幅報告內容不全面,有些會議論文只是簡單報告了使用 Delphi 法,但未對實施細節和結果進行任何報告。超過 60% 的研究未成立工作小組,研究多為一名或數名研究生完成,缺乏嚴格的質量控制標準。缺乏方法學指導是導致目前 Delphi 法在中醫藥臨床研究應用不規范,研究質量不高的重要原因。將臨床統計方法學與中醫藥臨床研究進行慎重、有機的結合,將有利于提高中醫藥臨床研究質量,促進產出高水平的研究結果和證據。
由于中醫學本身的主觀性和不確定性,很難找到足夠的符合現代循證醫學的高級別證據來進行中醫藥臨床研究,通過證據評價并將證據轉化成推薦建議的思路較難實現。中醫藥臨床行業標準的制訂,很難憑借個人經驗達成共識,加之實際中存在的流派差異、地域差異、自身學術水平限制等,亟需集思廣益,綜合具備一定學術水平專家的意見[26]。Delphi 法因其獨特的優勢更加符合中醫藥研究特色,是當前中醫藥臨床研究的較佳選擇,其結果是經過專家反復論證的,充分綜合了專家在多年理論研究與臨床實踐的經驗,且通過量化的方法,突破了傳統定性方法的限制,具有很強的科學性與實踐性。因此中醫藥臨床診療指南、證候診斷標準、評價指標等制訂多借助 Delphi 法,依賴高年資專家意見。
本研究存在一定的局限性:① 僅納入了已發表的研究,尚有正在進行的研究未被納入;② 考慮研究者語言限制,僅納入了中、英文研究,可能遺漏其他語種發表的研究;③ 本研究納入研究數量較多,未能展示全部文獻詳細內容。
綜上所述,目前我國采用 Delphi 法構建的中醫藥臨床診療方案、規范、指南、專家共識仍存在方法學不規范、過程不透明、程序不合規和利益沖突不聲明等硬傷,這都會對臨床診療工作的指導產生負面影響。因此有必要綜合中醫藥臨床、方法學、統計學等多方專家意見,制訂中醫藥領域 Delphi 法的具體實施步驟、報告規范、質量評價標準,以提高研究質量和報告的規范性。