引用本文: 石磊, 母東煜, 龔杰, 饒志勇, 柳園, 喻佳潔, 胡雯, 李幼平. 應用德爾菲法初步完善特殊醫學用途配方食品綜合評價指標體系:以 2 型糖尿病為例. 中國循證醫學雜志, 2020, 20(9): 1012-1019. doi: 10.7507/1672-2531.201905114 復制
隨著社會經濟水平的發展,我國乃至全球的慢病現狀及其經濟負擔已不容小覷。特殊醫學用途配方食品(food for special medical purposes,FSMP)早在上個世紀 80 年代就被廣泛應用于臨床,并在改善營養狀況、促進康復、縮短住院時間、節省醫療開支等方面具有重要作用。我國 FSMP 研究起步較晚,但對 FSMP 臨床試驗要求之嚴為全球之最。原國家食品藥品監督管理總局等政府部門自 2013 年起陸續發布了國家對 FSMP 的注冊管理和市場監督的系列文件,《特殊醫學用途配方食品管理注冊辦法(試行)》指出我國今后將對 FSMP 注冊進行嚴格管理,尤其是特定全營養配方食品的注冊必須按照《特殊醫學用途配方食品臨床試驗質量管理規范》嚴格進行上市前臨床試驗。此前并無他國對 FSMP 有類似規定,國外系列文件也并未指明如何評估 FSMP 的臨床試驗結果,故尚無被普遍接受的評價指標體系、結果評判方法和他國相應經驗可供參考。我們前期通過系統評價(systematic review,SR)發現現有糖尿病 FSMP 綜合評價指標體系十分龐雜,急需修訂,以獲得初步完善、簡便可用的糖尿病 FSMP 綜合評價指標體系。
1 對象與方法
1.1 資料來源
本研究前期從 6 個醫學常用數據庫中檢索到 14 198 篇(包括參考文獻追溯法獲得的 49 篇)文章中納入 46 篇[1-46]符合要求的隨機對照試驗(randomized controlled trial,RCT),其中主題為管飼(tube feeding,TF)的研究 14 篇[1-14],口服營養補充(oral nutritional supplements,ONS)的研究 32 篇[15-46](相關 SR[47]已于另文發表)。從其試驗方案中提取末端指標 161 個,分類分級展開后形成以 MNSO(特醫臨床效果、營養充足性、安全性和其他指標)為主要枝干,下分五級目錄的樹形網狀結構。最后保留出現頻數<3 次但經討論認為與研究目的密切相關的指標及出現頻數≥3 次的指標以初步構建糖尿病 FSMP 綜合評價指標體系(表 1)。

第一輪 Delphi 專家咨詢問卷來源于前期 SR 初建的糖尿病 FSMP 綜合評價指標體系;第二輪和第三輪 Delphi 專家咨詢問卷分別來源于上一輪問卷回收結果。
1.2 專家咨詢對象
邀請 34 位專家參與三輪 Delphi 專家咨詢,從指標重要性、可操作性、獨立性等方面對初選指標進行評價,運用界值法和專家評分法對指標進行刪減修改,最后得到修訂后的綜合評價指標體系及配套效果評價方法。入選專家需從事臨床醫學、臨床營養學等領域研究或實際工作,且要求具有副高及以上職稱,具有 10 年以上的相關工作經歷。
1.3 研究指標
本研究對 3 輪專家咨詢意見等數據進行統計分析,主要涉及以下統計指標:① 專家咨詢可靠性:專家積極系數、權威系數(Cr)、協調系數;② 問卷信度和效度:克朗巴赫系數 α;③ 篩選指標:指標評判得分的滿分比、欠佳比、算術均數、標準差和變異系數等。
1.4 質量控制
以國家領導性文件為框架,項目組就指標體系專家評議表的制定組織了多次討論并結合臨床經驗進行反復斟酌、修改,最終確定各輪專家咨詢評議表。問卷(評議表)設計力求結構清晰、靶向明確、語句簡明,避免因評議表過于復雜而影響專家正確評價。每輪問卷條目后均采用半開放式留白,以便專家闡釋自身觀點。通過郵件發放和回收各輪問卷,并在問卷首頁附有咨詢電話和郵箱地址以便隨時答疑。遇漏填、錯填等情況及時反饋并請專家重填。每條消息均通過短信、微信等與郵件同時發送。驗收合格的問卷以紙質版形式編號并留檔。
1.5 統計分析
用 Microsoft Access 2016 軟件錄入問卷數據。在數據錄入完成后逐一檢查各項記錄是否有誤。若發現有誤以紙質留檔為準并及時修改。用 SPSS 22.0 軟件分析問卷信度、效度及可靠性。指標刪除標準:① 直接刪除:界值法中指標算術均值、滿分比、變異系數這 3 個尺度中有≥2 個未達標者;專家評價法中可操作性欠佳比≥10% 者;界值法和專家評價法總計 6 個尺度中有≥2 個尺度不合格者;第一輪咨詢整體得分均值≤3 和(或)滿分比≤0.2;第二輪咨詢整體得分均值≤4 和(或)滿分比≤0.3。② 討論后決定:專家在備注中提出的其他刪除意見,經討論通過者;未達直接刪除標準,但界值法和評分法統計所得不合格尺度數和不等于0 的指標再次討論通過刪除決定者。
2 結果
2.1 咨詢專家的基本情況
共邀請 34 名專家分別來自全國 34 家三甲醫院。實際共 31 名專家完整參與了三輪專家咨詢(2 名和 1 名專家分別在第一、三輪咨詢脫失)。32 名專家(包括參與全程的 31 名專家及于第三輪脫失的 1 名專家)中,12 名(37.5%)為博士及以上學歷,15 名(46.9%)為碩士學歷,本科及以下學歷 5 名(15.6%)。所有專家工作年限均在 10 年以上,工作年限為 10~19 年的有 8 名(占 25.0%),20~29 年有 13 名(占 40.6%),30 年以上的有 11 名(占 34.4%)。其中 16 名(占 50.0%)為高級職稱專家,14 名(占 43.8%)為副高級職稱專家。
2.2 專家咨詢問卷的信度和效度
對三輪專家咨詢問卷分別進行內部一致性檢驗,第一輪至第三輪專家咨詢的克朗巴赫 α 系數分別為 0.98、0.96 和 0.92,均高于 0.9(表 2)。

由于全球僅中國要求特定全營養配方食品必須進行臨床試驗,但目前尚無國際公認“金標準”,因此僅能初步對問卷結構效度和內容效度進行評價。專家一致認為本問卷具有較好效度。
2.3 專家咨詢的可靠性
專家咨詢的可靠性直接影響指標體系的科學性和普適性。采用專家積極系數、權威程度和專家意見協調程度 3 項指標檢驗專家咨詢的可靠性。三輪咨詢問卷的回收率,即專家積極系數分別為 94.1%、100% 和 96.9%。專家咨詢 Cr 為 0.73,其中判斷依據(Ca)與熟悉程度(Cs)分別為 0.88 和 0.57。三輪專家咨詢的意見協調系數 W 分別為 0.22、0.26 和 0.25,均小于 0.5 但呈上升趨勢。經 Kendall’s W 檢驗得 P 值均小于 0.01,可以認為三輪咨詢專家對指標的評分具有一致性(表 3)。

2.4 綜合評價指標體系建立流程、內容及配套效果評判方式
指標體系建立流程見圖 1。第一、二和三輪咨詢的主要目的是篩選指標、精選指標和確定效果評判方式。糖尿病 FSMP 綜合評價指標體系最終確定由一級目錄指標 4 個,二級目錄指標 15 個,三級目錄指標 20 個構成,其中末端指標共 27 個(表 4)。


所得串聯式效果評判方式見圖 2。首先需要對 FSMP 臨床試驗對照組的選擇做出判斷,若對照組為全營養配方食品或通用藥字號腸內營養制劑,那么滿足 M 方面指標效果優于對照組,且 NSO 三個方面指標均不劣于對照組的條件才可考慮受試產品為糖尿病全營養配方食品;若對照組為糖尿病全營養配方食品或藥字號糖尿病專用腸內營養制劑,則需滿足 MNSO 四個方面指標均不劣于對照組才可考慮該受試產品通過臨床試驗。評判 M、N、S、O 不劣于對照組的條件一致,即下屬所有指標均須不劣于對照組。11 名專家(占 35.5%)認為判斷 M 優于對照組須滿足糖代謝優于且其他下屬指標不劣于對照組;而判定糖代謝優于對照組則須至少滿足空腹血糖和餐后血糖均優于對照組。

3 討論
3.1 系統評價和 Delphi 法結合構建指標體系的方法學優勢
本次研究基于前期系統評價研究結果,借鑒原國家食品藥品監督管理局對 FSMP 臨床試驗的相關規定,結合經典數理統計理論,聯合 Delphi 專家咨詢等方法初步建立了糖尿病 FSMP 臨床試驗的評價指標體系。
Delphi 法適用于解決客觀上偶然性較大且缺少確切數據的評估問題。這一研究方法已被我國衛生系統廣泛用于衛生事業的發展預測、評估、決策分析和發展規劃等,《中國 2000 年預防保健戰略目標》、《中國城市 2000 年人人健康的規劃目標和評價指標》等均是衛生領域應用 Delphi 法的重要實例。因全球僅中國要求 FSMP 進行臨床試驗,故目前尚無公認相關指標基礎。因此采用發展趨近成熟、兼具方便和經濟特點的 Delphi 專家咨詢法適用于初步完善糖尿病 FSMP 綜合評價指標體系。
前期對糖尿病 FSMP 的臨床研究進行了系統評價,其結果增加了整個指標體系構建過程的客觀性。我們建立指標體系的初始數據主要源自前期系統評價結果。后期第二輪專家咨詢指標的精選過程除評分均值、滿分比和變異系數外還進行了 Meta 分析,以此為專家咨詢提供了目前所得最好、最全的參考數據,專家據此所做評分的客觀性更強,所得指標體系則有相對更廣的普適性。
3.2 專家樣本的代表性和一致性
本研究秉承學術與管理專家相結合的原則,主要依據專家工作年限、知識結構、對臨床營養工作的了解狀況遴選了 34 名專家(均為全國各大醫院臨床營養專家,專家人數包含 10% 的失訪預估),實際有 3 名專家失訪(失訪率 8.8%)。
3 輪專家咨詢的專家積極系數依次為 94.1%、100% 和 96.9%,每輪問卷回收用時約 1 月,專家填答時間充裕,問卷質量獲得高保障。3 輪問卷專家積極系數均高于 90%,說明專家積極性高且對本研究持有較大興趣。
本研究專家咨詢的 Cr 為 0.73,其中 Ca 與 Cs 分別為 0.88 和 0.57。Ca 較高,說明專家的判斷依據主要來源于自身學識及經驗;Cs 處于中下水平,側面反映出糖尿病 FSMP 臨床試驗的相關內容尚未被廣泛研究和應用。
有研究認為協調系數并非是終止咨詢的充足條件,若專家人數大于 10 人,即使協調系數值很小,也同樣具有顯著性意義[48, 49]。本研究結果與此類似,3 輪專家咨詢的專家意見協調系數偏低但均具有統計學意義,分別為 0.22、0.26 和 0.25,具上升趨勢,可認為專家意見趨于協調。但究其偏低原因可能為:① 研究課題較新,咨詢條目過多,在受訪前專家之間缺乏交流,各專家的醫學流派、經驗與認知存在差異;② 每輪專家咨詢問卷對于三級及以下目錄指標的評價維度遵循專家意見均有所改動,例如對于指標經濟性的評價只出現在第二輪咨詢中。因此協調系數僅能利用貫穿始終的重要性維度進行計算,其他方面的信息并沒有被利用,能反映的專家意見實際協調程度比較有限;③ 專家組中存在一些高度協調組,但各高度協調組之間的意見相互對立[48, 49]。提示我們下一步工作內容應包含進一步尋找各高度協調組,針對各專家組的意見癥結,設立幾種方案以供決策。
3.3 本研究的局限性
專家咨詢團隊的研究背景較集中于臨床營養學,其他臨床學科(內分泌等)、管理、方法學、醫保、經濟、市場和患者等利益相關者并未納入,可能致使指標體系的普適性和可接受性受限。未來還可在以下方面進行完善:在安全性指標方面可以考慮補充觀察性研究來源的指標以進一步完善;方法學上可借鑒有效性試驗核心結局指標思想進一步提高該指標體系的科學性和共識性;可賦予各級指標權重以完成綜合評價指標體系從定性到定量的轉化。
總之,本研究從指標重要性、可操作性、獨立性和經濟性等維度出發,全面檢索目前可得最好證據盡可能客觀地初步構建并完善了一套糖尿病 FSMP 綜合評價指標體系,其內容囊括特醫臨床效果、營養充足性、安全性等方面,屬我國首次探索與嘗試對 FSMP 臨床試驗進行評價。本指標體系包括一級目錄指標 4 個,二級目錄指標 15 個,三級目錄指標 20 個,其中末端指標即直接用于實施評價的指標共 27 個。該指標體系的初步構建和完善回答了《特殊醫學用途配方食品通則》中關于如何科學證實臨床效果及安全性的問題,對完善 FSMP 上市前評價和上市后監管,評估醫學營養治療(MNT)特色及優勢,提升營養經濟及其社會效益有重大意義。但由于研究方法、偏倚等局限性,該指標體系還存在諸多瑕疵,因此有必要后續進行實例研究以期進一步修訂和完善該指標體系。
隨著社會經濟水平的發展,我國乃至全球的慢病現狀及其經濟負擔已不容小覷。特殊醫學用途配方食品(food for special medical purposes,FSMP)早在上個世紀 80 年代就被廣泛應用于臨床,并在改善營養狀況、促進康復、縮短住院時間、節省醫療開支等方面具有重要作用。我國 FSMP 研究起步較晚,但對 FSMP 臨床試驗要求之嚴為全球之最。原國家食品藥品監督管理總局等政府部門自 2013 年起陸續發布了國家對 FSMP 的注冊管理和市場監督的系列文件,《特殊醫學用途配方食品管理注冊辦法(試行)》指出我國今后將對 FSMP 注冊進行嚴格管理,尤其是特定全營養配方食品的注冊必須按照《特殊醫學用途配方食品臨床試驗質量管理規范》嚴格進行上市前臨床試驗。此前并無他國對 FSMP 有類似規定,國外系列文件也并未指明如何評估 FSMP 的臨床試驗結果,故尚無被普遍接受的評價指標體系、結果評判方法和他國相應經驗可供參考。我們前期通過系統評價(systematic review,SR)發現現有糖尿病 FSMP 綜合評價指標體系十分龐雜,急需修訂,以獲得初步完善、簡便可用的糖尿病 FSMP 綜合評價指標體系。
1 對象與方法
1.1 資料來源
本研究前期從 6 個醫學常用數據庫中檢索到 14 198 篇(包括參考文獻追溯法獲得的 49 篇)文章中納入 46 篇[1-46]符合要求的隨機對照試驗(randomized controlled trial,RCT),其中主題為管飼(tube feeding,TF)的研究 14 篇[1-14],口服營養補充(oral nutritional supplements,ONS)的研究 32 篇[15-46](相關 SR[47]已于另文發表)。從其試驗方案中提取末端指標 161 個,分類分級展開后形成以 MNSO(特醫臨床效果、營養充足性、安全性和其他指標)為主要枝干,下分五級目錄的樹形網狀結構。最后保留出現頻數<3 次但經討論認為與研究目的密切相關的指標及出現頻數≥3 次的指標以初步構建糖尿病 FSMP 綜合評價指標體系(表 1)。

第一輪 Delphi 專家咨詢問卷來源于前期 SR 初建的糖尿病 FSMP 綜合評價指標體系;第二輪和第三輪 Delphi 專家咨詢問卷分別來源于上一輪問卷回收結果。
1.2 專家咨詢對象
邀請 34 位專家參與三輪 Delphi 專家咨詢,從指標重要性、可操作性、獨立性等方面對初選指標進行評價,運用界值法和專家評分法對指標進行刪減修改,最后得到修訂后的綜合評價指標體系及配套效果評價方法。入選專家需從事臨床醫學、臨床營養學等領域研究或實際工作,且要求具有副高及以上職稱,具有 10 年以上的相關工作經歷。
1.3 研究指標
本研究對 3 輪專家咨詢意見等數據進行統計分析,主要涉及以下統計指標:① 專家咨詢可靠性:專家積極系數、權威系數(Cr)、協調系數;② 問卷信度和效度:克朗巴赫系數 α;③ 篩選指標:指標評判得分的滿分比、欠佳比、算術均數、標準差和變異系數等。
1.4 質量控制
以國家領導性文件為框架,項目組就指標體系專家評議表的制定組織了多次討論并結合臨床經驗進行反復斟酌、修改,最終確定各輪專家咨詢評議表。問卷(評議表)設計力求結構清晰、靶向明確、語句簡明,避免因評議表過于復雜而影響專家正確評價。每輪問卷條目后均采用半開放式留白,以便專家闡釋自身觀點。通過郵件發放和回收各輪問卷,并在問卷首頁附有咨詢電話和郵箱地址以便隨時答疑。遇漏填、錯填等情況及時反饋并請專家重填。每條消息均通過短信、微信等與郵件同時發送。驗收合格的問卷以紙質版形式編號并留檔。
1.5 統計分析
用 Microsoft Access 2016 軟件錄入問卷數據。在數據錄入完成后逐一檢查各項記錄是否有誤。若發現有誤以紙質留檔為準并及時修改。用 SPSS 22.0 軟件分析問卷信度、效度及可靠性。指標刪除標準:① 直接刪除:界值法中指標算術均值、滿分比、變異系數這 3 個尺度中有≥2 個未達標者;專家評價法中可操作性欠佳比≥10% 者;界值法和專家評價法總計 6 個尺度中有≥2 個尺度不合格者;第一輪咨詢整體得分均值≤3 和(或)滿分比≤0.2;第二輪咨詢整體得分均值≤4 和(或)滿分比≤0.3。② 討論后決定:專家在備注中提出的其他刪除意見,經討論通過者;未達直接刪除標準,但界值法和評分法統計所得不合格尺度數和不等于0 的指標再次討論通過刪除決定者。
2 結果
2.1 咨詢專家的基本情況
共邀請 34 名專家分別來自全國 34 家三甲醫院。實際共 31 名專家完整參與了三輪專家咨詢(2 名和 1 名專家分別在第一、三輪咨詢脫失)。32 名專家(包括參與全程的 31 名專家及于第三輪脫失的 1 名專家)中,12 名(37.5%)為博士及以上學歷,15 名(46.9%)為碩士學歷,本科及以下學歷 5 名(15.6%)。所有專家工作年限均在 10 年以上,工作年限為 10~19 年的有 8 名(占 25.0%),20~29 年有 13 名(占 40.6%),30 年以上的有 11 名(占 34.4%)。其中 16 名(占 50.0%)為高級職稱專家,14 名(占 43.8%)為副高級職稱專家。
2.2 專家咨詢問卷的信度和效度
對三輪專家咨詢問卷分別進行內部一致性檢驗,第一輪至第三輪專家咨詢的克朗巴赫 α 系數分別為 0.98、0.96 和 0.92,均高于 0.9(表 2)。

由于全球僅中國要求特定全營養配方食品必須進行臨床試驗,但目前尚無國際公認“金標準”,因此僅能初步對問卷結構效度和內容效度進行評價。專家一致認為本問卷具有較好效度。
2.3 專家咨詢的可靠性
專家咨詢的可靠性直接影響指標體系的科學性和普適性。采用專家積極系數、權威程度和專家意見協調程度 3 項指標檢驗專家咨詢的可靠性。三輪咨詢問卷的回收率,即專家積極系數分別為 94.1%、100% 和 96.9%。專家咨詢 Cr 為 0.73,其中判斷依據(Ca)與熟悉程度(Cs)分別為 0.88 和 0.57。三輪專家咨詢的意見協調系數 W 分別為 0.22、0.26 和 0.25,均小于 0.5 但呈上升趨勢。經 Kendall’s W 檢驗得 P 值均小于 0.01,可以認為三輪咨詢專家對指標的評分具有一致性(表 3)。

2.4 綜合評價指標體系建立流程、內容及配套效果評判方式
指標體系建立流程見圖 1。第一、二和三輪咨詢的主要目的是篩選指標、精選指標和確定效果評判方式。糖尿病 FSMP 綜合評價指標體系最終確定由一級目錄指標 4 個,二級目錄指標 15 個,三級目錄指標 20 個構成,其中末端指標共 27 個(表 4)。


所得串聯式效果評判方式見圖 2。首先需要對 FSMP 臨床試驗對照組的選擇做出判斷,若對照組為全營養配方食品或通用藥字號腸內營養制劑,那么滿足 M 方面指標效果優于對照組,且 NSO 三個方面指標均不劣于對照組的條件才可考慮受試產品為糖尿病全營養配方食品;若對照組為糖尿病全營養配方食品或藥字號糖尿病專用腸內營養制劑,則需滿足 MNSO 四個方面指標均不劣于對照組才可考慮該受試產品通過臨床試驗。評判 M、N、S、O 不劣于對照組的條件一致,即下屬所有指標均須不劣于對照組。11 名專家(占 35.5%)認為判斷 M 優于對照組須滿足糖代謝優于且其他下屬指標不劣于對照組;而判定糖代謝優于對照組則須至少滿足空腹血糖和餐后血糖均優于對照組。

3 討論
3.1 系統評價和 Delphi 法結合構建指標體系的方法學優勢
本次研究基于前期系統評價研究結果,借鑒原國家食品藥品監督管理局對 FSMP 臨床試驗的相關規定,結合經典數理統計理論,聯合 Delphi 專家咨詢等方法初步建立了糖尿病 FSMP 臨床試驗的評價指標體系。
Delphi 法適用于解決客觀上偶然性較大且缺少確切數據的評估問題。這一研究方法已被我國衛生系統廣泛用于衛生事業的發展預測、評估、決策分析和發展規劃等,《中國 2000 年預防保健戰略目標》、《中國城市 2000 年人人健康的規劃目標和評價指標》等均是衛生領域應用 Delphi 法的重要實例。因全球僅中國要求 FSMP 進行臨床試驗,故目前尚無公認相關指標基礎。因此采用發展趨近成熟、兼具方便和經濟特點的 Delphi 專家咨詢法適用于初步完善糖尿病 FSMP 綜合評價指標體系。
前期對糖尿病 FSMP 的臨床研究進行了系統評價,其結果增加了整個指標體系構建過程的客觀性。我們建立指標體系的初始數據主要源自前期系統評價結果。后期第二輪專家咨詢指標的精選過程除評分均值、滿分比和變異系數外還進行了 Meta 分析,以此為專家咨詢提供了目前所得最好、最全的參考數據,專家據此所做評分的客觀性更強,所得指標體系則有相對更廣的普適性。
3.2 專家樣本的代表性和一致性
本研究秉承學術與管理專家相結合的原則,主要依據專家工作年限、知識結構、對臨床營養工作的了解狀況遴選了 34 名專家(均為全國各大醫院臨床營養專家,專家人數包含 10% 的失訪預估),實際有 3 名專家失訪(失訪率 8.8%)。
3 輪專家咨詢的專家積極系數依次為 94.1%、100% 和 96.9%,每輪問卷回收用時約 1 月,專家填答時間充裕,問卷質量獲得高保障。3 輪問卷專家積極系數均高于 90%,說明專家積極性高且對本研究持有較大興趣。
本研究專家咨詢的 Cr 為 0.73,其中 Ca 與 Cs 分別為 0.88 和 0.57。Ca 較高,說明專家的判斷依據主要來源于自身學識及經驗;Cs 處于中下水平,側面反映出糖尿病 FSMP 臨床試驗的相關內容尚未被廣泛研究和應用。
有研究認為協調系數并非是終止咨詢的充足條件,若專家人數大于 10 人,即使協調系數值很小,也同樣具有顯著性意義[48, 49]。本研究結果與此類似,3 輪專家咨詢的專家意見協調系數偏低但均具有統計學意義,分別為 0.22、0.26 和 0.25,具上升趨勢,可認為專家意見趨于協調。但究其偏低原因可能為:① 研究課題較新,咨詢條目過多,在受訪前專家之間缺乏交流,各專家的醫學流派、經驗與認知存在差異;② 每輪專家咨詢問卷對于三級及以下目錄指標的評價維度遵循專家意見均有所改動,例如對于指標經濟性的評價只出現在第二輪咨詢中。因此協調系數僅能利用貫穿始終的重要性維度進行計算,其他方面的信息并沒有被利用,能反映的專家意見實際協調程度比較有限;③ 專家組中存在一些高度協調組,但各高度協調組之間的意見相互對立[48, 49]。提示我們下一步工作內容應包含進一步尋找各高度協調組,針對各專家組的意見癥結,設立幾種方案以供決策。
3.3 本研究的局限性
專家咨詢團隊的研究背景較集中于臨床營養學,其他臨床學科(內分泌等)、管理、方法學、醫保、經濟、市場和患者等利益相關者并未納入,可能致使指標體系的普適性和可接受性受限。未來還可在以下方面進行完善:在安全性指標方面可以考慮補充觀察性研究來源的指標以進一步完善;方法學上可借鑒有效性試驗核心結局指標思想進一步提高該指標體系的科學性和共識性;可賦予各級指標權重以完成綜合評價指標體系從定性到定量的轉化。
總之,本研究從指標重要性、可操作性、獨立性和經濟性等維度出發,全面檢索目前可得最好證據盡可能客觀地初步構建并完善了一套糖尿病 FSMP 綜合評價指標體系,其內容囊括特醫臨床效果、營養充足性、安全性等方面,屬我國首次探索與嘗試對 FSMP 臨床試驗進行評價。本指標體系包括一級目錄指標 4 個,二級目錄指標 15 個,三級目錄指標 20 個,其中末端指標即直接用于實施評價的指標共 27 個。該指標體系的初步構建和完善回答了《特殊醫學用途配方食品通則》中關于如何科學證實臨床效果及安全性的問題,對完善 FSMP 上市前評價和上市后監管,評估醫學營養治療(MNT)特色及優勢,提升營養經濟及其社會效益有重大意義。但由于研究方法、偏倚等局限性,該指標體系還存在諸多瑕疵,因此有必要后續進行實例研究以期進一步修訂和完善該指標體系。