引用本文: 王子豪, 王福強, 張含露, 鄭羽, 王允. 胸腔鏡的臨床功能及適用性評價體系構建研究. 中國胸心血管外科臨床雜志, 2020, 27(8): 893-899. doi: 10.7507/1007-4848.201912037 復制
近年來隨著微創外科技術的迅速發展與推廣,腔鏡手術已逐步取代傳統開放手術成為主流外科治療方式。微創手術的快速發展與普及,也帶動了腔鏡產業市場的迅速擴大與制造業的高速發展。在過去 30 多年的發展中,國產醫療器械產品從無到有,從內鏡耗材生產到內鏡的生產,基本上形成了一個獨立的產業分支,在生產研發及臨床應用上都取得了很大的成就。然而,由于技術標準、質量穩定性的不足,我國生產的醫用內窺鏡的市場份額相對較小,國內內窺鏡市場的巨大市場份額仍然被國外品牌占領[1]。
目前國際國內公開的行業標準主要著眼于設備安全指標,而對外科醫生關注的其它問題,如臨床操作方便性、可靠性以及服務體系的完善程度等,缺乏系統性的行業評價標準,導致腔鏡生產廠家無法全面、深入地理解臨床需求,做出適銷對路的產品。同時,外科醫生沒有及時、全面反饋對腔鏡評價及性能要求的渠道,只能被動等待腔鏡的升級來獲得操作體驗的提升[2]。本研究擬建立一套全面的胸腔鏡臨床功能及適用性評價體系,從臨床醫生的使用體驗出發對不同胸腔鏡進行合理評價,同時為腔鏡制造廠商對下一代胸腔鏡的升級提供意見。
1 資料與方法
1.1 初量表編制
1.1.1 成立項目協調小組
項目協調小組包含高級職稱 1 名,研究生 2 名。其主要任務為擬定研究主題、選擇專家、編制專家咨詢表、收集數據、統計分析數據、討論篩選指標。
1.1.2 初步評價條目池的建立
項目協調小組通過廣泛的文獻閱讀、頭腦風暴等方法盡可能多地羅列出影響胸腔鏡臨床功能及適用性的因素,形成初步條目池,并說明各個指標的具體含義。
1.1.3 確定備選專家
專家選擇標準:(1)三甲醫院工作者須具備中級或以上職稱,基層醫院工作者須具有高級職稱;(2)長期從事胸外科臨床診治工作,掌握胸腔鏡的操作;(3)熟悉胸腔鏡的性能,對其它國產、進口胸腔鏡品牌有大致了解。
1.1.4 研究方法
本研究采用德爾菲法對條目池進行初步篩選。即根據初步評價條目池設計調查問卷,通過紙質版或電子郵件形式向專家發放相應的調查問卷,請專家們對條目池中指標的重要性進行評分,并指出判斷依據和熟悉程度。通過分析總結專家的意見,選擇出關鍵的重要指標。
首先,第一輪德爾菲法向專家解釋研究背景、目的、研究意義以及德爾菲法的要點,以更好地了解本課題及課題的研究方法。各專家對條目池中的指標進行評分,并可以提出自己的建議。整合和分析第一輪德爾菲法中專家的意見,對條目池中各指標進行刪減、修改。將第一輪的統計結果和第二輪專家咨詢表反饋給各專家,進行第二輪德爾菲法調查。專家們重新填寫第二輪專家咨詢表并對修改后的條目池再次進行評價,項目小組根據專家評價意見對各指標進行統計學計算,刪減、修改部分指標,進一步完善評價量表。重復以上過程,直至基本所有指標都符合要求,專家的意見一致。
采用李克特五級量表法(Likert scale)對重要程度進行分級量化,將非常重要、重要、一般、不重要、非常不重要 5 個層次分別賦值 5 分、4 分、3 分、2 分、1 分[3]。專家權威程度是衡量專家小組評價結果可靠性的一個指標,由判斷依據和熟悉程度這兩個因素決定,并由二者的均值表示。熟悉程度分為:很熟悉、熟悉、比較熟悉、不太熟悉、不熟悉,分別賦值:1.0 分、0.8 分、0.6 分、0.4 分、0 分。判斷依據包括實踐經驗、理論分析、對國內外相關進展的了解、參考文獻、直觀程度,分別賦值為 1.0 分、0.8 分、0.6 分、0.4 分、0.1 分[3]。
1.1.5 統計學分析及指標篩選
收集、整理專家咨詢結果,分別計算專家積極系數、重要性均值、滿分頻數、變異系數、協調系數和專家權威程度。重要性均值>3 分,指標予以保留,反之則予以刪除[4]。變異系數<0.25,表明專家的意見比較一致;若>0.25,則表明指標的專家認同程度不夠,有必要重新進行一輪專家咨詢以統一意見[5]。協調系數表示各專家對各項指標評價的意見是否存在重大差異。經過 2~3 輪德爾菲法后,協調系數波動在 0.5,整體協調性較好[6]。若系數<0.5,可考慮再進行一輪專家咨詢。專家的權威程度通常用以評價選擇的專家是否具有權威性。普遍認為專家權威程度達到 0.7 以上,表明專家的權威性較好[7-8]。
1.2 正式量表的確定
1.2.1 預調查
根據德爾菲法最終篩選的指標制定預試量表。該量表按 Likert scale 評分,收集調查對象對胸腔鏡臨床功能及適用性的滿意程度(1=很不滿意,2=不滿意,3=一般,4=滿意,5=很滿意),量表的分值越高表明胸腔鏡的臨床功能和適用性越讓人滿意。按照量表樣本量與條目 1∶5 的比例來估算預調查的最小樣本量[9-10]。
1.2.2 調查對象
本研究的調查對象為參與胸腔鏡手術的外科醫生,在課題組所屬的醫療小組完成胸腔鏡手術后,項目協調小組及時對參與手術的 3~4 名外科醫生,包括主刀、助手和扶鏡手進行滿意度調查。
1.2.3 統計學分析及指標篩選
對預調查收集的資料進行項目分析和信效度檢驗后,刪除部分不符合要求的條目,最終確定正式調查量表。
項目分析采用臨界比法,將所有調查對象在量表中的總得分按高低水平進行排序,總分在前 27% 的作為高分組,后 27% 的作為低分組,用獨立樣本 t 檢驗檢測兩組間差異[11-12]。臨界比法能夠考查量表的區分度,用以刪除無鑒別力的選題。當 t>3.0 時,P<0.05,項目可以保留[13]。
本研究采用的信度檢驗指標是克隆巴赫 α(Cronbach's α)值。一般認為,Cronbach's α 值<0.6 則表示內部一致性不足,達到 0.7~0.8 表示量表具有相當的信度,0.8 以上表示信度很好[9]。此外,項目按奇數和偶數提取分為兩組,其分半信度系數用斯皮爾曼-布朗(Spearman-Brown)公式計算[9, 14]。在本研究中,應用探索性因子分析法檢驗問卷的結構效度。篩選標準如下:(1)最大因子載荷量<0.4;(2)共同度<0.2;(3)有多個因子載荷量>0.5。
2 結果
2.1 初量表編制
2.1.1 第一輪德爾菲法
項目協調小組制定初步評價量表,共納入 24 個胸腔鏡相關評價指標。選取了 15 名符合標準的專家,第一輪德爾菲法通過會議現場填寫紙質問卷的方式,共發放了 15 份問卷,回收了 15 份有效問卷,回收率為 100.0%。專家積極系數為 100.0%。
第一輪德爾菲法結果見表 1。重要性評分均數得分最高的指標為注視距離變焦,均數 4.80 分;最低的為發熱程度及鏡柄外形,均數 3.33 分。每項指標的重要性平均得分均>3 分。變異系數的范圍是 0.10~0.39;其中,交互界面合理性、胸腔鏡長度、鏡柄重量、鏡柄外形、按鈕誤觸、按鈕盲操作、鏡頭靈活性、發熱程度、胸腔鏡直徑、光纖長度、鏡頭抗污/霧功能這 11 項指標的變異系數均>0.25,說明對于這些指標專家沒有達成基本的共識,需要進一步統一意見。這些指標都將在第二輪德爾菲法中特別指出,請專家根據第一輪的統計結果重新打分。第一輪調查的協調系數,即肯德爾系數為 0.272,P<0.001,提示各個專家意見之間的協調程度不高,需要進行第二輪德爾菲法。各指標的平均專家權威系數均>0.70,最終總的平均權威系數為 0.86,顯示出較高的專家權威程度,這表明專家熟悉協商的內容,評價的結果比較可靠。

第一輪專家咨詢中所有指標的重要性評分均值均>3 分,表明所有指標均比較重要,可以保留;根據據專家反饋意見,指標亮度調節與按鈕盲操作涉及內容有所重復,經項目協調小組協商后,最終決定刪除亮度調節。
2.1.2 第二輪德爾菲法
第二輪德爾菲法通過電子郵件向 15 位專家發送調查問卷,共發放問卷 15 份,回收 12 份有效問卷。回收率為 80.0%,專家積極系數為 80.0%。
第二輪德爾菲法結果見表 1。重要性評分均數得分最高的指標為注視距離變焦,均數 4.92 分;最低的為發熱程度及胸腔鏡直徑,均數 3.17 分。沒有平均重要性評分<3 分的指標,重要性評分比較滿意。第二輪德爾菲專家咨詢的變異系數范圍為 0.06~0.23;其中,變異系數最大的是胸腔鏡直徑和按鈕盲操作,為 0.23;最小的是注視距離變焦,為 0.06;全部<0.25,表明具有良好的專家認同和高度的協調性。協調系數顯著高于第一輪協商,為 0.523,P<0.001,表明專家們對指標重要性的看法趨于一致,可信度很高。第二輪德爾菲法所有指標的專家平均權威系數均高于 0.70,最終總的平均權威系數為 0.90,專家有很高的權威性。
第二輪德爾菲法結果分析顯示,各指標的重要性得分均值均>3 分;變異系數和協調系數結果令人滿意,專家權威性較高。因為第二輪專家咨詢的意見基本協調統一,無指標進行調整,故本研究未再進行第三輪調查。
2.2 正式量表的確定
2.2.1 預調查
根據兩輪德爾菲法最終篩選出的 23 條評價指標制定滿意度評價量表。2018 年 10 月至 2019 年 1 月期間,在課題組所屬醫療小組內,對參與胸腔鏡微創手術的外科醫生發放問卷,問卷由項目協調小組在術后及時發放,并現場協助被調查者填寫完畢后當場收回。共收回 140 份問卷,其中有效問卷 126 份,有效率 90.0%。
2.2.2 項目分析
采取臨界比法,高分組和低分組之間經兩獨立樣本 t 檢驗發現,所有條目 t>3,P<0.05,差異均具有統計學意義。表明每個條目都具有高度的區分和鑒別能力,無條目刪除。
2.2.3 信度檢驗
量表的 Cronbach's α 值為 0.936,>0.7,認為該量表與其項目具有較好的內部一致性。修正后的項與總計相關性均>0.4;刪除每個項目后,Cronbach's α 值沒有顯著增加,因此無條目刪除。采用 Spearman-Brown 公式計算量表的分半信度系數,條目按奇偶順序分成兩部分。結果表明,量表兩部分的 Cronbach's α 值分別為 0.875 和 0.869。兩個半量表的相關系數為 0.945,Spearmen-Brown 分半信度系數為 0.972,說明分半信度較好。
2.2.4 效度檢驗
2.2.4.1 因子分析
經檢驗得到 KMO 值為 0.835,>0.6;巴特利球形檢驗的近似卡方值為 2 980.516(df=253,P=0.000),因此適合進行探索性因子分析。采用主成分分析法和方差最大旋轉法對量表進行因子分析,在不設定因子個數的情況下提取因子,并根據特征值>1 的提取原則,確定 4 個因子,旋轉成分矩陣和累計方差解釋詳見表 2。

根據因子分析的篩選標準,鏡頭穩定性、標準距離光斑和胸腔鏡直徑同時在兩個因子上的載荷>0.5 且數值接近,予以刪除;刪除以上 3 個條目后,注視距離光斑單獨存在于 1 個因子下,無法歸類,予以刪除。
剩余的 19 條指標再次進行檢驗,KMO 值為 0.809,巴特利球面檢驗的近似卡方值為 2 286.803(df=171,P=0.000)。行探索性因子分析確定 3 個因子,3 個因子的累計解釋總方差為 70.9%,19 個條目的共同度均>0.2,旋轉成分矩陣顯示因子載荷均>0.5,且無>0.5 的跨因子載荷;見表 3。

2.2.4.2 因子命名
項目協調小組根據每個因子所包含的主題含義,參考相關文獻并分別命名。因子 1 主要涉及影響術者操作的因素,故將之命名為操作相關;因子 2 主要涉及術中圖像質量的影響因素,故將之命名為圖像相關;因子 3 主要涉及顯像設備的質量,將之命名為設備相關。
2.2.5 胸腔鏡的臨床功能及適用性評價正式量表
根據兩輪德爾菲法和信效度的檢驗,最終保留 19 個條目,分別劃分至 3 大因子中,正式初量表見表 4。

3 討論
隨著微創技術的快速發展,國產腔鏡的發展和推廣非常迅速,浙江、上海等地的醫用腔鏡產業已頗具規模,市場規模也迅速增長,腔鏡生產技術迅速發展,逐漸接近國際先進水平。但國產醫用腔鏡分布主要局限在基層醫院,總體所占市場份額較少[1, 15];國內外產品差距缺少定量、明確的認識,主流省市級醫院認可度不高;國產品牌多而雜,國家標準、行業規定等相關評價標準缺乏,用戶使用缺少依據,需要對其給予全面、準確的評價。
既往有研究人員嘗試通過對不同型號的輸尿管軟鏡從手術時間、可操作性、可視性等客觀及主觀指標進行評價,以對下一代腔鏡的升級提出意見[16-17]。胸腔鏡領域暫時缺乏相關的研究,但其主觀使用體驗如清晰度等指標一直是胸外科醫生所關注的問題。因此,建立一套適用于醫用胸腔鏡的評價體系,為臨床使用提供參考,為國產設備的研發、創新指出方向,推動優秀國產醫用腔鏡的普及應用,促進國產醫用設備的發展,是十分必要的。
本研究采用德爾菲法初步建立量表。德爾菲法核心是通過幾輪調查,征求專家意見。評估小組對每一輪進行意見總結,然后反饋給每一位專家,作為專家分析、判斷的參考。經過多次重復,觀點逐漸變得一致,并得到了更一致、更可靠的結論。專家選擇對德爾菲法結果的影響是十分重大的[18]。專家人數一般選擇 8~20 人,根據研究的規模可進行調整[19]。專家一般指從事某領域技術工作 10 年以上的專業人員[20]。應從水平、資歷和對研究問題的熟悉度來選擇專家。本研究選擇的咨詢人員均為三甲醫院中級職稱以上,長期從事胸外科專業并熟悉胸腔鏡的性能,對其它國產、進口胸腔鏡品牌有大致了解的專家,且多名專家在相關領域具有權威地位。本研究兩輪咨詢分別有 15 名和 12 名專家參加,專家數量符合要求。
效度主要評價量表的有效性和準確性。常用的效度檢驗包括結構效度和準則效度。目前缺乏評價胸腔鏡公認有效的標準,故準則效度的應用受到限制,在本研究中,應用探索性因子分析法檢驗問卷的結構效度。因子分析最終將量表的結構分為 3 個維度,分別命名為操作相關、圖像相關、設備相關,3 個維度累計解釋的總方差為 70.9%,累計方差貢獻率>40%,表明具有良好的結構效度[21]。由于條件所限,沒有進一步進行驗證性因子分析、維度分布情況分析。將來,需要更多的樣本和更廣泛的調查范圍來進一步驗證該量表的信度、效度,并建立胸腔鏡評價標準。
綜上所述,本研究編制了胸腔鏡的臨床功能及適用性滿意度評價量表,共包括 3 個維度 19 個條目,并進行了信度和效度的檢驗。本量表的建立過程符合量表編制的流程,并且經過初步的探索性分析和相關性分析,證明該量表具有較好的信度和效度,能夠充分反映外科醫生對胸腔鏡臨床使用過程中各個方面的滿意度,對促進胸腔鏡的評價分析、推進胸腔鏡的創新和發展具有重要意義。
利益沖突:無。
作者貢獻:王子豪負責設計研究、初稿撰寫;王福強、張含露、鄭羽負責數據收集整理與分析;王允指導和設計研究、負責論文審閱和修改。
近年來隨著微創外科技術的迅速發展與推廣,腔鏡手術已逐步取代傳統開放手術成為主流外科治療方式。微創手術的快速發展與普及,也帶動了腔鏡產業市場的迅速擴大與制造業的高速發展。在過去 30 多年的發展中,國產醫療器械產品從無到有,從內鏡耗材生產到內鏡的生產,基本上形成了一個獨立的產業分支,在生產研發及臨床應用上都取得了很大的成就。然而,由于技術標準、質量穩定性的不足,我國生產的醫用內窺鏡的市場份額相對較小,國內內窺鏡市場的巨大市場份額仍然被國外品牌占領[1]。
目前國際國內公開的行業標準主要著眼于設備安全指標,而對外科醫生關注的其它問題,如臨床操作方便性、可靠性以及服務體系的完善程度等,缺乏系統性的行業評價標準,導致腔鏡生產廠家無法全面、深入地理解臨床需求,做出適銷對路的產品。同時,外科醫生沒有及時、全面反饋對腔鏡評價及性能要求的渠道,只能被動等待腔鏡的升級來獲得操作體驗的提升[2]。本研究擬建立一套全面的胸腔鏡臨床功能及適用性評價體系,從臨床醫生的使用體驗出發對不同胸腔鏡進行合理評價,同時為腔鏡制造廠商對下一代胸腔鏡的升級提供意見。
1 資料與方法
1.1 初量表編制
1.1.1 成立項目協調小組
項目協調小組包含高級職稱 1 名,研究生 2 名。其主要任務為擬定研究主題、選擇專家、編制專家咨詢表、收集數據、統計分析數據、討論篩選指標。
1.1.2 初步評價條目池的建立
項目協調小組通過廣泛的文獻閱讀、頭腦風暴等方法盡可能多地羅列出影響胸腔鏡臨床功能及適用性的因素,形成初步條目池,并說明各個指標的具體含義。
1.1.3 確定備選專家
專家選擇標準:(1)三甲醫院工作者須具備中級或以上職稱,基層醫院工作者須具有高級職稱;(2)長期從事胸外科臨床診治工作,掌握胸腔鏡的操作;(3)熟悉胸腔鏡的性能,對其它國產、進口胸腔鏡品牌有大致了解。
1.1.4 研究方法
本研究采用德爾菲法對條目池進行初步篩選。即根據初步評價條目池設計調查問卷,通過紙質版或電子郵件形式向專家發放相應的調查問卷,請專家們對條目池中指標的重要性進行評分,并指出判斷依據和熟悉程度。通過分析總結專家的意見,選擇出關鍵的重要指標。
首先,第一輪德爾菲法向專家解釋研究背景、目的、研究意義以及德爾菲法的要點,以更好地了解本課題及課題的研究方法。各專家對條目池中的指標進行評分,并可以提出自己的建議。整合和分析第一輪德爾菲法中專家的意見,對條目池中各指標進行刪減、修改。將第一輪的統計結果和第二輪專家咨詢表反饋給各專家,進行第二輪德爾菲法調查。專家們重新填寫第二輪專家咨詢表并對修改后的條目池再次進行評價,項目小組根據專家評價意見對各指標進行統計學計算,刪減、修改部分指標,進一步完善評價量表。重復以上過程,直至基本所有指標都符合要求,專家的意見一致。
采用李克特五級量表法(Likert scale)對重要程度進行分級量化,將非常重要、重要、一般、不重要、非常不重要 5 個層次分別賦值 5 分、4 分、3 分、2 分、1 分[3]。專家權威程度是衡量專家小組評價結果可靠性的一個指標,由判斷依據和熟悉程度這兩個因素決定,并由二者的均值表示。熟悉程度分為:很熟悉、熟悉、比較熟悉、不太熟悉、不熟悉,分別賦值:1.0 分、0.8 分、0.6 分、0.4 分、0 分。判斷依據包括實踐經驗、理論分析、對國內外相關進展的了解、參考文獻、直觀程度,分別賦值為 1.0 分、0.8 分、0.6 分、0.4 分、0.1 分[3]。
1.1.5 統計學分析及指標篩選
收集、整理專家咨詢結果,分別計算專家積極系數、重要性均值、滿分頻數、變異系數、協調系數和專家權威程度。重要性均值>3 分,指標予以保留,反之則予以刪除[4]。變異系數<0.25,表明專家的意見比較一致;若>0.25,則表明指標的專家認同程度不夠,有必要重新進行一輪專家咨詢以統一意見[5]。協調系數表示各專家對各項指標評價的意見是否存在重大差異。經過 2~3 輪德爾菲法后,協調系數波動在 0.5,整體協調性較好[6]。若系數<0.5,可考慮再進行一輪專家咨詢。專家的權威程度通常用以評價選擇的專家是否具有權威性。普遍認為專家權威程度達到 0.7 以上,表明專家的權威性較好[7-8]。
1.2 正式量表的確定
1.2.1 預調查
根據德爾菲法最終篩選的指標制定預試量表。該量表按 Likert scale 評分,收集調查對象對胸腔鏡臨床功能及適用性的滿意程度(1=很不滿意,2=不滿意,3=一般,4=滿意,5=很滿意),量表的分值越高表明胸腔鏡的臨床功能和適用性越讓人滿意。按照量表樣本量與條目 1∶5 的比例來估算預調查的最小樣本量[9-10]。
1.2.2 調查對象
本研究的調查對象為參與胸腔鏡手術的外科醫生,在課題組所屬的醫療小組完成胸腔鏡手術后,項目協調小組及時對參與手術的 3~4 名外科醫生,包括主刀、助手和扶鏡手進行滿意度調查。
1.2.3 統計學分析及指標篩選
對預調查收集的資料進行項目分析和信效度檢驗后,刪除部分不符合要求的條目,最終確定正式調查量表。
項目分析采用臨界比法,將所有調查對象在量表中的總得分按高低水平進行排序,總分在前 27% 的作為高分組,后 27% 的作為低分組,用獨立樣本 t 檢驗檢測兩組間差異[11-12]。臨界比法能夠考查量表的區分度,用以刪除無鑒別力的選題。當 t>3.0 時,P<0.05,項目可以保留[13]。
本研究采用的信度檢驗指標是克隆巴赫 α(Cronbach's α)值。一般認為,Cronbach's α 值<0.6 則表示內部一致性不足,達到 0.7~0.8 表示量表具有相當的信度,0.8 以上表示信度很好[9]。此外,項目按奇數和偶數提取分為兩組,其分半信度系數用斯皮爾曼-布朗(Spearman-Brown)公式計算[9, 14]。在本研究中,應用探索性因子分析法檢驗問卷的結構效度。篩選標準如下:(1)最大因子載荷量<0.4;(2)共同度<0.2;(3)有多個因子載荷量>0.5。
2 結果
2.1 初量表編制
2.1.1 第一輪德爾菲法
項目協調小組制定初步評價量表,共納入 24 個胸腔鏡相關評價指標。選取了 15 名符合標準的專家,第一輪德爾菲法通過會議現場填寫紙質問卷的方式,共發放了 15 份問卷,回收了 15 份有效問卷,回收率為 100.0%。專家積極系數為 100.0%。
第一輪德爾菲法結果見表 1。重要性評分均數得分最高的指標為注視距離變焦,均數 4.80 分;最低的為發熱程度及鏡柄外形,均數 3.33 分。每項指標的重要性平均得分均>3 分。變異系數的范圍是 0.10~0.39;其中,交互界面合理性、胸腔鏡長度、鏡柄重量、鏡柄外形、按鈕誤觸、按鈕盲操作、鏡頭靈活性、發熱程度、胸腔鏡直徑、光纖長度、鏡頭抗污/霧功能這 11 項指標的變異系數均>0.25,說明對于這些指標專家沒有達成基本的共識,需要進一步統一意見。這些指標都將在第二輪德爾菲法中特別指出,請專家根據第一輪的統計結果重新打分。第一輪調查的協調系數,即肯德爾系數為 0.272,P<0.001,提示各個專家意見之間的協調程度不高,需要進行第二輪德爾菲法。各指標的平均專家權威系數均>0.70,最終總的平均權威系數為 0.86,顯示出較高的專家權威程度,這表明專家熟悉協商的內容,評價的結果比較可靠。

第一輪專家咨詢中所有指標的重要性評分均值均>3 分,表明所有指標均比較重要,可以保留;根據據專家反饋意見,指標亮度調節與按鈕盲操作涉及內容有所重復,經項目協調小組協商后,最終決定刪除亮度調節。
2.1.2 第二輪德爾菲法
第二輪德爾菲法通過電子郵件向 15 位專家發送調查問卷,共發放問卷 15 份,回收 12 份有效問卷。回收率為 80.0%,專家積極系數為 80.0%。
第二輪德爾菲法結果見表 1。重要性評分均數得分最高的指標為注視距離變焦,均數 4.92 分;最低的為發熱程度及胸腔鏡直徑,均數 3.17 分。沒有平均重要性評分<3 分的指標,重要性評分比較滿意。第二輪德爾菲專家咨詢的變異系數范圍為 0.06~0.23;其中,變異系數最大的是胸腔鏡直徑和按鈕盲操作,為 0.23;最小的是注視距離變焦,為 0.06;全部<0.25,表明具有良好的專家認同和高度的協調性。協調系數顯著高于第一輪協商,為 0.523,P<0.001,表明專家們對指標重要性的看法趨于一致,可信度很高。第二輪德爾菲法所有指標的專家平均權威系數均高于 0.70,最終總的平均權威系數為 0.90,專家有很高的權威性。
第二輪德爾菲法結果分析顯示,各指標的重要性得分均值均>3 分;變異系數和協調系數結果令人滿意,專家權威性較高。因為第二輪專家咨詢的意見基本協調統一,無指標進行調整,故本研究未再進行第三輪調查。
2.2 正式量表的確定
2.2.1 預調查
根據兩輪德爾菲法最終篩選出的 23 條評價指標制定滿意度評價量表。2018 年 10 月至 2019 年 1 月期間,在課題組所屬醫療小組內,對參與胸腔鏡微創手術的外科醫生發放問卷,問卷由項目協調小組在術后及時發放,并現場協助被調查者填寫完畢后當場收回。共收回 140 份問卷,其中有效問卷 126 份,有效率 90.0%。
2.2.2 項目分析
采取臨界比法,高分組和低分組之間經兩獨立樣本 t 檢驗發現,所有條目 t>3,P<0.05,差異均具有統計學意義。表明每個條目都具有高度的區分和鑒別能力,無條目刪除。
2.2.3 信度檢驗
量表的 Cronbach's α 值為 0.936,>0.7,認為該量表與其項目具有較好的內部一致性。修正后的項與總計相關性均>0.4;刪除每個項目后,Cronbach's α 值沒有顯著增加,因此無條目刪除。采用 Spearman-Brown 公式計算量表的分半信度系數,條目按奇偶順序分成兩部分。結果表明,量表兩部分的 Cronbach's α 值分別為 0.875 和 0.869。兩個半量表的相關系數為 0.945,Spearmen-Brown 分半信度系數為 0.972,說明分半信度較好。
2.2.4 效度檢驗
2.2.4.1 因子分析
經檢驗得到 KMO 值為 0.835,>0.6;巴特利球形檢驗的近似卡方值為 2 980.516(df=253,P=0.000),因此適合進行探索性因子分析。采用主成分分析法和方差最大旋轉法對量表進行因子分析,在不設定因子個數的情況下提取因子,并根據特征值>1 的提取原則,確定 4 個因子,旋轉成分矩陣和累計方差解釋詳見表 2。

根據因子分析的篩選標準,鏡頭穩定性、標準距離光斑和胸腔鏡直徑同時在兩個因子上的載荷>0.5 且數值接近,予以刪除;刪除以上 3 個條目后,注視距離光斑單獨存在于 1 個因子下,無法歸類,予以刪除。
剩余的 19 條指標再次進行檢驗,KMO 值為 0.809,巴特利球面檢驗的近似卡方值為 2 286.803(df=171,P=0.000)。行探索性因子分析確定 3 個因子,3 個因子的累計解釋總方差為 70.9%,19 個條目的共同度均>0.2,旋轉成分矩陣顯示因子載荷均>0.5,且無>0.5 的跨因子載荷;見表 3。

2.2.4.2 因子命名
項目協調小組根據每個因子所包含的主題含義,參考相關文獻并分別命名。因子 1 主要涉及影響術者操作的因素,故將之命名為操作相關;因子 2 主要涉及術中圖像質量的影響因素,故將之命名為圖像相關;因子 3 主要涉及顯像設備的質量,將之命名為設備相關。
2.2.5 胸腔鏡的臨床功能及適用性評價正式量表
根據兩輪德爾菲法和信效度的檢驗,最終保留 19 個條目,分別劃分至 3 大因子中,正式初量表見表 4。

3 討論
隨著微創技術的快速發展,國產腔鏡的發展和推廣非常迅速,浙江、上海等地的醫用腔鏡產業已頗具規模,市場規模也迅速增長,腔鏡生產技術迅速發展,逐漸接近國際先進水平。但國產醫用腔鏡分布主要局限在基層醫院,總體所占市場份額較少[1, 15];國內外產品差距缺少定量、明確的認識,主流省市級醫院認可度不高;國產品牌多而雜,國家標準、行業規定等相關評價標準缺乏,用戶使用缺少依據,需要對其給予全面、準確的評價。
既往有研究人員嘗試通過對不同型號的輸尿管軟鏡從手術時間、可操作性、可視性等客觀及主觀指標進行評價,以對下一代腔鏡的升級提出意見[16-17]。胸腔鏡領域暫時缺乏相關的研究,但其主觀使用體驗如清晰度等指標一直是胸外科醫生所關注的問題。因此,建立一套適用于醫用胸腔鏡的評價體系,為臨床使用提供參考,為國產設備的研發、創新指出方向,推動優秀國產醫用腔鏡的普及應用,促進國產醫用設備的發展,是十分必要的。
本研究采用德爾菲法初步建立量表。德爾菲法核心是通過幾輪調查,征求專家意見。評估小組對每一輪進行意見總結,然后反饋給每一位專家,作為專家分析、判斷的參考。經過多次重復,觀點逐漸變得一致,并得到了更一致、更可靠的結論。專家選擇對德爾菲法結果的影響是十分重大的[18]。專家人數一般選擇 8~20 人,根據研究的規模可進行調整[19]。專家一般指從事某領域技術工作 10 年以上的專業人員[20]。應從水平、資歷和對研究問題的熟悉度來選擇專家。本研究選擇的咨詢人員均為三甲醫院中級職稱以上,長期從事胸外科專業并熟悉胸腔鏡的性能,對其它國產、進口胸腔鏡品牌有大致了解的專家,且多名專家在相關領域具有權威地位。本研究兩輪咨詢分別有 15 名和 12 名專家參加,專家數量符合要求。
效度主要評價量表的有效性和準確性。常用的效度檢驗包括結構效度和準則效度。目前缺乏評價胸腔鏡公認有效的標準,故準則效度的應用受到限制,在本研究中,應用探索性因子分析法檢驗問卷的結構效度。因子分析最終將量表的結構分為 3 個維度,分別命名為操作相關、圖像相關、設備相關,3 個維度累計解釋的總方差為 70.9%,累計方差貢獻率>40%,表明具有良好的結構效度[21]。由于條件所限,沒有進一步進行驗證性因子分析、維度分布情況分析。將來,需要更多的樣本和更廣泛的調查范圍來進一步驗證該量表的信度、效度,并建立胸腔鏡評價標準。
綜上所述,本研究編制了胸腔鏡的臨床功能及適用性滿意度評價量表,共包括 3 個維度 19 個條目,并進行了信度和效度的檢驗。本量表的建立過程符合量表編制的流程,并且經過初步的探索性分析和相關性分析,證明該量表具有較好的信度和效度,能夠充分反映外科醫生對胸腔鏡臨床使用過程中各個方面的滿意度,對促進胸腔鏡的評價分析、推進胸腔鏡的創新和發展具有重要意義。
利益沖突:無。
作者貢獻:王子豪負責設計研究、初稿撰寫;王福強、張含露、鄭羽負責數據收集整理與分析;王允指導和設計研究、負責論文審閱和修改。