《AAOS 手術治療膝骨關節炎臨床實踐指南》涉及與膝骨關節炎(knee osteoarthritis,KOA)手術治療相關的圍手術期、術中及術后因素等領域,共 38 條推薦意見,涵蓋 KOA 手術治療危險因素的鑒定,術前、術中、術后康復鍛煉策略的效果,置換假體型號的選擇,關節置換方案的制訂及如何減少圍手術期相關并發癥的措施等。與國內的關節炎診療共識相比,美國骨科學會(American Academy of Orthopaedic Surgeons,AAOS)制訂的這部指南在方法學的選擇和推薦意見的提出方面存在一定的優勢。因此,我們對該指南進行了解讀,以期:① 加強對 KOA 手術治療的規范和理解;② 加強臨床工作者對本指南制訂方法學的理解,從而更好地結合推薦意見和證據指導臨床實踐;③ 加快指南制訂方法學在我國的傳播;④ 為制訂基于我國現狀的臨床實踐指南提供方法學指導。
引用本文: 邢丹, 陳耀龍, 王琪, 王小琴, 杜亮, 林劍浩. 《AAOS 手術治療膝骨關節炎臨床實踐指南》方法學解讀和推薦建議闡釋. 中國循證醫學雜志, 2018, 18(8): 793-801. doi: 10.7507/1672-2531.201802043 復制
1 解讀相關因素
1.1 解讀原因
美國骨科學會(American Academy of Orthopaedic Surgeons,AAOS)作為骨科領域國際頂尖學會組織近年來發布了一系列關于骨科疾病診治方面的臨床循證指南。在膝骨關節炎(knee osteoarthritis,KOA)領域,AAOS 先后發布了非手術治療 KOA 指南及本文解讀的手術治療 KOA 指南。雖然現有的指南制訂機構已經將循證醫學作為指南制訂的基本方法和證據來源,但是不同指南制訂機構在具體指南制訂方法的選擇方面存在差異。因此,有必要以《AAOS 手術治療膝骨關節炎臨床實踐指南》為例,對 AAOS 在指南制訂方法學層面的特點進行解讀,并對該指南的推薦意見進行簡要闡釋。
1.2 解讀者
由 KOA 專業臨床醫生、循證醫學方法學專家及指南制訂方法學專家組成的研究團隊對該指南進行解讀。
1.3 聯系原制訂者
本指南解讀過程中未與原制訂者聯系。一方面由于該指南的原文足夠詳實,另一方面由于語言互譯方面的難度。
1.4 指南解讀的利益沖突
參與指南解讀的人員不存在與原指南相關的學術或商業利益沖突。
2 背景
2.1 版本和年代
《AAOS 手術治療膝骨關節炎臨床實踐指南》是 AAOS 首次針對 KOA 手術治療制訂的臨床實踐指南。該指南從 2013 年初開始準備,全文發表于 2016 年 4 月,用時約 3 年。
2.2 來源
該指南全文[1]于 2016 年 4 月 20 日發表在 The Journal of Bone and Joint Surgery: American Volume上。指南的精簡版發表在 AAOS 會刊 The Journal of the American Academy of Orthopaedic Surgeons上。
2.3 制訂機構
該指南由包括 AAOS 在內的 8 家學會團體共同發起,包括 AAOS、北美關節鏡協會、美國放射醫學會、軍人骨科醫師協會、膝關節協會、美國老年病學會和美國麻醉學會。
由多家學術團體共同發起臨床循證指南制訂工作,可在一定程度上減少參與人員偏倚和利益沖突。同時,參加人員的多樣化,可為指南推薦意見的形成提供人群基礎,從而使該指南盡可能多地包括更多、更廣泛的臨床問題。例如,由于該指南中涉及到圍手術期管理、患者伴隨疾病、影像學評估等方面的臨床問題,因此邀請了來自美國老年病學會、美國麻醉學會、美國放射醫學會的專家參與指南制訂。這反應了臨床循證指南在制訂前需要根據擬確定的指南研究范圍和目的初步確定指南工作組人員的專業構成。
2.4 指南工作組的構成
AAOS 要求參與指南制訂的人員及家屬在啟動指南制訂工作前不存在利益沖突。指南工作組由兩個專家組構成:① 指南制訂小組由臨床醫生組成;② 循證醫學小組由方法學專家組成。
2.5 制訂背景
骨關節炎(osteoarthritis,OA)好發于中老年人。65 歲以上的人群中,有超過一半為 OA 患者[2]。無論是西方國家還是我國,KOA 的患病率都較高[3-5]。基于中國健康與養老追蹤調查數據庫(China Health and Retirement Longitudinal Study,CHARLS)的結果顯示,我國膝關節癥狀性 OA 的患病率為 8.1%,女性高于男性,且呈現明顯的地域差異[3]。在美國,OA 屬于第四大致殘性疾病[6]。隨著全球人口老齡化進程加快,KOA 發病率也呈上升趨勢[6, 7]。同時,KOA 疾病負擔較重,給社會造成了一定的經濟負擔[8]。目前 KOA 的治療方法很多,針對晚期患者最常采用且應用最為廣泛的治療方案為全膝關節置換術,此外還有關節鏡清理術[9, 10]。在美國,有 5% 的 KOA 患者最終會接受手術,2015 年的調研結果顯示,有 300 萬女性和 170 萬男性患者接受了全膝關節置換術[11]。但手術治療 KOA 目前在圍手術期、適應癥選擇、假體個體化選擇、術中管理等很多方面存在諸多爭議。同時,隨著手術技術、圍手術期管理水平的提高及機器人輔助技術的出現,手術治療 KOA 的實施過程中需要更多的臨床決策建議。因此有必要制訂臨床實踐指南進行規范化的建議與管理。
2.6 使用者及目標人群
指南使用者主要包括參與 KOA 治療的內科醫生和手術醫生,及臨床決策者、其他臨床實踐指南和推薦意見制訂者。指南原文中說明了,由于該指南的目的是提高當前干預措施的療效,麻醉師、風濕免疫科醫生、理療師、初級保健師、老年病學醫生、職業病專業醫生、急診科醫生等也可成為該指南的使用者。該指南作為 KOA 教育工具,強調在使用時不要將其視為一種固化的治療方法文案,而是要結合臨床情景做出臨床決策。該指南的目標人群是 18 歲以上診斷為 OA 的成年患者,不適用于兒科患者及炎癥性關節炎患者。可見,該指南充分描述了指南的使用者及目標人群。
2.7 使用環境
該指南規范的是 KOA 手術治療相關的圍手術期、術中及術后預后因素等相關領域的臨床問題,用于指導上述領域的臨床實踐。因此,該指南的使用環境包括了 KOA 手術相關的術前、術中和術后三個方面的臨床情景,在每部分臨床情景中有具體的使用環境,比如在術前階段有與術后預后相關的推薦意見,在術后階段有與術后康復相關的推薦意見。筆者認為,該指南的推薦意見針對的是 KOA 手術相關的內容,因此對于使用指南的醫療機構級別未做限定。
3 制訂方法
3.1 指南工作組的職責及臨床問題的確定
首先由指南制訂小組召開啟動會,確立指南和系統評價的研究范圍。在確立指南定義的臨床問題以后,通過定義 PICO 問題進一步明確和結構化指南要解決的臨床問題,以便于展開下一步的文獻檢索。循證醫學小組的工作是對檢索到的相關題目、摘要及全文進行評價和分析,提取并合成相關的數據,為定稿會的召開準備初稿。在完成系統評價以后,由指南制訂小組召開為期 3 天的推薦意見討論會。在討論會上,由臨床醫生和方法學家對整合的證據進行評價,并確定最終版的推薦意見。在定稿會上,對最終版的推薦意見和證據進行編輯、修改、撰寫及投票。最后,由方法學家再次確認定稿會上產生的推薦意見及證據,保證推薦意見與證據的一致性。
該指南兩個小組的工作既相對獨立又相互溝通的。從臨床專家的視角提出臨床問題并解構問題,之后從方法學家的視角檢索證據、評價證據及合成證據。最終由方法學家將推薦意見初稿提交給指南制訂小組進行推薦意見的討論。相對獨立的工作可避免臨床專家的主觀偏倚對推薦意見強度的影響,同時還可保證指南的最終目的是解決臨床問題。相互溝通的工作主要在推薦意見討論環節,可避免單純從方法學角度提出的意見脫離臨床實際。但是,在證據檢索和評價時,由于缺少臨床專家的參與有可能表現出機械化的工作特征,對于原始證據的生產機構或研究單位缺乏了解,甚至忽略了那些無法開展高質量研究設計的臨床證據。因此,筆者認為,在證據的檢索、評價和合成過程中,兩個小組需要有良好的溝通機制。比如:可邀請臨床專家對經過盲法處理過的研究進行評價和證據合成;可先根據臨床經驗提出初步的推薦強度再由方法學家公布基于文獻的推薦強度,之后針對不一致性進行討論等。
另外,該指南的臨床問題生成過程是基于臨床專家討論產生的,預示著指南未來的條目解決的是來自這些臨床專家共同關注的問題,但這樣做是否會遺漏其他被一線臨床工作者關注的問題尚不得而知。因此,筆者建議,在臨床問題產生階段可采取臨床專家討論與基于文獻產生兩種方式相結合的方法。這樣可能更好地涵蓋指南所要解決的全部臨床問題,且滿足指南制訂的目標。
3.2 證據收集
該指南的檢索年限從 1966 年至 2015 年 1 月 27 日,檢索 PubMed、EMbase、CINAHL 及 The Cochrane Central Register of Controlled Trials 數據庫并輔以手工檢索。時間跨度較長的目的是防止遺漏具有歷史意義的重要文獻。重點納入 2000 年以后較新的文獻,原因是隨著手術技術、材料、人工智能的發展、麻醉及輸血技術的進步,不斷有新證據產生,最終目的是可為現代的臨床實踐提供指導。在納入標準中,強調納入的僅僅是原始臨床研究,而排除了二次研究(系統評價和 Meta 分析)。但是需要對二次研究納入的臨床研究進行評價。該指南采用的排除標準較為嚴格。制訂如此苛刻的納入/排除標準,原因與其采用的方法學有關(最佳證據合成原理)。由于指南工作組要納入質量盡可能高的研究,因此期待通過嚴格的納入/排除標準排除無關文獻。
但是,筆者認為,該納入/排除標準可能排除了大樣本的回顧性研究,而大樣本回顧性研究可能會提供比小樣本前瞻性研究更多的臨床相關的有用信息。同時,系統評價與 Meta 分析被公認為高等級的證據。一項高質量的系統評價可能會提供比原始研究更多的有用信息。該指南雖然提取了二次研究中的原始研究,但是當前的納入/排除標準過高可能會排除原有納入的研究,從而可能改變原系統評價的結論。另外,證據檢索年限過于寬泛,這樣勢必會引入更多陳舊的文獻,雖然重點納入了 2000 年以后的文獻,但是過寬的檢索年限結合嚴格的納入標準,會導致相對陳舊的高質量文獻可能被直接引用作為證據。
3.3 分級方法
針對不同的原始研究類型,采用了不同的評價方法,包括針對預后研究、隨機對照試驗及觀察性研究。將研究的質量分為高、中、低、極低[12]。針對每個研究的每個結局指標整相關信息,然后選擇報道同一個結局指標的最佳證據質量的研究進行證據合成[13]。該指南只納入最佳證據質量的研究。指南小組首先納入最高質量等級的研究,而不首先考慮其報告的結局指標。如果最高質量等級的研究中缺省報告兩個或兩個以上結局指標,再考慮納入下一個質量等級的研究,直到納入的研究報道了兩個或兩個以上相關的結局指標。
值得注意的是,在該指南采用的方法中,最佳證據質量的概念針對的是原始研究的質量,而原始研究的質量高低并不代表其報告的某一結局證據質量的高低。如一篇低質量的前瞻性研究中報道了主觀結局指標和客觀結局指標,此時主觀結局指標的結果更容易受到原始研究方法學設計的影響。因此,根據單一研究的質量本身確定最佳證據質量的方法可能欠缺妥當。因指南關注的是數個研究共有結局指標的總體證據質量,而不是僅僅選擇高質量的研究進行證據合成。本指南的證據合成基礎是基于高質量研究展開的,但忽略了不同質量研究之間的權重問題。小樣本的高質量研究與大樣本的低質量研究之間需要通過方法學進行綜合,而不是通過類似多分類變量的方式進行分類匯總。總之,我們認為,原始研究的證據質量高低決定的僅僅是該研究本身的質量,并不能完全代表其某一結局指標質量的高低。
3.4 共識方法
該指南在對草擬的推薦意見和推薦強度進行討論時采用了共識的方法,即某一條推薦意見有超過 60% 的人員表決同意后通過。如果繼續存在爭議,需要進一步討論。該指南也涉及到證據間接性的問題:當針對某個 PICO 問題沒有證據或者無法根據 AAOS 的納入標準做出推薦意見時,指南制訂小組需要邀請其他相關學會的專家參與臨床問題的討論并做出共識。該指南針對草擬的推薦意見進行共識時僅進行了一次共識投票,但之后缺少針對不一致問題的多輪共識投票,僅通過討論的方式進行。
3.5 資助情況
該指南聲明在制訂過程中僅受到了 AAOS 的直接資助,而沒有接受來自其他商業機構的資助。
3.6 利益沖突
該指南的免責聲明中提到指南成文過程沒有受到 AAOS 以外的商業機構的資助。而且,同行評議階段的外審專家也需要簽署利益沖突聲明。
要求外審專家簽署利益沖突聲明是該指南的特色之一。在外審過程中,推薦意見及強度有可能受到外審專家主觀偏倚、學術觀點等影響,但更主要的是可能受到利益沖突的影響。因此,邀請未涉及利益沖突的專家進行外審可避免利益沖突對推薦條目最終發布的影響。
4 推薦意見及其相關內容
4.1 推薦意見概況
該指南共 38 條推薦意見,推薦意見強度分為強、中、弱。
4.2 推薦說明概況
在該指南中,如果最高質量等級的研究中缺省報告兩個或兩個以上結局指標,考慮納入下一質量等級的研究,直到納入的研究報道了兩個或兩個以上相關的結局指標,推薦意見強度總結表見表 1。

當兩組干預措施相比可獲得相當的結局時(無統計學差異),指南工作組同時推薦兩組干預措施。如果試驗組的干預措施與安慰劑或空白組相比可獲得相當的結局時(無統計學差異),指南工作組可能反對該干預措施,因該干預措施沒有給患者帶來額外的益處。
該指南制訂過程中,除了考慮統計學差異外還采用最小臨床改善率[14]作為評價療效的評價指標。因為最小臨床改善率更能夠體現干預措施之間有臨床意義的療效差別。而具有統計學差異的干預措施可能并沒有臨床意義。判斷單篇研究證據質量高低僅僅是判斷推薦意見強弱的依據之一。判斷推薦意見的強弱需要考慮最佳證據質量的高低、研究數量、利弊權衡、干預措施的效應量大小及是否是臨床關鍵的結局指標等。該指南推薦強度反應的是指南使用者做出推薦時的信心強弱和研究結論被未來研究所改變的可能性的高低。比如:大樣本量的隨機對照試驗結論很難被未來的研究改變,而小樣本的回顧性研究結論很容易被未來的研究改變。AAOS 依照最佳證據質量研究的數量和質量對推薦意見進行初步分級。為了避免草擬推薦意見時出現文字方面的歧義,AAOS 采用固定的推薦意見文字模板撰寫推薦意見。
該指南對于推薦強度的定義與 GRADE 方法相悖。本指南定義的推薦強度指未來研究改變現有研究結論的可能性和信心;GRADE 方法定義的推薦強度指推薦意見應用以后對獲益與風險之間的信心。而指南的最終目的是為臨床應用提供指導,因此更關注的是獲益大于風險的可能性和信心。所以,筆者認為 GRADE 方法定義的推薦強度更加貼近臨床實踐指南制訂的目的。
另外,干預措施的獲益與風險還要考慮患者價值觀、成本-效益比及醫療資源利用等因素。推薦意見的強弱也不應該僅僅考慮現有證據本身,因此,筆者認為該指南在推薦意見強度形成過程可能存在一定的方法學瑕疵。
4.3 推薦意見參考文獻
該指南正文中詳細列出了每條推薦意見涉及的全部參考文獻、文獻的質量等級、結局指標及最終納入指南的文獻和排除的文獻。
4.4 推薦意見內容
我們將該指南涉及的推薦意見和推薦強度按照研究領域分類如下(表 2)。

4.5 圖表
該指南正文中的原始研究證據質量評價結果及原始研究數據的展示通過圖表的方式進行呈現。
4.6 推薦意見外審
推薦意見的外審環節包括兩個部分:同行評議和公眾評議。參與同行評議的人員需要做出利益沖突聲明。由指南制訂小組首先確定參與同行評議的學會組織,再由該學會組織確定參與同行評議的具體人員。該指南選擇的學會組織是在該領域具有影響力的、除 AAOS 以外的 6 個學會組織。每位參加同行評議的人員均需要提交利益沖突聲明表,但針對推薦意見的反饋建議和意見由學會組織統一收集并整理至一張既定的外審表格中,最后提交給指南制訂小組。外審表格中針對指南外審評價的內容包括:指南的有效性、清晰程度及表達的準確性。指南制訂小組對推薦意見進行的任何修改,必須要基于循證醫學證據,且通過投票的方式進行表決。對推薦意見的修改,需要以文字形式進行備案,并作為文件附件進入下一輪的評議和授權過程。
這里提到的公眾評議,特指針對第三方的評議過程,包括了 AAOS 董事會成員、AAOS 研究與質量委員會成員及其他專業協會的成員。將經過同行評議修改后的推薦意見發給超過 200 名的上述人員進行公眾評議,收到評議回復后,針對反饋意見做出修改或討論。完成上述全部工作后,在獲得 AAOS 指南授權機構(包括:AASO 循證質控小組、AAOS 研究與質量委員會及 AASO 主席)的同意和授權后,正式公開發布。該指南在外審環節增加了公眾評議的環節,這也是該指南的方法學特色之一。增加包括 AASO 相關委員會會員及其他學會會員的公眾評議環節可進一步評價指南草案的可讀性和實用性,為后期大范圍和普適性的推廣傳播提供基礎。
4.7 指南更新
由于現行指南是根據現有循證醫學證據制訂的,隨著證據的不斷積累及新技術的提出,指南的內容需要更新。該指南工作組建議,每五年對該指南進行再次評價和更新。該指南常規報道了更新的計劃和時限,體現了指南與時俱進的特點。
4.8 指南傳播、實施及評價
在指南的實施過程中,為了增加推薦意見的可操作性和應用性,AAOS 提供了針對不同強度推薦意見及相應的解釋、是否需要決策輔助及未來研究對推薦意見內容影響的解釋。對這些內容的解釋有利于幫助指南的使用者針對不同推薦意見作出適合自身醫療環境的應用。該指南定義了指南的傳播計劃和途徑,即通過全文發表、多種期刊發表指南縮略版、手機 App、AAOS 年會、各種學術研討會、新聞媒體、繼續教育課程、廣播及國家指南文庫等方式進行傳播。
該指南報道了指南傳播與實施方面的計劃和途徑,反應了指南制訂者推廣指南的方法和決心。但指南工作組尚未針對該指南制訂合理的后效評價方案。筆者認為,定量或定性的后效評價是更新指南、加快指南傳播的重要方法和重要基礎。制訂切實可行的后效評價方案有助于未來指南的更新及推薦條目的增減,增加指南的可讀性和實踐性,為高效發揮指南的臨床實踐指導作用而服務。
4.9 優勢和局限性
在 AAOS 出版的系列指南中,遵循的理論基礎是最佳證據合成理論。指南制訂者認為,系統評價的方法可減少偏倚、提高納入研究、評價研究和證據合成過程的透明度,對于做出推薦意見是至關重要的。因此,該指南基于系統評價的方法按照既定的納入/排除標準檢索證據、納入證據、評價證據并合成證據,最后基于證據的質量作出推薦意見。該指南全文共計 661 頁,詳細闡述了指南制訂的背景、方法、推薦意見、證據來源與質量、推薦意見形成及確立的全過程。全文中附頁共計 162 頁,詳細闡述了指南小組的組成結構、利益沖突聲明、外審討論結果及其他背書文件。AAOS 指南制訂流程見圖 1。

在 AAOS 官網中可見該指南的全文版本,包括了每條推薦意見的強度及其論據,及納入原始研究的質量評價過程和證據合成過程等全部原始文件。全文中還包括:被排除的研究及原因、PICO 問題、檢索策略、基于推薦意見的討論內容及參與指南各個學會的簽字授權。雖然指南的正文詳細報道了指南的制訂過程及方法學內容,但是缺少指南計劃書的公開與授權發布。因此,雖然該指南的制訂過程和結果具有很好的透明性,但其缺少合理的事前公開可能會影響指南的公開性。另外,該指南中未涉及到患者意愿調查的內容。而患者意愿調查的目的是了解患者對于干預措施的偏好。例如,一項干預措施可獲得患者的強烈偏好且沒有增加不良事件發生的風險,此時我們不能忽略該干預措施可能發揮了很好的安慰劑效應,對主觀結局指標的改善具有積極的臨床意義,我們認為針對此干預措施作出強推薦的決定也未嘗不可。
5 對我國臨床實踐和指南制訂的意義
5.1 對臨床實踐的意義
KOA 手術治療的發展速度很快,隨著人工智能、精準醫學、個性化醫療、材料科學、麻醉技術、康復技術及輸血技術的快速發展,相關循證醫學證據也在不斷積累和更新。如何將錯綜復雜的證據轉化為臨床實踐指南建議是臨床工作者和方法學家的共同工作。因此,在 KOA 手術治療中需要一部規范化的臨床實踐指南提供指導。該指南在臨床應用領域彌補了上述空白,具有一定的臨床實踐意義。
5.2 對指南制訂的意義
充分解讀該指南的方法學可為未來基于我國臨床證據制訂屬于我國的臨床實踐指南提供方法學基礎;通過指南的解讀可更好認識一部指南的方法學優勢與不足,并在未來指南制訂工作充分發揮現有的方法學優勢,盡可能避免局限性。
5.3 對臨床研究的意義
該指南在推薦意見產生過程中同時指出了未來 KOA 手術研究的方向和領域,為未來的臨床研究指明了方向。
6 AAOS 與 WHO 臨床實踐指南制訂方法對比
目前,在全球有多個制訂臨床循證指南的機構或者組織,包括世界衛生組織(WHO)、英國國家衛生和臨床技術優化研究所(NICE)及加拿大渥太華指南制訂機構(Ottawa)等。在臨床實踐指南的制訂方法方面,AAOS 與 WHO 或 NICE 指南存在一定差別。現以 WHO 指南制訂方法[15]為例,對比 AAOS 和 WHO 在指南制定主要方法學步驟方面的差異(表 3)。

7 局限性
本研究對《AAOS 手術治療膝骨關節炎臨床實踐指南》的方法學內容進行了重點解釋和分析,不僅解讀了該指南方法學內容的描述,而且對主要的方法學步驟進行了評述。由于目前針對臨床實踐指南的專業解讀文章較少,所以本文對于解讀的報告內容和方法缺少公認的方法學支持,因此可能在解讀指南的過程中針對某些環節存在疏漏。筆者認為,隨著國內外臨床實踐指南發表數量的增多,指南的解讀類文章數量勢必隨之增加,因此需要制訂標準化的指南解讀規范為研究者提供指導。
1 解讀相關因素
1.1 解讀原因
美國骨科學會(American Academy of Orthopaedic Surgeons,AAOS)作為骨科領域國際頂尖學會組織近年來發布了一系列關于骨科疾病診治方面的臨床循證指南。在膝骨關節炎(knee osteoarthritis,KOA)領域,AAOS 先后發布了非手術治療 KOA 指南及本文解讀的手術治療 KOA 指南。雖然現有的指南制訂機構已經將循證醫學作為指南制訂的基本方法和證據來源,但是不同指南制訂機構在具體指南制訂方法的選擇方面存在差異。因此,有必要以《AAOS 手術治療膝骨關節炎臨床實踐指南》為例,對 AAOS 在指南制訂方法學層面的特點進行解讀,并對該指南的推薦意見進行簡要闡釋。
1.2 解讀者
由 KOA 專業臨床醫生、循證醫學方法學專家及指南制訂方法學專家組成的研究團隊對該指南進行解讀。
1.3 聯系原制訂者
本指南解讀過程中未與原制訂者聯系。一方面由于該指南的原文足夠詳實,另一方面由于語言互譯方面的難度。
1.4 指南解讀的利益沖突
參與指南解讀的人員不存在與原指南相關的學術或商業利益沖突。
2 背景
2.1 版本和年代
《AAOS 手術治療膝骨關節炎臨床實踐指南》是 AAOS 首次針對 KOA 手術治療制訂的臨床實踐指南。該指南從 2013 年初開始準備,全文發表于 2016 年 4 月,用時約 3 年。
2.2 來源
該指南全文[1]于 2016 年 4 月 20 日發表在 The Journal of Bone and Joint Surgery: American Volume上。指南的精簡版發表在 AAOS 會刊 The Journal of the American Academy of Orthopaedic Surgeons上。
2.3 制訂機構
該指南由包括 AAOS 在內的 8 家學會團體共同發起,包括 AAOS、北美關節鏡協會、美國放射醫學會、軍人骨科醫師協會、膝關節協會、美國老年病學會和美國麻醉學會。
由多家學術團體共同發起臨床循證指南制訂工作,可在一定程度上減少參與人員偏倚和利益沖突。同時,參加人員的多樣化,可為指南推薦意見的形成提供人群基礎,從而使該指南盡可能多地包括更多、更廣泛的臨床問題。例如,由于該指南中涉及到圍手術期管理、患者伴隨疾病、影像學評估等方面的臨床問題,因此邀請了來自美國老年病學會、美國麻醉學會、美國放射醫學會的專家參與指南制訂。這反應了臨床循證指南在制訂前需要根據擬確定的指南研究范圍和目的初步確定指南工作組人員的專業構成。
2.4 指南工作組的構成
AAOS 要求參與指南制訂的人員及家屬在啟動指南制訂工作前不存在利益沖突。指南工作組由兩個專家組構成:① 指南制訂小組由臨床醫生組成;② 循證醫學小組由方法學專家組成。
2.5 制訂背景
骨關節炎(osteoarthritis,OA)好發于中老年人。65 歲以上的人群中,有超過一半為 OA 患者[2]。無論是西方國家還是我國,KOA 的患病率都較高[3-5]。基于中國健康與養老追蹤調查數據庫(China Health and Retirement Longitudinal Study,CHARLS)的結果顯示,我國膝關節癥狀性 OA 的患病率為 8.1%,女性高于男性,且呈現明顯的地域差異[3]。在美國,OA 屬于第四大致殘性疾病[6]。隨著全球人口老齡化進程加快,KOA 發病率也呈上升趨勢[6, 7]。同時,KOA 疾病負擔較重,給社會造成了一定的經濟負擔[8]。目前 KOA 的治療方法很多,針對晚期患者最常采用且應用最為廣泛的治療方案為全膝關節置換術,此外還有關節鏡清理術[9, 10]。在美國,有 5% 的 KOA 患者最終會接受手術,2015 年的調研結果顯示,有 300 萬女性和 170 萬男性患者接受了全膝關節置換術[11]。但手術治療 KOA 目前在圍手術期、適應癥選擇、假體個體化選擇、術中管理等很多方面存在諸多爭議。同時,隨著手術技術、圍手術期管理水平的提高及機器人輔助技術的出現,手術治療 KOA 的實施過程中需要更多的臨床決策建議。因此有必要制訂臨床實踐指南進行規范化的建議與管理。
2.6 使用者及目標人群
指南使用者主要包括參與 KOA 治療的內科醫生和手術醫生,及臨床決策者、其他臨床實踐指南和推薦意見制訂者。指南原文中說明了,由于該指南的目的是提高當前干預措施的療效,麻醉師、風濕免疫科醫生、理療師、初級保健師、老年病學醫生、職業病專業醫生、急診科醫生等也可成為該指南的使用者。該指南作為 KOA 教育工具,強調在使用時不要將其視為一種固化的治療方法文案,而是要結合臨床情景做出臨床決策。該指南的目標人群是 18 歲以上診斷為 OA 的成年患者,不適用于兒科患者及炎癥性關節炎患者。可見,該指南充分描述了指南的使用者及目標人群。
2.7 使用環境
該指南規范的是 KOA 手術治療相關的圍手術期、術中及術后預后因素等相關領域的臨床問題,用于指導上述領域的臨床實踐。因此,該指南的使用環境包括了 KOA 手術相關的術前、術中和術后三個方面的臨床情景,在每部分臨床情景中有具體的使用環境,比如在術前階段有與術后預后相關的推薦意見,在術后階段有與術后康復相關的推薦意見。筆者認為,該指南的推薦意見針對的是 KOA 手術相關的內容,因此對于使用指南的醫療機構級別未做限定。
3 制訂方法
3.1 指南工作組的職責及臨床問題的確定
首先由指南制訂小組召開啟動會,確立指南和系統評價的研究范圍。在確立指南定義的臨床問題以后,通過定義 PICO 問題進一步明確和結構化指南要解決的臨床問題,以便于展開下一步的文獻檢索。循證醫學小組的工作是對檢索到的相關題目、摘要及全文進行評價和分析,提取并合成相關的數據,為定稿會的召開準備初稿。在完成系統評價以后,由指南制訂小組召開為期 3 天的推薦意見討論會。在討論會上,由臨床醫生和方法學家對整合的證據進行評價,并確定最終版的推薦意見。在定稿會上,對最終版的推薦意見和證據進行編輯、修改、撰寫及投票。最后,由方法學家再次確認定稿會上產生的推薦意見及證據,保證推薦意見與證據的一致性。
該指南兩個小組的工作既相對獨立又相互溝通的。從臨床專家的視角提出臨床問題并解構問題,之后從方法學家的視角檢索證據、評價證據及合成證據。最終由方法學家將推薦意見初稿提交給指南制訂小組進行推薦意見的討論。相對獨立的工作可避免臨床專家的主觀偏倚對推薦意見強度的影響,同時還可保證指南的最終目的是解決臨床問題。相互溝通的工作主要在推薦意見討論環節,可避免單純從方法學角度提出的意見脫離臨床實際。但是,在證據檢索和評價時,由于缺少臨床專家的參與有可能表現出機械化的工作特征,對于原始證據的生產機構或研究單位缺乏了解,甚至忽略了那些無法開展高質量研究設計的臨床證據。因此,筆者認為,在證據的檢索、評價和合成過程中,兩個小組需要有良好的溝通機制。比如:可邀請臨床專家對經過盲法處理過的研究進行評價和證據合成;可先根據臨床經驗提出初步的推薦強度再由方法學家公布基于文獻的推薦強度,之后針對不一致性進行討論等。
另外,該指南的臨床問題生成過程是基于臨床專家討論產生的,預示著指南未來的條目解決的是來自這些臨床專家共同關注的問題,但這樣做是否會遺漏其他被一線臨床工作者關注的問題尚不得而知。因此,筆者建議,在臨床問題產生階段可采取臨床專家討論與基于文獻產生兩種方式相結合的方法。這樣可能更好地涵蓋指南所要解決的全部臨床問題,且滿足指南制訂的目標。
3.2 證據收集
該指南的檢索年限從 1966 年至 2015 年 1 月 27 日,檢索 PubMed、EMbase、CINAHL 及 The Cochrane Central Register of Controlled Trials 數據庫并輔以手工檢索。時間跨度較長的目的是防止遺漏具有歷史意義的重要文獻。重點納入 2000 年以后較新的文獻,原因是隨著手術技術、材料、人工智能的發展、麻醉及輸血技術的進步,不斷有新證據產生,最終目的是可為現代的臨床實踐提供指導。在納入標準中,強調納入的僅僅是原始臨床研究,而排除了二次研究(系統評價和 Meta 分析)。但是需要對二次研究納入的臨床研究進行評價。該指南采用的排除標準較為嚴格。制訂如此苛刻的納入/排除標準,原因與其采用的方法學有關(最佳證據合成原理)。由于指南工作組要納入質量盡可能高的研究,因此期待通過嚴格的納入/排除標準排除無關文獻。
但是,筆者認為,該納入/排除標準可能排除了大樣本的回顧性研究,而大樣本回顧性研究可能會提供比小樣本前瞻性研究更多的臨床相關的有用信息。同時,系統評價與 Meta 分析被公認為高等級的證據。一項高質量的系統評價可能會提供比原始研究更多的有用信息。該指南雖然提取了二次研究中的原始研究,但是當前的納入/排除標準過高可能會排除原有納入的研究,從而可能改變原系統評價的結論。另外,證據檢索年限過于寬泛,這樣勢必會引入更多陳舊的文獻,雖然重點納入了 2000 年以后的文獻,但是過寬的檢索年限結合嚴格的納入標準,會導致相對陳舊的高質量文獻可能被直接引用作為證據。
3.3 分級方法
針對不同的原始研究類型,采用了不同的評價方法,包括針對預后研究、隨機對照試驗及觀察性研究。將研究的質量分為高、中、低、極低[12]。針對每個研究的每個結局指標整相關信息,然后選擇報道同一個結局指標的最佳證據質量的研究進行證據合成[13]。該指南只納入最佳證據質量的研究。指南小組首先納入最高質量等級的研究,而不首先考慮其報告的結局指標。如果最高質量等級的研究中缺省報告兩個或兩個以上結局指標,再考慮納入下一個質量等級的研究,直到納入的研究報道了兩個或兩個以上相關的結局指標。
值得注意的是,在該指南采用的方法中,最佳證據質量的概念針對的是原始研究的質量,而原始研究的質量高低并不代表其報告的某一結局證據質量的高低。如一篇低質量的前瞻性研究中報道了主觀結局指標和客觀結局指標,此時主觀結局指標的結果更容易受到原始研究方法學設計的影響。因此,根據單一研究的質量本身確定最佳證據質量的方法可能欠缺妥當。因指南關注的是數個研究共有結局指標的總體證據質量,而不是僅僅選擇高質量的研究進行證據合成。本指南的證據合成基礎是基于高質量研究展開的,但忽略了不同質量研究之間的權重問題。小樣本的高質量研究與大樣本的低質量研究之間需要通過方法學進行綜合,而不是通過類似多分類變量的方式進行分類匯總。總之,我們認為,原始研究的證據質量高低決定的僅僅是該研究本身的質量,并不能完全代表其某一結局指標質量的高低。
3.4 共識方法
該指南在對草擬的推薦意見和推薦強度進行討論時采用了共識的方法,即某一條推薦意見有超過 60% 的人員表決同意后通過。如果繼續存在爭議,需要進一步討論。該指南也涉及到證據間接性的問題:當針對某個 PICO 問題沒有證據或者無法根據 AAOS 的納入標準做出推薦意見時,指南制訂小組需要邀請其他相關學會的專家參與臨床問題的討論并做出共識。該指南針對草擬的推薦意見進行共識時僅進行了一次共識投票,但之后缺少針對不一致問題的多輪共識投票,僅通過討論的方式進行。
3.5 資助情況
該指南聲明在制訂過程中僅受到了 AAOS 的直接資助,而沒有接受來自其他商業機構的資助。
3.6 利益沖突
該指南的免責聲明中提到指南成文過程沒有受到 AAOS 以外的商業機構的資助。而且,同行評議階段的外審專家也需要簽署利益沖突聲明。
要求外審專家簽署利益沖突聲明是該指南的特色之一。在外審過程中,推薦意見及強度有可能受到外審專家主觀偏倚、學術觀點等影響,但更主要的是可能受到利益沖突的影響。因此,邀請未涉及利益沖突的專家進行外審可避免利益沖突對推薦條目最終發布的影響。
4 推薦意見及其相關內容
4.1 推薦意見概況
該指南共 38 條推薦意見,推薦意見強度分為強、中、弱。
4.2 推薦說明概況
在該指南中,如果最高質量等級的研究中缺省報告兩個或兩個以上結局指標,考慮納入下一質量等級的研究,直到納入的研究報道了兩個或兩個以上相關的結局指標,推薦意見強度總結表見表 1。

當兩組干預措施相比可獲得相當的結局時(無統計學差異),指南工作組同時推薦兩組干預措施。如果試驗組的干預措施與安慰劑或空白組相比可獲得相當的結局時(無統計學差異),指南工作組可能反對該干預措施,因該干預措施沒有給患者帶來額外的益處。
該指南制訂過程中,除了考慮統計學差異外還采用最小臨床改善率[14]作為評價療效的評價指標。因為最小臨床改善率更能夠體現干預措施之間有臨床意義的療效差別。而具有統計學差異的干預措施可能并沒有臨床意義。判斷單篇研究證據質量高低僅僅是判斷推薦意見強弱的依據之一。判斷推薦意見的強弱需要考慮最佳證據質量的高低、研究數量、利弊權衡、干預措施的效應量大小及是否是臨床關鍵的結局指標等。該指南推薦強度反應的是指南使用者做出推薦時的信心強弱和研究結論被未來研究所改變的可能性的高低。比如:大樣本量的隨機對照試驗結論很難被未來的研究改變,而小樣本的回顧性研究結論很容易被未來的研究改變。AAOS 依照最佳證據質量研究的數量和質量對推薦意見進行初步分級。為了避免草擬推薦意見時出現文字方面的歧義,AAOS 采用固定的推薦意見文字模板撰寫推薦意見。
該指南對于推薦強度的定義與 GRADE 方法相悖。本指南定義的推薦強度指未來研究改變現有研究結論的可能性和信心;GRADE 方法定義的推薦強度指推薦意見應用以后對獲益與風險之間的信心。而指南的最終目的是為臨床應用提供指導,因此更關注的是獲益大于風險的可能性和信心。所以,筆者認為 GRADE 方法定義的推薦強度更加貼近臨床實踐指南制訂的目的。
另外,干預措施的獲益與風險還要考慮患者價值觀、成本-效益比及醫療資源利用等因素。推薦意見的強弱也不應該僅僅考慮現有證據本身,因此,筆者認為該指南在推薦意見強度形成過程可能存在一定的方法學瑕疵。
4.3 推薦意見參考文獻
該指南正文中詳細列出了每條推薦意見涉及的全部參考文獻、文獻的質量等級、結局指標及最終納入指南的文獻和排除的文獻。
4.4 推薦意見內容
我們將該指南涉及的推薦意見和推薦強度按照研究領域分類如下(表 2)。

4.5 圖表
該指南正文中的原始研究證據質量評價結果及原始研究數據的展示通過圖表的方式進行呈現。
4.6 推薦意見外審
推薦意見的外審環節包括兩個部分:同行評議和公眾評議。參與同行評議的人員需要做出利益沖突聲明。由指南制訂小組首先確定參與同行評議的學會組織,再由該學會組織確定參與同行評議的具體人員。該指南選擇的學會組織是在該領域具有影響力的、除 AAOS 以外的 6 個學會組織。每位參加同行評議的人員均需要提交利益沖突聲明表,但針對推薦意見的反饋建議和意見由學會組織統一收集并整理至一張既定的外審表格中,最后提交給指南制訂小組。外審表格中針對指南外審評價的內容包括:指南的有效性、清晰程度及表達的準確性。指南制訂小組對推薦意見進行的任何修改,必須要基于循證醫學證據,且通過投票的方式進行表決。對推薦意見的修改,需要以文字形式進行備案,并作為文件附件進入下一輪的評議和授權過程。
這里提到的公眾評議,特指針對第三方的評議過程,包括了 AAOS 董事會成員、AAOS 研究與質量委員會成員及其他專業協會的成員。將經過同行評議修改后的推薦意見發給超過 200 名的上述人員進行公眾評議,收到評議回復后,針對反饋意見做出修改或討論。完成上述全部工作后,在獲得 AAOS 指南授權機構(包括:AASO 循證質控小組、AAOS 研究與質量委員會及 AASO 主席)的同意和授權后,正式公開發布。該指南在外審環節增加了公眾評議的環節,這也是該指南的方法學特色之一。增加包括 AASO 相關委員會會員及其他學會會員的公眾評議環節可進一步評價指南草案的可讀性和實用性,為后期大范圍和普適性的推廣傳播提供基礎。
4.7 指南更新
由于現行指南是根據現有循證醫學證據制訂的,隨著證據的不斷積累及新技術的提出,指南的內容需要更新。該指南工作組建議,每五年對該指南進行再次評價和更新。該指南常規報道了更新的計劃和時限,體現了指南與時俱進的特點。
4.8 指南傳播、實施及評價
在指南的實施過程中,為了增加推薦意見的可操作性和應用性,AAOS 提供了針對不同強度推薦意見及相應的解釋、是否需要決策輔助及未來研究對推薦意見內容影響的解釋。對這些內容的解釋有利于幫助指南的使用者針對不同推薦意見作出適合自身醫療環境的應用。該指南定義了指南的傳播計劃和途徑,即通過全文發表、多種期刊發表指南縮略版、手機 App、AAOS 年會、各種學術研討會、新聞媒體、繼續教育課程、廣播及國家指南文庫等方式進行傳播。
該指南報道了指南傳播與實施方面的計劃和途徑,反應了指南制訂者推廣指南的方法和決心。但指南工作組尚未針對該指南制訂合理的后效評價方案。筆者認為,定量或定性的后效評價是更新指南、加快指南傳播的重要方法和重要基礎。制訂切實可行的后效評價方案有助于未來指南的更新及推薦條目的增減,增加指南的可讀性和實踐性,為高效發揮指南的臨床實踐指導作用而服務。
4.9 優勢和局限性
在 AAOS 出版的系列指南中,遵循的理論基礎是最佳證據合成理論。指南制訂者認為,系統評價的方法可減少偏倚、提高納入研究、評價研究和證據合成過程的透明度,對于做出推薦意見是至關重要的。因此,該指南基于系統評價的方法按照既定的納入/排除標準檢索證據、納入證據、評價證據并合成證據,最后基于證據的質量作出推薦意見。該指南全文共計 661 頁,詳細闡述了指南制訂的背景、方法、推薦意見、證據來源與質量、推薦意見形成及確立的全過程。全文中附頁共計 162 頁,詳細闡述了指南小組的組成結構、利益沖突聲明、外審討論結果及其他背書文件。AAOS 指南制訂流程見圖 1。

在 AAOS 官網中可見該指南的全文版本,包括了每條推薦意見的強度及其論據,及納入原始研究的質量評價過程和證據合成過程等全部原始文件。全文中還包括:被排除的研究及原因、PICO 問題、檢索策略、基于推薦意見的討論內容及參與指南各個學會的簽字授權。雖然指南的正文詳細報道了指南的制訂過程及方法學內容,但是缺少指南計劃書的公開與授權發布。因此,雖然該指南的制訂過程和結果具有很好的透明性,但其缺少合理的事前公開可能會影響指南的公開性。另外,該指南中未涉及到患者意愿調查的內容。而患者意愿調查的目的是了解患者對于干預措施的偏好。例如,一項干預措施可獲得患者的強烈偏好且沒有增加不良事件發生的風險,此時我們不能忽略該干預措施可能發揮了很好的安慰劑效應,對主觀結局指標的改善具有積極的臨床意義,我們認為針對此干預措施作出強推薦的決定也未嘗不可。
5 對我國臨床實踐和指南制訂的意義
5.1 對臨床實踐的意義
KOA 手術治療的發展速度很快,隨著人工智能、精準醫學、個性化醫療、材料科學、麻醉技術、康復技術及輸血技術的快速發展,相關循證醫學證據也在不斷積累和更新。如何將錯綜復雜的證據轉化為臨床實踐指南建議是臨床工作者和方法學家的共同工作。因此,在 KOA 手術治療中需要一部規范化的臨床實踐指南提供指導。該指南在臨床應用領域彌補了上述空白,具有一定的臨床實踐意義。
5.2 對指南制訂的意義
充分解讀該指南的方法學可為未來基于我國臨床證據制訂屬于我國的臨床實踐指南提供方法學基礎;通過指南的解讀可更好認識一部指南的方法學優勢與不足,并在未來指南制訂工作充分發揮現有的方法學優勢,盡可能避免局限性。
5.3 對臨床研究的意義
該指南在推薦意見產生過程中同時指出了未來 KOA 手術研究的方向和領域,為未來的臨床研究指明了方向。
6 AAOS 與 WHO 臨床實踐指南制訂方法對比
目前,在全球有多個制訂臨床循證指南的機構或者組織,包括世界衛生組織(WHO)、英國國家衛生和臨床技術優化研究所(NICE)及加拿大渥太華指南制訂機構(Ottawa)等。在臨床實踐指南的制訂方法方面,AAOS 與 WHO 或 NICE 指南存在一定差別。現以 WHO 指南制訂方法[15]為例,對比 AAOS 和 WHO 在指南制定主要方法學步驟方面的差異(表 3)。

7 局限性
本研究對《AAOS 手術治療膝骨關節炎臨床實踐指南》的方法學內容進行了重點解釋和分析,不僅解讀了該指南方法學內容的描述,而且對主要的方法學步驟進行了評述。由于目前針對臨床實踐指南的專業解讀文章較少,所以本文對于解讀的報告內容和方法缺少公認的方法學支持,因此可能在解讀指南的過程中針對某些環節存在疏漏。筆者認為,隨著國內外臨床實踐指南發表數量的增多,指南的解讀類文章數量勢必隨之增加,因此需要制訂標準化的指南解讀規范為研究者提供指導。