引用本文: 劉甜甜, 鐘偉華, 陸夢潔, 陳羽, 周憧憧, 聞浩, 劉玉秀. 2014~2016 年中國 Bland-Altman 方法一致性評價的報告質量研究. 中國循證醫學雜志, 2018, 18(1): 67-73. doi: 10.7507/1672-2531.201709019 復制
要使兩種不同方法對同一試驗對象的測量結果完全一致是幾乎不可能的,兩種方法的測量結果存在一定趨勢性的差異,其中一種方法的測量結果總大于(或小于)另一種方法的測量結果,這種差異我們稱之為系統誤差,也稱為偏倚(bias)[1]。除了系統誤差,測量結果還必然存在隨機誤差,理論上,只要兩種方法測量結果間的誤差在臨床可接受范圍內,我們就可認為兩種方法具有一致性或互換性。在 Bland-Altman 方法提出之前,定量測量方法的比較研究常用配對 t 檢驗、相關系數和回歸分析來評價兩種方法一致性,Altman 和 Bland[2]指出了這些方法的不恰當性,并提出了一種通過圖示和定量結果評價一致性的方法,即 Bland-Altman 方法。此后,Bland 和 Altman 又對該方法進行了詳細的闡述和擴展。Bland-Altman 方法的基本思想是先計算兩種方法對同一批個體的測量結果的偏倚(
)及標準差(SD),然后計算一致限(LoA,95%LoA=
±1.96SD),并結合差值-均數圖進行一致性評價。但不管是差值均數,或是差值的 95%LoA,都只是基于樣本統計量,不可直接用于對總體進行統計推斷。要正確評價兩種方法的一致性,必須考慮抽樣誤差造成的影響。因此,為推斷兩種方法在總體上的一致性,應分別估計 95%LoA 的上限和下限的 95% 可信區間(CI)。如果兩種方法的 95%LoA 的 95%CI 結果在事先給定的、臨床上可接受的誤差范圍內,則可得出兩種測量方法具有一致性或互換性。該方法一經提出,便得到了國際上的廣泛認可。但該方法因未能被全面或正確理解,故其在研究應用和報告規范上存在很多問題[3-7]。國外從 2000 年開始就有學者對此進行了針對性調查[8],結果表明該方法在應用上存在嚴重的不規范,錯誤使用的現象屢見不鮮。隨著 Bland-Altman 方法被引入國內,目前醫藥衛生領域已有多篇 Bland-Altman 方法的應用文獻發表,但目前國內尚無對 Bland-Altman 方法應用現狀的評價。本文針對國內 Bland-Altman 方法一致性評價應用報告的現狀進行了調查分析,評價了 Bland-Altman 方法在國內應用過程中存在的問題,以期為建立 Bland-Altman 方法的報告規范和促進我國研究者 Bland-Altman 方法的正確應用提供參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
采用 Bland-Altman 方法進行了一致性評價的文獻,所屬領域為醫藥衛生領域。
1.1.2 排除標準
① 方法學文獻,如介紹 Bland-Altman 方法的文章;② 非中國學者完成的文獻;③ 未報告任何一致性評價結果(圖形、數值)的文獻。
1.2 文獻檢索策略
計算機檢索 WanFang Data、VIP 和 CNKI 數據庫,搜集 Bland-Altman 方法在醫藥衛生領域進行了一致性評價的文獻,檢索時限為 2014 年 1 月 1 日~2016 年 12 月 31 日。檢索詞包括 Bland-Altman、Bland Altman、bland altman 和 bland-altman。以 CNKI 為例,其具體檢索策略見框 1。

1.3 文獻篩選與資料提取
文獻檢索完成后,組建課題小組,對全文進行閱讀,并對其他 Bland-Altman 方法類文獻進行細讀,增加對該方法的認識和理解,之后通過小組討論等擬定“Bland-Altman 方法一致性評價應用數據摘錄表”。該摘錄表共有 6 個模塊 54 個條目,包括基本內容、方法應用摘要、方法具體內容、結果具體內容、討論事項及其他事項等。對文獻進行全面、詳細地摘錄,摘錄過程分為兩個階段:① 紙質摘錄階段,由 1 名摘錄者和 1 名核對者依據摘錄表對所下載文獻進行逐篇摘錄及核對(kappa 值=0.801),分別在摘錄表上簽署姓名和時間,由第三名研究者進行抽查、復核,以保證摘錄質量;② 電子錄入階段,由專業數據錄入人員利用 Epidata 3.1 軟件進行雙份錄入及核查以保證數據錄入的準確性并建立統計分析數據庫。
1.4 統計分析
采用 SPSS 22.0 軟件進行統計分析,納入文獻的基本情況采用百分比指標進行描述性分析。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻 878 篇,經逐層篩選,最終納入文獻 376 篇。2014 年、2015 年和 2016 年發文量分別為 110、140 和 126 篇。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:CNKI(
2.2 納入文獻的發表分布情況
對雜志發表和按“中圖分類號”進行學科分類整理的結果顯示,該方法在眼科、放射和檢驗醫學領域應用較多,見表 1、表 2。部分跨學科文獻發表在非醫學類雜志上,由此也反映出 Bland-Altman 方法的應用所跨領域廣、涉及學科多。


2.3 綜合評價結果
2.3.1 概要模塊
在 Bland-Altman 方法應用文獻中,需要在題目及摘要中體現 Bland-Altman 方法或包含一致性評價等相關字眼。本研究結果顯示,標題出現 Bland-Altman 的文獻僅 6 篇(1.6%),關鍵詞給出或含有 Bland-Altman 的文獻僅 14 篇(3.7%),見表 3。

2.3.2 其他一致性評價方法的使用
除 Bland-Altman 方法外,許多研究者也會同時使用其他方法作為評價定量數據測量結果一致性的標準或參考。對納入文獻進行整理分析發現:除 Bland-Altman 方法外,還涉及到簡單相關(simple correlation,r)、配對 t 檢驗(paired matched t-test)、組內相關系數(intraclass correlation coefficient,ICC)、回歸分析(regression analysis)、Kappa 一致性系數(Kappa coefficient of agreement,k)以及一致性相關系數(concordance correlation coefficient,CCC)等方法,見表 4。這些方法作為一致性評價的共用方法,性能各異,可作為相關參考,但其中一些方法若作為主要評價方法,則可能導致不合理的結論。國外已有研究提示一致性評價時采用簡單相關系數、CCC、ICC、回歸分析、配對 t 檢驗等方法的缺點與問題,并采用模擬方法分析了可能導致的不合理結論,有損一致性評價的證據,甚至對患者的醫療決策帶來嚴重后果[9, 10]。

2.3.3 報告規范性
在 Bland-Altman 方法一致性評價應用的文獻中,方法介紹部分應包括納入/排除標準、樣本量估計方法、隨機化方法、數據行為判定、LoA 及其 95%CI 和 Bland-Altman 圖等的介紹[11-15]。本研究結果顯示,介紹了納入/排除標準的文獻有 127 篇(33.8%),介紹樣本量估計方法及隨機化方法的文獻分別有 12 篇(3.2%)和 19 篇(5.1%)。在文獻的統計處理部分,本應對所使用的數據處理及分析方法進行詳細介紹,但在納入文獻中,僅有 101 篇(26.9%)對 Bland-Altman 圖示法進行了介紹,僅有 25 篇(6.6%)對 95%LoA 的計算方法加以描述,全部文獻均未給出 95%LoA 的 95%CI 的計算方法,事先設定一致性界值的文獻也僅有 43 篇(11.4%),結果見圖 2。
任何方法在使用之前,都應該對其應用條件加以判斷。Bland-Altman 方法在應用之前,需要對數據行為進行判定,即當數據行為良好時,直接采用標準的 Bland-Altman 方法分析即可;當數據行為不良時,則需要進行相應的數據處理,如可對數據進行轉換,將兩種方法結果比值、對數差值或差值的百分比值作為縱軸,考察是否達到良好的數據行為;若仍無法滿足,則需考慮采用其他的一致性評價方法。在特殊情形下,如兩測量結果差值存在比例偏倚且方差不齊時,除可采用數據轉換考察數據行為外,還可構造“V”形的 LoA 進行一致性評價[16, 17]。在納入的 376 篇文獻中提及數據行為判定方法的很少,介紹正態性判定方法的文獻有 33 篇(8.8%),其次為比例偏倚判定方法介紹 8 篇(2.1%),而提及方差齊性判定方法介紹最少,僅有 6 篇(1.6%),結果見圖 2。

2.3.4 繪圖質量
Bland-Altman 圖作為一致性評價的重要參考,圖形繪制的質量尤為重要,需嚴格按照要求畫出必要的參考線,并給出明確的圖例。標準 Bland-Altman 圖的 X 軸應為兩測量結果均數,當兩種測量方法中的其中一種被認為是臨床認可的參照方法或金標準時,也可用該方法的測量值直接作為 X 軸;Y 軸應為兩測量結果差值、對數轉換后的差值或原始結果的比值、原始結果差值與兩者平均值的百分比值等。Bland-Altman 圖中的參考線有兩測量結果差值、差值的 95%CI、差值的 95%LoA 及差值的 95%LoA 的 95%CI。通過圖形展示,可更加直觀地了解一致性情況,便于對一致性評價做出初步判斷。納入文獻中,有 296 篇(78.7%)提供了 Bland-Altman 圖,其中 275 篇(92.9%)Bland-Altman 圖的 X 軸采用了兩測量結果均數指標,282 篇(95.3%)Y 軸采用了兩測量結果差值,而畫出差值 95%LoA 橫線的圖形有 95.9%,但畫出了兩測量結果差值的 95%LoA 的 95%CI 橫線的僅有 13 篇(4.4%)。圖形的不規范、不標準也直接導致了 Bland-Altman 方法應用文獻的報告質量下降。

2.3.5 數值結果
在 Bland-Altman 方法的應用文獻中,結果部分不僅需要給出圖形化結果,更需要給出數值化結果,包括數據行為判定結果以及評價指標的數值結果。對納入文獻進行整理分析發現:數據行為判定結果缺失嚴重,特別是比例偏倚判定,僅有 2 篇(0.5%)給出了判定結果。而一致性評價指標的數值結果也不盡人意,僅有 2.7% 的文獻提供了兩測量結果平均差值 95%LoA 的 95%CI,這對一致性評價的總體推斷帶來困難,結果見表 6。

2.3.6 一致性判定
無論是差值均數還是差值的 95%LoA,都只是樣本統計量,直接對總體進行統計推斷,可能會導致嚴重后果,因此要正確應用一致性判定方法和標準,選擇正確的方法計算 LoA 的 CI。納入文獻中,錯誤地將兩測量結果差值點位于 95%LoA 兩個限值之間的比例是否達到 95% 作為評價一致性標準的文獻比例竟然高達 208 篇(55.3%);而正確采用差值的 95%LoA 的 95%CI 與臨床界值進行比較的文獻僅有 1 篇(0.3%),見表 7。由此可見,Bland-Altman 方法的錯誤使用很普遍,如果不加以正確引導和規范要求,這種濫用的后果將不堪設想。

2.3.7 重復性考察
方法的重復性好壞將直接影響一致性評價結果的準確性。當兩種方法重復性都達到一定要求后,可直接采用單次測量設計進行一致性評價;若方法本身重復性不確定,則可選擇重復性測量設計的一致性評價方法,綜合評價其重復性和一致性。這在某種程度上也可提高統計檢驗效能,因此成為臨床特定條件下不少探索性研究的優先選擇。然而在納入文獻中,僅有 43 篇(11.4%)進行了重復性考察,可見目前 Bland-Altman 方法在應用過程中存在不規范性。
2.3.8 與國外研究的比較
我們將本研究結果與國外 Bland-Altman 分析方法的調查研究[18-21]進行比較,結果見表 8。大部分條目的正確報告率均低于國外(P<0.05)。而 LoA 的 CI 作為 Bland-Altman 方法進行一致性評價的主要指標,無論國內還是國外,使用率均小于 15%,結果見表 8。

3 討論
本研究搜集了 2014~2016 年中國三大數據庫中有關 Bland-Altman 方法應用的文獻,通過對文獻的整理、分析,評價了我國 Bland-Altman 方法應用的現狀,填補了國內暫無對該方法應用現狀進行整體分析的空白,同時對加強該方法的合理應用、對不足之處的改進,以促進我國相關報告的規范性研究提供了參考和建議。
本研究結果顯示,目前國內 Bland-Altman 方法應用主要存在以下幾個問題:① 摘要部分未明確給出所采用的方法及研究分析結果;② 研究中未事先通過公開標準、文獻查閱等方法設定臨床可接受的一致性界值;③ 使用 Bland-Altman 方法之前未對數據行為進行判定;④ 繪圖的圖示不符合 Bland-Altman 圖示法要求;⑤ 未采用正確的一致性評價指標與臨床界值進行比較;⑥ 未對測量方法的重復性進行考察。
與國外相關研究進行比較發現,無論國內還是國外,現有的有關 Bland-Altman 方法的應用文獻質量均令人堪憂。研究文獻的全面性、透明性都缺少指導性原則和規范,需要多學科專家聯合制定相關規范以改善相關研究文獻的報告質量。
針對國內外都存在的應用報告不規范問題,建議加強對 Bland-Altman 方法學的介紹,提高方法學意識;把該方法詳細的分析步驟寫入教科書,加大教學力度;定期舉辦 Bland-Altman 方法應用培訓班,邀請國內外該領域知名專家對該方法進行系統全面的講解;建立相關網站,在網上進行該方法的資料共享,提供視頻形式的專家教學,提供在線答疑等,通過多方面、全方位對 Bland-Altman 方法進行介紹,對相關人員進行輔導等,提高該方面研究質量。對該方法應用文獻提供規范性的要求和指南,為作者、編輯、審稿人等相關人員提供參考。同時,開展 Bland-Altman 方法一致性評價報告規范的研究也勢在必行。
總之,國內研究對 Bland-Altman 應用不佳,存在報告不規范的問題。應加強介紹 Bland-Altman 方法學,提高其報告質量。
要使兩種不同方法對同一試驗對象的測量結果完全一致是幾乎不可能的,兩種方法的測量結果存在一定趨勢性的差異,其中一種方法的測量結果總大于(或小于)另一種方法的測量結果,這種差異我們稱之為系統誤差,也稱為偏倚(bias)[1]。除了系統誤差,測量結果還必然存在隨機誤差,理論上,只要兩種方法測量結果間的誤差在臨床可接受范圍內,我們就可認為兩種方法具有一致性或互換性。在 Bland-Altman 方法提出之前,定量測量方法的比較研究常用配對 t 檢驗、相關系數和回歸分析來評價兩種方法一致性,Altman 和 Bland[2]指出了這些方法的不恰當性,并提出了一種通過圖示和定量結果評價一致性的方法,即 Bland-Altman 方法。此后,Bland 和 Altman 又對該方法進行了詳細的闡述和擴展。Bland-Altman 方法的基本思想是先計算兩種方法對同一批個體的測量結果的偏倚(
)及標準差(SD),然后計算一致限(LoA,95%LoA=
±1.96SD),并結合差值-均數圖進行一致性評價。但不管是差值均數,或是差值的 95%LoA,都只是基于樣本統計量,不可直接用于對總體進行統計推斷。要正確評價兩種方法的一致性,必須考慮抽樣誤差造成的影響。因此,為推斷兩種方法在總體上的一致性,應分別估計 95%LoA 的上限和下限的 95% 可信區間(CI)。如果兩種方法的 95%LoA 的 95%CI 結果在事先給定的、臨床上可接受的誤差范圍內,則可得出兩種測量方法具有一致性或互換性。該方法一經提出,便得到了國際上的廣泛認可。但該方法因未能被全面或正確理解,故其在研究應用和報告規范上存在很多問題[3-7]。國外從 2000 年開始就有學者對此進行了針對性調查[8],結果表明該方法在應用上存在嚴重的不規范,錯誤使用的現象屢見不鮮。隨著 Bland-Altman 方法被引入國內,目前醫藥衛生領域已有多篇 Bland-Altman 方法的應用文獻發表,但目前國內尚無對 Bland-Altman 方法應用現狀的評價。本文針對國內 Bland-Altman 方法一致性評價應用報告的現狀進行了調查分析,評價了 Bland-Altman 方法在國內應用過程中存在的問題,以期為建立 Bland-Altman 方法的報告規范和促進我國研究者 Bland-Altman 方法的正確應用提供參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
采用 Bland-Altman 方法進行了一致性評價的文獻,所屬領域為醫藥衛生領域。
1.1.2 排除標準
① 方法學文獻,如介紹 Bland-Altman 方法的文章;② 非中國學者完成的文獻;③ 未報告任何一致性評價結果(圖形、數值)的文獻。
1.2 文獻檢索策略
計算機檢索 WanFang Data、VIP 和 CNKI 數據庫,搜集 Bland-Altman 方法在醫藥衛生領域進行了一致性評價的文獻,檢索時限為 2014 年 1 月 1 日~2016 年 12 月 31 日。檢索詞包括 Bland-Altman、Bland Altman、bland altman 和 bland-altman。以 CNKI 為例,其具體檢索策略見框 1。

1.3 文獻篩選與資料提取
文獻檢索完成后,組建課題小組,對全文進行閱讀,并對其他 Bland-Altman 方法類文獻進行細讀,增加對該方法的認識和理解,之后通過小組討論等擬定“Bland-Altman 方法一致性評價應用數據摘錄表”。該摘錄表共有 6 個模塊 54 個條目,包括基本內容、方法應用摘要、方法具體內容、結果具體內容、討論事項及其他事項等。對文獻進行全面、詳細地摘錄,摘錄過程分為兩個階段:① 紙質摘錄階段,由 1 名摘錄者和 1 名核對者依據摘錄表對所下載文獻進行逐篇摘錄及核對(kappa 值=0.801),分別在摘錄表上簽署姓名和時間,由第三名研究者進行抽查、復核,以保證摘錄質量;② 電子錄入階段,由專業數據錄入人員利用 Epidata 3.1 軟件進行雙份錄入及核查以保證數據錄入的準確性并建立統計分析數據庫。
1.4 統計分析
采用 SPSS 22.0 軟件進行統計分析,納入文獻的基本情況采用百分比指標進行描述性分析。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻 878 篇,經逐層篩選,最終納入文獻 376 篇。2014 年、2015 年和 2016 年發文量分別為 110、140 和 126 篇。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:CNKI(
2.2 納入文獻的發表分布情況
對雜志發表和按“中圖分類號”進行學科分類整理的結果顯示,該方法在眼科、放射和檢驗醫學領域應用較多,見表 1、表 2。部分跨學科文獻發表在非醫學類雜志上,由此也反映出 Bland-Altman 方法的應用所跨領域廣、涉及學科多。


2.3 綜合評價結果
2.3.1 概要模塊
在 Bland-Altman 方法應用文獻中,需要在題目及摘要中體現 Bland-Altman 方法或包含一致性評價等相關字眼。本研究結果顯示,標題出現 Bland-Altman 的文獻僅 6 篇(1.6%),關鍵詞給出或含有 Bland-Altman 的文獻僅 14 篇(3.7%),見表 3。

2.3.2 其他一致性評價方法的使用
除 Bland-Altman 方法外,許多研究者也會同時使用其他方法作為評價定量數據測量結果一致性的標準或參考。對納入文獻進行整理分析發現:除 Bland-Altman 方法外,還涉及到簡單相關(simple correlation,r)、配對 t 檢驗(paired matched t-test)、組內相關系數(intraclass correlation coefficient,ICC)、回歸分析(regression analysis)、Kappa 一致性系數(Kappa coefficient of agreement,k)以及一致性相關系數(concordance correlation coefficient,CCC)等方法,見表 4。這些方法作為一致性評價的共用方法,性能各異,可作為相關參考,但其中一些方法若作為主要評價方法,則可能導致不合理的結論。國外已有研究提示一致性評價時采用簡單相關系數、CCC、ICC、回歸分析、配對 t 檢驗等方法的缺點與問題,并采用模擬方法分析了可能導致的不合理結論,有損一致性評價的證據,甚至對患者的醫療決策帶來嚴重后果[9, 10]。

2.3.3 報告規范性
在 Bland-Altman 方法一致性評價應用的文獻中,方法介紹部分應包括納入/排除標準、樣本量估計方法、隨機化方法、數據行為判定、LoA 及其 95%CI 和 Bland-Altman 圖等的介紹[11-15]。本研究結果顯示,介紹了納入/排除標準的文獻有 127 篇(33.8%),介紹樣本量估計方法及隨機化方法的文獻分別有 12 篇(3.2%)和 19 篇(5.1%)。在文獻的統計處理部分,本應對所使用的數據處理及分析方法進行詳細介紹,但在納入文獻中,僅有 101 篇(26.9%)對 Bland-Altman 圖示法進行了介紹,僅有 25 篇(6.6%)對 95%LoA 的計算方法加以描述,全部文獻均未給出 95%LoA 的 95%CI 的計算方法,事先設定一致性界值的文獻也僅有 43 篇(11.4%),結果見圖 2。
任何方法在使用之前,都應該對其應用條件加以判斷。Bland-Altman 方法在應用之前,需要對數據行為進行判定,即當數據行為良好時,直接采用標準的 Bland-Altman 方法分析即可;當數據行為不良時,則需要進行相應的數據處理,如可對數據進行轉換,將兩種方法結果比值、對數差值或差值的百分比值作為縱軸,考察是否達到良好的數據行為;若仍無法滿足,則需考慮采用其他的一致性評價方法。在特殊情形下,如兩測量結果差值存在比例偏倚且方差不齊時,除可采用數據轉換考察數據行為外,還可構造“V”形的 LoA 進行一致性評價[16, 17]。在納入的 376 篇文獻中提及數據行為判定方法的很少,介紹正態性判定方法的文獻有 33 篇(8.8%),其次為比例偏倚判定方法介紹 8 篇(2.1%),而提及方差齊性判定方法介紹最少,僅有 6 篇(1.6%),結果見圖 2。

2.3.4 繪圖質量
Bland-Altman 圖作為一致性評價的重要參考,圖形繪制的質量尤為重要,需嚴格按照要求畫出必要的參考線,并給出明確的圖例。標準 Bland-Altman 圖的 X 軸應為兩測量結果均數,當兩種測量方法中的其中一種被認為是臨床認可的參照方法或金標準時,也可用該方法的測量值直接作為 X 軸;Y 軸應為兩測量結果差值、對數轉換后的差值或原始結果的比值、原始結果差值與兩者平均值的百分比值等。Bland-Altman 圖中的參考線有兩測量結果差值、差值的 95%CI、差值的 95%LoA 及差值的 95%LoA 的 95%CI。通過圖形展示,可更加直觀地了解一致性情況,便于對一致性評價做出初步判斷。納入文獻中,有 296 篇(78.7%)提供了 Bland-Altman 圖,其中 275 篇(92.9%)Bland-Altman 圖的 X 軸采用了兩測量結果均數指標,282 篇(95.3%)Y 軸采用了兩測量結果差值,而畫出差值 95%LoA 橫線的圖形有 95.9%,但畫出了兩測量結果差值的 95%LoA 的 95%CI 橫線的僅有 13 篇(4.4%)。圖形的不規范、不標準也直接導致了 Bland-Altman 方法應用文獻的報告質量下降。

2.3.5 數值結果
在 Bland-Altman 方法的應用文獻中,結果部分不僅需要給出圖形化結果,更需要給出數值化結果,包括數據行為判定結果以及評價指標的數值結果。對納入文獻進行整理分析發現:數據行為判定結果缺失嚴重,特別是比例偏倚判定,僅有 2 篇(0.5%)給出了判定結果。而一致性評價指標的數值結果也不盡人意,僅有 2.7% 的文獻提供了兩測量結果平均差值 95%LoA 的 95%CI,這對一致性評價的總體推斷帶來困難,結果見表 6。

2.3.6 一致性判定
無論是差值均數還是差值的 95%LoA,都只是樣本統計量,直接對總體進行統計推斷,可能會導致嚴重后果,因此要正確應用一致性判定方法和標準,選擇正確的方法計算 LoA 的 CI。納入文獻中,錯誤地將兩測量結果差值點位于 95%LoA 兩個限值之間的比例是否達到 95% 作為評價一致性標準的文獻比例竟然高達 208 篇(55.3%);而正確采用差值的 95%LoA 的 95%CI 與臨床界值進行比較的文獻僅有 1 篇(0.3%),見表 7。由此可見,Bland-Altman 方法的錯誤使用很普遍,如果不加以正確引導和規范要求,這種濫用的后果將不堪設想。

2.3.7 重復性考察
方法的重復性好壞將直接影響一致性評價結果的準確性。當兩種方法重復性都達到一定要求后,可直接采用單次測量設計進行一致性評價;若方法本身重復性不確定,則可選擇重復性測量設計的一致性評價方法,綜合評價其重復性和一致性。這在某種程度上也可提高統計檢驗效能,因此成為臨床特定條件下不少探索性研究的優先選擇。然而在納入文獻中,僅有 43 篇(11.4%)進行了重復性考察,可見目前 Bland-Altman 方法在應用過程中存在不規范性。
2.3.8 與國外研究的比較
我們將本研究結果與國外 Bland-Altman 分析方法的調查研究[18-21]進行比較,結果見表 8。大部分條目的正確報告率均低于國外(P<0.05)。而 LoA 的 CI 作為 Bland-Altman 方法進行一致性評價的主要指標,無論國內還是國外,使用率均小于 15%,結果見表 8。

3 討論
本研究搜集了 2014~2016 年中國三大數據庫中有關 Bland-Altman 方法應用的文獻,通過對文獻的整理、分析,評價了我國 Bland-Altman 方法應用的現狀,填補了國內暫無對該方法應用現狀進行整體分析的空白,同時對加強該方法的合理應用、對不足之處的改進,以促進我國相關報告的規范性研究提供了參考和建議。
本研究結果顯示,目前國內 Bland-Altman 方法應用主要存在以下幾個問題:① 摘要部分未明確給出所采用的方法及研究分析結果;② 研究中未事先通過公開標準、文獻查閱等方法設定臨床可接受的一致性界值;③ 使用 Bland-Altman 方法之前未對數據行為進行判定;④ 繪圖的圖示不符合 Bland-Altman 圖示法要求;⑤ 未采用正確的一致性評價指標與臨床界值進行比較;⑥ 未對測量方法的重復性進行考察。
與國外相關研究進行比較發現,無論國內還是國外,現有的有關 Bland-Altman 方法的應用文獻質量均令人堪憂。研究文獻的全面性、透明性都缺少指導性原則和規范,需要多學科專家聯合制定相關規范以改善相關研究文獻的報告質量。
針對國內外都存在的應用報告不規范問題,建議加強對 Bland-Altman 方法學的介紹,提高方法學意識;把該方法詳細的分析步驟寫入教科書,加大教學力度;定期舉辦 Bland-Altman 方法應用培訓班,邀請國內外該領域知名專家對該方法進行系統全面的講解;建立相關網站,在網上進行該方法的資料共享,提供視頻形式的專家教學,提供在線答疑等,通過多方面、全方位對 Bland-Altman 方法進行介紹,對相關人員進行輔導等,提高該方面研究質量。對該方法應用文獻提供規范性的要求和指南,為作者、編輯、審稿人等相關人員提供參考。同時,開展 Bland-Altman 方法一致性評價報告規范的研究也勢在必行。
總之,國內研究對 Bland-Altman 應用不佳,存在報告不規范的問題。應加強介紹 Bland-Altman 方法學,提高其報告質量。