引用本文: 孫映荷, 劉念, 姜勇, 蘇學英, 龔日祥, 李志輝, 魏濤, 鄒秀和, 劉楓, 朱精強. 甲狀腺細胞病理學Bethesda報告系統:單中心2257個甲狀腺結節診斷的應用體會. 中國普外基礎與臨床雜志, 2014, 21(9): 1076-1080. doi: 10.7507/1007-9424.20140260 復制
甲狀腺結節常見于多種甲狀腺疾病,近年來,其檢出率在全球呈現上升趨勢[1-3]。超聲檢查發現成人中甲狀腺結節的患病率可達20%~76%[4-6],但甲狀腺癌僅占甲狀腺結節的5%~15%[7-9],且與結節大小無關。絕大多數甲狀腺結節為良性,不需要外科處理。甲狀腺細針穿刺細胞學(fine-needle aspiration cytology,FNAC)檢查已被公認為是診斷甲狀腺結節的準確性最高的方法,具有微創、方便、經濟等特點,可以幫助明確結節性質并篩選出需要手術治療的病例,對于幫助臨床醫生確定下一步治療方案和減少不必要的外科手術具有重要的意義。近年來,甲狀腺細針穿刺(fine-needle aspiration,FNA)在我國正逐步開展,但遠未普及,國內多數醫院尚未將FNA作為常規術前檢查項目[10]。甲狀腺細胞病理學Bethesda報告系統(the Bethesda System for Reporting Thyroid Cytopathology,TBSRTC)在國內推廣應用的時間不長,尚未廣泛使用,目前少有此方面大樣本的系統研究和評估[11-12]。四川大學華西醫院自2010年開始在甲狀腺細胞學診斷中推行使用TBSRTC[13]。現將四川大學華西醫院推行TBSRTC 3年期間的2 257個甲狀腺結節的細胞學診斷實踐經驗進行總結,并對TBSRTC的診斷價值進行評價,以期與國內外細胞學同行分享。
1 資料與方法
1.1 臨床資料
收集四川大學華西醫院病理科2010年1月
1日至2012年12月31日期間完成甲狀腺FNA細胞病理分級的2 100例病例的病理資料,男336例,女1 764例,男女比為1.00︰5.25;年齡9~84歲、(46.2±13.7)歲。所有FNA操作均由筆者所在醫院具有經驗的醫生在超聲引導下或觸診下完成,穿刺后立刻涂片1~2張,并用95%乙醇濕固定30 min,按標準程序進行巴氏染色。若涂片后有剩余材料,則用10%甲醛固定,按組織學制片標準程序制作細胞蠟塊切片并行HE染色。
1.2 TBSRTC分級
每個標本的細胞學診斷結果均由接受過甲狀腺TBSRTC細胞病理診斷培訓且經驗豐富的專職細胞病理醫生出具。診斷按TBSRTC分為以下6級[13]:Ⅰ級,標本無法診斷或不滿意;Ⅱ級,良性病變;Ⅲ級,意義不明的細胞非典型性病變或濾泡性病變;Ⅳ級,濾泡性腫瘤或可疑濾泡性腫瘤;Ⅴ級,可疑惡性腫瘤;Ⅵ級,惡性腫瘤。
1.3 方法及相關定義
追蹤其中進一步行手術患者的組織病理學結果,將組織病理學結果分為良性(陰性)和惡性(陽性)兩類,以其作為金標準,探討細胞病理學結果的診斷價值,計算其靈敏度、特異度、準確率、陽性預測值及陰性預測值。各級診斷的陽性預測值代表其惡性風險。本研究定義TBSRTCⅡ級為“陰性”,Ⅲ~Ⅵ級為“陽性”,并分別統計“陽性”中包含和不包含Ⅲ級時的診斷價值指標。“假陰性”指Ⅱ級中經組織病理學檢查診斷為惡性的結節,“假陽性”指Ⅲ~Ⅵ級中經組織病理學檢查證明為良性的結節。Ⅰ級結節推薦的處理措施為重復穿刺而不是行手術治療,因此未納入上述統計。
2 結果
2.1 甲狀腺結節的TBSRTC分級及其術后組織病理學結果
2 100例患者共獲得2 257個甲狀腺結節FNA標本,其中于超聲引導下穿刺2 025個(89.7%),觸診下穿刺232個(10.3%);787個結節(34.9%)具有術后組織病理學診斷結果。①2 257個甲狀腺結節的TBSRTC分級中,Ⅰ級442個,占19.6%;Ⅱ級1 184個,占52.4%;Ⅲ級216個,占9.6%;Ⅳ級38個,占1.7%;Ⅴ級172個,占7.6%;Ⅵ級205個,占9.1%。Ⅰ級的442個甲狀腺FNA標本中,僅含囊液的標本有145個,占32.8%。②787個有術后組織病理學檢查結果的甲狀腺結節中,485個(61.6%)為良性,302個(38.4%)為惡性。其中包括Ⅰ級73個,占9.3%;Ⅱ級339個,占43.1%;Ⅲ級89個,占11.3%;Ⅳ級26個,占3.3%;Ⅴ級126個,占16.0%;Ⅵ級134個,占17.0%。各TBSRTC分級的組織病理學結果見表 1。僅有囊液的145個Ⅰ級甲狀腺結節中,有11個具有組織病理學結果,其中良性10個,惡性1個。

2.2 TBSRTC分級對甲狀腺結節的診斷價值
若將Ⅳ~Ⅵ級定義為“陽性”,則TBSRTC分級診斷甲狀腺結節的靈敏度、特異度、準確率、陽性預測值和陰性預測值均較高,均在82.0%以上;但若將意義不明的Ⅲ級分類歸入“陽性”后,則特異度和陽性預測值均明顯降低,而其他指標的變化不明顯(表 2)。此外,Ⅲ、Ⅳ、Ⅴ及Ⅵ級的陽性預測值分別為34.8%(31/89)、7.7%(2/26)、81.0%(102/126)和98.5%(132/134),Ⅵ級+Ⅴ級+Ⅳ級的陽性預測值為82.5%(236/286),Ⅵ級+Ⅴ級+Ⅳ級+Ⅲ級的陽性預測值為71.2%(267/375)。

3 討論
2007年10月,美國國家癌癥研究所召開了甲狀腺FNA的專題會議,就甲狀腺FNAC的形態學診斷標準、臨床意義、分子病理進展等內容達成了許多共識,并于2010年出版了《甲狀腺細胞病理學Bethesda報告系統:定義、標準和注釋》[13],將甲狀腺細胞學診斷分為6個等級。TBSRTC在很多機構的應用實踐證明其是準確和可靠的甲狀腺細胞學分類診斷系統[14-16]。2009年,美國甲狀腺協會在《甲狀腺結節和分化型甲狀腺癌診治指南修訂版》[17]中推薦使用TBSRTC進行FNAC分級。四川大學華西醫院作為中國西南部甲狀腺疾病的診治中心,自2010年開始在甲狀腺細胞學診斷中推行使用TBSRTC[13]。上述已對筆者所在醫院推行TBSRTC 3年中的2 257個甲狀腺結節細胞學診斷的實踐經驗進行了總結,現將各級分類的構成比、陽性預測值及TBSRTC的主要評價指標與國內外研究進行對比,并對差異進行分析。
3.1 TBSRTC各級的構成比
3.1.1 Ⅰ級所占比例高
Theoharis等[15]的一項包含3 207個甲狀腺FNA標本的研究結果顯示,TBSRTCⅠ級所占比例為11.1%,本研究Ⅰ級占19.6%,較高。僅有囊液者是歸入Ⅰ級還是Ⅱ級尚存在爭議,Theoharis等[15]的研究是將其歸入Ⅱ級。若從Ⅰ級中剔除僅有囊液的病例,則本研究TBSRTC分級中Ⅰ級僅占總數的13.2%,與上述研究的差異不大。Eedes等[18]報道,病理醫生現場確認標本不滿意后馬上再穿刺可降低標本的不滿意率,本研究Ⅰ級所占比例高的原因可能和病理醫生未在超聲穿刺的現場指導超聲醫生涂片和固定,特別是未快速染色以確認標本是否滿意有關。
3.1.2 Ⅳ級所占比例低
在Nayar等[19]及蔡曉頻[11]的研究中,Ⅳ級所占的比例分別為5.9%和3.9%,本研究中Ⅳ級所占比例(1.7%)較低。這可能與不同地區的甲狀腺疾病構成不同有關,中國尤其是中國西南地區濾泡性腫瘤的發病率較低。鄒秀和等[20]統計,四川大學華西醫院2012年術后診斷為濾泡型腺瘤及濾泡性癌的患者僅占同期所有甲狀腺手術患者的1.8%。同時,可能還與筆者所在醫院細胞學醫生對微濾泡(濾泡性腫瘤細胞學診斷最重要的特征)的認識及診斷數量把握不是很到位有關,需對照組織病理學結果進一步學習。
3.1.3 Ⅴ級和Ⅵ級所占比例高
本研究中Ⅴ級和Ⅵ級分別占7.6%及9.1%,與其他研究[11, 15, 19]相比,所占比例較高。究其原因可能為,筆者所在醫院每年就診的甲狀腺結節患者較多,進行超聲引導下甲狀腺結節FNA的容量有限,FNA前超聲醫生先使用甲狀腺影像報告和分級系統(thyroid imaging reporting and data system,TI-RADS)[21]對結節進行分級,一般情況下甲狀腺專科醫生僅對3級(不確定病變)及以上的患者建議行穿刺,且筆者所在醫院有約30%[22]的FNA病例穿刺前超聲檢查已懷疑為惡性,這可以解釋為何本組病例中懷疑惡性及惡性的比例相對較高。
3.2 TBSRTC各級的陽性預測值
美國國家癌癥研究所大會確立的、調校偏倚后TBSRTC各分級的惡性風險分別為:Ⅰ級,1%~4%;Ⅱ級,0~3%;Ⅲ級,5%~15%;Ⅳ級,15%~30%;Ⅴ級,60%~77%;Ⅵ級,97%~99%[13, 23]。將本研究中細胞學診斷各級分類的陽性預測值與該標準進行對比,發現具有以下差異。
3.2.1 Ⅰ、Ⅱ及Ⅲ級的陽性預測值均較高
Boha-cek等[16]的研究表明,Ⅰ級和Ⅱ級的陽性預測值分別為26.3%及6.9%。Theoharis等[15]的研究結果表明,Ⅲ級的陽性預測值為48.1%,與本研究的結果較接近,但均高于定義值。分析原因為,臨床僅對此3類中強烈懷疑惡性或腫塊巨大出現壓迫癥狀等的患者實施手術。筆者所在醫院穿刺前先對甲狀腺結節進行超聲篩選;且本研究中Ⅰ、Ⅱ及Ⅲ級中有術后組織病理學結果標本的比例分別為16.5%(73/442)、28.6%(339/1 184)以及41.2%(89/216),比例均較低。這些因素都會導致選擇性偏倚。因此,本研究結果中Ⅰ、Ⅱ和Ⅲ級的惡性風險較高。
3.2.2 Ⅳ級的陽性預測值較低
本研究中Ⅳ級結節的數量少,結果可能不夠準確,有待進一步積累資料進行總結。
3.2.3 Ⅴ級的陽性預測值較高
根據Theoharis等[15]的數據計算,Ⅴ級的陽性預測值為86.7%,與本研究結果相似。本研究納入的是單純的涂片或涂片加細胞蠟塊診斷,而細胞病理醫生在實行TBSRTC分級診斷的早期,對出具Ⅵ級診斷比較保守,可能在涂片診斷時將少量應診斷為惡性腫瘤的病例放入了Ⅴ級診斷。另一個原因是,筆者所在醫院細胞病理醫生比較依賴后續檢查,初次診斷多給出可進可退的Ⅴ級診斷,而根據后續檢查作出的修正診斷結果均未反映在本次統計中。
3.3 TBSRTC分類系統的評價
本研究以剔除Ⅲ級結節后所計算的靈敏度、特異度、準確率、陽性預測值、陰性預測值等為主要評價指標。由于有41.2%的Ⅲ級結節具有組織學對照結果,筆者遂額外計算了將Ⅲ級納入細胞學陽性后的相關指標。結果顯示,剔除Ⅲ級結節后,TBSRTC分級的靈敏度、特異度、準確度、陽性預測值及陰性預測值均較高;將Ⅲ級結節納入分析后,靈敏度、準確度及陰性預測值也較高,但特異度和陽性預測值均顯著降低。與Bongiovanni等[24]的Meta分析(含國外8個大型TBSRTC臨床研究,共計25 445例)結果相比較,筆者所在醫院應用TBSRTC診斷甲狀腺結節的靈敏度與其相近,但特異度更高;Ⅳ+Ⅴ+Ⅵ級和Ⅲ+Ⅳ級+Ⅴ級+Ⅵ級的陽性預測值均較高,且不管是否納入Ⅲ級,計算所得的準確率均較高。本研究結果還顯示,TBSRTC的假陽性率為13.4%,看似較該Meta分析(0.5%)高,實際系計算方式的差異導致。該Meta分析的實際計算中,假陽性率為組織病理學良性的結節中細胞學診斷為Ⅵ級的比例,而筆者認為,“假陽性”應定義為Ⅳ~Ⅵ級中經組織學診斷為良性者。如按該Meta分析的算法,本研究的假陽性率為0.5%(2/373),與其數據一致。另外,Krane等[25]建議,將Ⅲ級/Ⅵ級的數量比控制在1~3的范圍內,可防止細胞非典型性病變或濾泡性病變的過診斷及惡性腫瘤的低診斷。本研究為1.05(216/205),位于建議范圍內。
綜上所述,本研究結果表明,經過多次學習和培訓,筆者所在醫院細胞病理醫生對該診斷系統的把握較好;TBSRTC的應用實踐證明其真實性較高,是準確和可靠的甲狀腺細胞學分類診斷系統,可以運用到中國的甲狀腺細胞學診斷實踐中來。
甲狀腺結節常見于多種甲狀腺疾病,近年來,其檢出率在全球呈現上升趨勢[1-3]。超聲檢查發現成人中甲狀腺結節的患病率可達20%~76%[4-6],但甲狀腺癌僅占甲狀腺結節的5%~15%[7-9],且與結節大小無關。絕大多數甲狀腺結節為良性,不需要外科處理。甲狀腺細針穿刺細胞學(fine-needle aspiration cytology,FNAC)檢查已被公認為是診斷甲狀腺結節的準確性最高的方法,具有微創、方便、經濟等特點,可以幫助明確結節性質并篩選出需要手術治療的病例,對于幫助臨床醫生確定下一步治療方案和減少不必要的外科手術具有重要的意義。近年來,甲狀腺細針穿刺(fine-needle aspiration,FNA)在我國正逐步開展,但遠未普及,國內多數醫院尚未將FNA作為常規術前檢查項目[10]。甲狀腺細胞病理學Bethesda報告系統(the Bethesda System for Reporting Thyroid Cytopathology,TBSRTC)在國內推廣應用的時間不長,尚未廣泛使用,目前少有此方面大樣本的系統研究和評估[11-12]。四川大學華西醫院自2010年開始在甲狀腺細胞學診斷中推行使用TBSRTC[13]。現將四川大學華西醫院推行TBSRTC 3年期間的2 257個甲狀腺結節的細胞學診斷實踐經驗進行總結,并對TBSRTC的診斷價值進行評價,以期與國內外細胞學同行分享。
1 資料與方法
1.1 臨床資料
收集四川大學華西醫院病理科2010年1月
1日至2012年12月31日期間完成甲狀腺FNA細胞病理分級的2 100例病例的病理資料,男336例,女1 764例,男女比為1.00︰5.25;年齡9~84歲、(46.2±13.7)歲。所有FNA操作均由筆者所在醫院具有經驗的醫生在超聲引導下或觸診下完成,穿刺后立刻涂片1~2張,并用95%乙醇濕固定30 min,按標準程序進行巴氏染色。若涂片后有剩余材料,則用10%甲醛固定,按組織學制片標準程序制作細胞蠟塊切片并行HE染色。
1.2 TBSRTC分級
每個標本的細胞學診斷結果均由接受過甲狀腺TBSRTC細胞病理診斷培訓且經驗豐富的專職細胞病理醫生出具。診斷按TBSRTC分為以下6級[13]:Ⅰ級,標本無法診斷或不滿意;Ⅱ級,良性病變;Ⅲ級,意義不明的細胞非典型性病變或濾泡性病變;Ⅳ級,濾泡性腫瘤或可疑濾泡性腫瘤;Ⅴ級,可疑惡性腫瘤;Ⅵ級,惡性腫瘤。
1.3 方法及相關定義
追蹤其中進一步行手術患者的組織病理學結果,將組織病理學結果分為良性(陰性)和惡性(陽性)兩類,以其作為金標準,探討細胞病理學結果的診斷價值,計算其靈敏度、特異度、準確率、陽性預測值及陰性預測值。各級診斷的陽性預測值代表其惡性風險。本研究定義TBSRTCⅡ級為“陰性”,Ⅲ~Ⅵ級為“陽性”,并分別統計“陽性”中包含和不包含Ⅲ級時的診斷價值指標。“假陰性”指Ⅱ級中經組織病理學檢查診斷為惡性的結節,“假陽性”指Ⅲ~Ⅵ級中經組織病理學檢查證明為良性的結節。Ⅰ級結節推薦的處理措施為重復穿刺而不是行手術治療,因此未納入上述統計。
2 結果
2.1 甲狀腺結節的TBSRTC分級及其術后組織病理學結果
2 100例患者共獲得2 257個甲狀腺結節FNA標本,其中于超聲引導下穿刺2 025個(89.7%),觸診下穿刺232個(10.3%);787個結節(34.9%)具有術后組織病理學診斷結果。①2 257個甲狀腺結節的TBSRTC分級中,Ⅰ級442個,占19.6%;Ⅱ級1 184個,占52.4%;Ⅲ級216個,占9.6%;Ⅳ級38個,占1.7%;Ⅴ級172個,占7.6%;Ⅵ級205個,占9.1%。Ⅰ級的442個甲狀腺FNA標本中,僅含囊液的標本有145個,占32.8%。②787個有術后組織病理學檢查結果的甲狀腺結節中,485個(61.6%)為良性,302個(38.4%)為惡性。其中包括Ⅰ級73個,占9.3%;Ⅱ級339個,占43.1%;Ⅲ級89個,占11.3%;Ⅳ級26個,占3.3%;Ⅴ級126個,占16.0%;Ⅵ級134個,占17.0%。各TBSRTC分級的組織病理學結果見表 1。僅有囊液的145個Ⅰ級甲狀腺結節中,有11個具有組織病理學結果,其中良性10個,惡性1個。

2.2 TBSRTC分級對甲狀腺結節的診斷價值
若將Ⅳ~Ⅵ級定義為“陽性”,則TBSRTC分級診斷甲狀腺結節的靈敏度、特異度、準確率、陽性預測值和陰性預測值均較高,均在82.0%以上;但若將意義不明的Ⅲ級分類歸入“陽性”后,則特異度和陽性預測值均明顯降低,而其他指標的變化不明顯(表 2)。此外,Ⅲ、Ⅳ、Ⅴ及Ⅵ級的陽性預測值分別為34.8%(31/89)、7.7%(2/26)、81.0%(102/126)和98.5%(132/134),Ⅵ級+Ⅴ級+Ⅳ級的陽性預測值為82.5%(236/286),Ⅵ級+Ⅴ級+Ⅳ級+Ⅲ級的陽性預測值為71.2%(267/375)。

3 討論
2007年10月,美國國家癌癥研究所召開了甲狀腺FNA的專題會議,就甲狀腺FNAC的形態學診斷標準、臨床意義、分子病理進展等內容達成了許多共識,并于2010年出版了《甲狀腺細胞病理學Bethesda報告系統:定義、標準和注釋》[13],將甲狀腺細胞學診斷分為6個等級。TBSRTC在很多機構的應用實踐證明其是準確和可靠的甲狀腺細胞學分類診斷系統[14-16]。2009年,美國甲狀腺協會在《甲狀腺結節和分化型甲狀腺癌診治指南修訂版》[17]中推薦使用TBSRTC進行FNAC分級。四川大學華西醫院作為中國西南部甲狀腺疾病的診治中心,自2010年開始在甲狀腺細胞學診斷中推行使用TBSRTC[13]。上述已對筆者所在醫院推行TBSRTC 3年中的2 257個甲狀腺結節細胞學診斷的實踐經驗進行了總結,現將各級分類的構成比、陽性預測值及TBSRTC的主要評價指標與國內外研究進行對比,并對差異進行分析。
3.1 TBSRTC各級的構成比
3.1.1 Ⅰ級所占比例高
Theoharis等[15]的一項包含3 207個甲狀腺FNA標本的研究結果顯示,TBSRTCⅠ級所占比例為11.1%,本研究Ⅰ級占19.6%,較高。僅有囊液者是歸入Ⅰ級還是Ⅱ級尚存在爭議,Theoharis等[15]的研究是將其歸入Ⅱ級。若從Ⅰ級中剔除僅有囊液的病例,則本研究TBSRTC分級中Ⅰ級僅占總數的13.2%,與上述研究的差異不大。Eedes等[18]報道,病理醫生現場確認標本不滿意后馬上再穿刺可降低標本的不滿意率,本研究Ⅰ級所占比例高的原因可能和病理醫生未在超聲穿刺的現場指導超聲醫生涂片和固定,特別是未快速染色以確認標本是否滿意有關。
3.1.2 Ⅳ級所占比例低
在Nayar等[19]及蔡曉頻[11]的研究中,Ⅳ級所占的比例分別為5.9%和3.9%,本研究中Ⅳ級所占比例(1.7%)較低。這可能與不同地區的甲狀腺疾病構成不同有關,中國尤其是中國西南地區濾泡性腫瘤的發病率較低。鄒秀和等[20]統計,四川大學華西醫院2012年術后診斷為濾泡型腺瘤及濾泡性癌的患者僅占同期所有甲狀腺手術患者的1.8%。同時,可能還與筆者所在醫院細胞學醫生對微濾泡(濾泡性腫瘤細胞學診斷最重要的特征)的認識及診斷數量把握不是很到位有關,需對照組織病理學結果進一步學習。
3.1.3 Ⅴ級和Ⅵ級所占比例高
本研究中Ⅴ級和Ⅵ級分別占7.6%及9.1%,與其他研究[11, 15, 19]相比,所占比例較高。究其原因可能為,筆者所在醫院每年就診的甲狀腺結節患者較多,進行超聲引導下甲狀腺結節FNA的容量有限,FNA前超聲醫生先使用甲狀腺影像報告和分級系統(thyroid imaging reporting and data system,TI-RADS)[21]對結節進行分級,一般情況下甲狀腺專科醫生僅對3級(不確定病變)及以上的患者建議行穿刺,且筆者所在醫院有約30%[22]的FNA病例穿刺前超聲檢查已懷疑為惡性,這可以解釋為何本組病例中懷疑惡性及惡性的比例相對較高。
3.2 TBSRTC各級的陽性預測值
美國國家癌癥研究所大會確立的、調校偏倚后TBSRTC各分級的惡性風險分別為:Ⅰ級,1%~4%;Ⅱ級,0~3%;Ⅲ級,5%~15%;Ⅳ級,15%~30%;Ⅴ級,60%~77%;Ⅵ級,97%~99%[13, 23]。將本研究中細胞學診斷各級分類的陽性預測值與該標準進行對比,發現具有以下差異。
3.2.1 Ⅰ、Ⅱ及Ⅲ級的陽性預測值均較高
Boha-cek等[16]的研究表明,Ⅰ級和Ⅱ級的陽性預測值分別為26.3%及6.9%。Theoharis等[15]的研究結果表明,Ⅲ級的陽性預測值為48.1%,與本研究的結果較接近,但均高于定義值。分析原因為,臨床僅對此3類中強烈懷疑惡性或腫塊巨大出現壓迫癥狀等的患者實施手術。筆者所在醫院穿刺前先對甲狀腺結節進行超聲篩選;且本研究中Ⅰ、Ⅱ及Ⅲ級中有術后組織病理學結果標本的比例分別為16.5%(73/442)、28.6%(339/1 184)以及41.2%(89/216),比例均較低。這些因素都會導致選擇性偏倚。因此,本研究結果中Ⅰ、Ⅱ和Ⅲ級的惡性風險較高。
3.2.2 Ⅳ級的陽性預測值較低
本研究中Ⅳ級結節的數量少,結果可能不夠準確,有待進一步積累資料進行總結。
3.2.3 Ⅴ級的陽性預測值較高
根據Theoharis等[15]的數據計算,Ⅴ級的陽性預測值為86.7%,與本研究結果相似。本研究納入的是單純的涂片或涂片加細胞蠟塊診斷,而細胞病理醫生在實行TBSRTC分級診斷的早期,對出具Ⅵ級診斷比較保守,可能在涂片診斷時將少量應診斷為惡性腫瘤的病例放入了Ⅴ級診斷。另一個原因是,筆者所在醫院細胞病理醫生比較依賴后續檢查,初次診斷多給出可進可退的Ⅴ級診斷,而根據后續檢查作出的修正診斷結果均未反映在本次統計中。
3.3 TBSRTC分類系統的評價
本研究以剔除Ⅲ級結節后所計算的靈敏度、特異度、準確率、陽性預測值、陰性預測值等為主要評價指標。由于有41.2%的Ⅲ級結節具有組織學對照結果,筆者遂額外計算了將Ⅲ級納入細胞學陽性后的相關指標。結果顯示,剔除Ⅲ級結節后,TBSRTC分級的靈敏度、特異度、準確度、陽性預測值及陰性預測值均較高;將Ⅲ級結節納入分析后,靈敏度、準確度及陰性預測值也較高,但特異度和陽性預測值均顯著降低。與Bongiovanni等[24]的Meta分析(含國外8個大型TBSRTC臨床研究,共計25 445例)結果相比較,筆者所在醫院應用TBSRTC診斷甲狀腺結節的靈敏度與其相近,但特異度更高;Ⅳ+Ⅴ+Ⅵ級和Ⅲ+Ⅳ級+Ⅴ級+Ⅵ級的陽性預測值均較高,且不管是否納入Ⅲ級,計算所得的準確率均較高。本研究結果還顯示,TBSRTC的假陽性率為13.4%,看似較該Meta分析(0.5%)高,實際系計算方式的差異導致。該Meta分析的實際計算中,假陽性率為組織病理學良性的結節中細胞學診斷為Ⅵ級的比例,而筆者認為,“假陽性”應定義為Ⅳ~Ⅵ級中經組織學診斷為良性者。如按該Meta分析的算法,本研究的假陽性率為0.5%(2/373),與其數據一致。另外,Krane等[25]建議,將Ⅲ級/Ⅵ級的數量比控制在1~3的范圍內,可防止細胞非典型性病變或濾泡性病變的過診斷及惡性腫瘤的低診斷。本研究為1.05(216/205),位于建議范圍內。
綜上所述,本研究結果表明,經過多次學習和培訓,筆者所在醫院細胞病理醫生對該診斷系統的把握較好;TBSRTC的應用實踐證明其真實性較高,是準確和可靠的甲狀腺細胞學分類診斷系統,可以運用到中國的甲狀腺細胞學診斷實踐中來。