患者個體化容積旋轉調強放療(VMAT)質量保證(QA)過程是臨床調強放療實施流程中重要的一部分。計算劑量與實施劑量之間差異的容差限值和干預限值是 AAPM TG-218 報告認為的 VMAT QA 過程的關鍵部分,然而這兩個值在各放療中心之間尚無統一標準。本研究基于 AAPM TG-218 報告,應用統計過程控制(SPC)技術建立了采用 ArcCHECK 進行劑量驗證下不同部位 VMAT 計劃 γ 通過率的容差限值和干預限值。根據每個部位前 25 例處于受控狀態的 VMAT QA 結果計算相應部位的容差限值和干預限值,繪制單值控制圖持續監測了 287 例 VMAT 計劃的調強劑量驗證過程,并分析 QA 失控原因。腦部、頭頸部、腹部和盆腔部 VMAT QA 過程的容差限值分別為 94.56%、94.68%、94.34% 和 92.97%,干預限值分別為 93.82%、92.54%、93.23% 和 90.29%。除盆腔部外,腦部、頭頸部和腹部容差限值均接近 TG-218 通用容差限值(95%),所有部位干預限值均高于 TG-218 通用干預限值(90%)。通過單值圖監測發現頭頸部失控的 VMAT QA 為 1 例,腹部和盆腔部各 2 例,其中 4 例受擺位誤差影響,1 例受測量設備校準錯誤影響。結果顯示 SPC 技術能有效監測 IMRT/VMAT QA 過程,根據不同部位設置相應的容差限值有助于探查 QA 失控原因。
引用本文: 肖青, 李光俊, 李治斌, 張祥斌, 戴谷宇, 柏森. 基于AAPM TG-218報告應用統計過程控制技術監測患者個體化容積旋轉調強放療質量保證過程的初步研究. 生物醫學工程學雜志, 2020, 37(5): 842-847. doi: 10.7507/1001-5515.202001016 復制
引言
當前,調強適形放療(intensity-modulated radiation therapy,IMRT)和容積旋轉調強放療(volumetric modulated arc therapy,VMAT)采用非均勻射束強度,在提高靶區劑量的同時進一步減少周圍危及器官的受照劑量,已經成為很多疾病外照射放療采用的標準治療方式[1-3]。相比三維適形放療(three-dimensional conformal radiotherapy,3D-CRT),IMRT/VMAT 技術更復雜,需要更全面的質量保證(quality assurance,QA)措施,以實現精確放療實施和保障患者安全[4-5]。其中,患者個體化 IMRT/VMAT QA 過程是臨床調強放療實施流程中重要的一部分[6-7]。治療前劑量驗證分析主要是通過評估計算劑量和測量劑量之間的偏差是否在臨床可接受范圍,對于超出范圍的結果則進行調查以找出造成該結果的原因,并采取糾正措施[8]。然而,計算劑量與實施劑量之間差異的容差限值和干預限值在各中心之間尚缺乏統一的標準[3],且僅基于臨床干預限值評估患者個體化 QA 結果無法有效改進質控過程。統計過程控制(statistical process control,SPC)作為一種功能強大的分析性決策工具,基于過程本身通過統計分析來監視過程行為,在過程變差前發出警報,實現過程穩定性并減少過程可變性[9],近十年來已逐漸用于放療質控過程的監測[8,10-20]。美國醫學物理家協會(American Association of Physicists in Medicine,AAPM)在先前研究的基礎上對患者個體化 IMRT/VMAT QA 過程進行了詳細概括,制定了推動其一致性發展的 TG-218 報告[3]。該報告推薦應用 SPC 技術設定基于流程的容差限值和干預限值,以監測整個 IMRT/VMAT QA 過程的受控狀態,并推薦使用通用的容差限值和干預限值。然而,臨床上不同部位放療計劃的復雜性是不同的[21-22],基于不同部位設定相應的容差限值和干預限值才更為合理。本研究基于 TG-218 報告,評估了 SPC 技術在監測患者個體化 VMAT QA 過程中的有效性,為不同部位 VMAT QA 過程設定適合的容差限值和干預限值,并根據控制圖探查了 VMAT QA 過程失控的原因。
1 材料與方法
1.1 研究對象
選取四川大學華西醫院放療科 2019 年 1 月至 2019 年 11 月的 287 例 VMAT 計劃進行調強驗證。VMAT 計劃納入標準:① 治療加速器采用同一臺瑞典醫科達 Synergy 直線加速器;② 計劃設計采用瑞典 RaySearch 公司 Raystation 放療計劃系統(treatment planning system,TPS);③ 計劃采用 6 MV 光子束均整(flattening filter,FF)模式,最大劑量率為 600 MU/min。該研究已通過華西醫院倫理委員會審查,在中國臨床試驗注冊中心獲得注冊號:ChiCTR1900028032,并免除了知情同意書。
1.2 儀器與軟件
治療加速器采用瑞典醫科達 Synergy 直線加速器,配備 Agility 治療機頭,共有 80 對多葉準直器(multi-leaf collimator,MLC)葉片。劑量測量采用美國 Sun Nuclear 公司螺旋形半導體探測器陣列 ArcCHECK,劑量分析采用其配套軟件 SNC Patient(軟件版本 6.7.4)。ArcCHECK 是由 1 386 個 SunPoint 半導體探頭組成的圓柱形模體,半導體探頭尺寸為 0.8 mm × 0.8 mm,靈敏體積為 0.019 mm3,呈柱形放射狀螺旋分布,有效測量直徑和長度均為 21 cm。每年對 ArcCHECK 半導體陣列進行一次矩陣校準,每次測量前進行劑量校準和本底校準。
1.3 評價指標
通過 SNC Patient 軟件對每個 VMAT 計劃的計算劑量分布和測量劑量分布進行 γ 分析。根據 TG-218 報告推薦,取最大劑量點對絕對劑量進行全局歸一,劑量閾值設為 10%,采用 3%(劑量誤差)/2 mm(距離誤差)的標準計算每個 VMAT 計劃的 γ 通過率。TG-218 報告建議:3%/2 mm 的 γ 通過率通用容差限值:≥ 95%;通用干預限值:≥ 90%。
1.4 SPC 技術分析方法
SPC 技術主要通過控制圖(control charts)對過程進行實時監控,及時發現引起過程失控的異常波動,進而識別并消除引起異常波動的特殊原因(系統誤差),將過程中的隨機誤差維持在可接受的范圍內,使過程處于穩定的受控狀態。基于 TG-218 報告中設置 IMRT/VMAT QA 過程容差限值和干預限值的流程,根據前 25 個受控的 VMAT QA 結果計算過程單值控制圖的控制限值和干預限值。單值控制圖的中心線(central line,CL)、控制上限(upper control limit,UCL)和控制下限(lower control limit,LCL)由以下公式計算得出:
![]() |
![]() |
![]() |
![]() |
![]() |
其中,X為單個 VMAT QA γ 通過率的值,MR 為移動極差(moving range),N為測量個數。控制限值即為容差限值。
干預限值由以下公式計算:
![]() |
![]() |
![]() |
其中,是干預限值作用范圍,即干預上限(upper action limit,UAL)和干預下限(lower action limit,LAL)的差,
是過程方差,T為過程目標值;常數β是兩個因子的組合,TG-218 報告中推薦取值為 6[3,10]。在使用 γ 通過率的情況下,T為 100%。由于 γ 通過率最大值為 100%,故容差限值和干預限值上限均為 100%。
另外,考慮到不同部位 VMAT 計劃復雜性不同,通過以上相同方法得到相應部位的容差限值和干預限值,并持續監測不同部位患者個體化 VMAT QA 過程。對 VMAT QA 處于失敗或處于臨界值的結果根據 TG-218 報告給出的操作流程調查相關的失控原因,以改進質控過程。
1.5 統計分析
采用 MINITAB 19 軟件進行統計學分析,計算不同部位患者個體化 VMAT QA 過程的容差限值和干預限值,并繪制不同部位的單值控制圖。
2 結果
本研究持續監測 VMAT 計劃共 287 例,并對病例數大于 25 的部位進行了分組統計,結果如表 1 所示。其中,病例數大于 25 的部位有腦部、頭頸部、腹部和盆腔部,四個部位 VMAT 計劃平均 γ 通過率均大于 97%,四組間平均 γ 通過率最大差異小于 1.2%。γ 通過率低于 95% 的比例,除盆腔部為 6.72% 外,其余三個部位均低于 5%。γ 通過率低于 90% 的比例,僅在盆腔部有 0.75%,其余三個部位均為 0。

根據每個部位前 25 例受控的調強驗證結果計算該部位 VMAT QA 過程的容差限值和干預限值,結果如表 2 所示。在計算腹部容差下限時發現第 2、6 例受到系統誤差影響(見圖 1),剔除這 2 例后,重新根據前 25 例受控結果計算腹部相關限值。對于容差下限,腦部、頭頸部和腹部相當,均大于 94%;盆腔部略低,為 92.97%。對于干預下限,腦部、頭頸部和腹部均大于 92%,盆腔部較低為 90.29%。對于整個 VMAT QA 過程,容差下限和干預下限均低于各個部位,分別為 91.46% 和 89.52%。由于 γ 通過率最大值為 100%,所有部位的容差上限和干預上限均為 100%。

紅色方塊表示 γ 通過率低于容差下限,紅色菱形表示 γ 通過率低于干預下限,綠色三角形表示糾正誤差后的 γ 通過率
Figure1. Treatment site-specific individuals (X) charts of VMAT QA processesthe red squares indicate the gamma pass rate below the LCL, and red diamonds indicate the gamma pass rate below the LAL, and green triangles indicate the gamma pass rate after error correction

根據每個部位前 25 個受控的調強驗證結果計算得到的容差限值和干預限值繪制單值控制圖,持續監測該部位的 VMAT QA 過程(見圖 1)。腦部所有 VMAT QA 驗證結果均大于 94.56%,處于統計受控中;頭頸部有 1 個 VMAT QA 驗證結果低于容差下限,腹部和盆腔部均有 2 個 VMAT QA 驗證結果低于容差下限。而且,盆腔部有 1 個 VMAT QA 驗證結果低于干預下限。對于整個 VMAT QA 過程,控制圖顯示僅有 1 個點處于統計失控狀態。根據 TG-218 報告給出的檢查和評估 IMRT/VMAT QA 失敗的操作流程探查 QA 失控原因,發現 4 例 VMAT QA 結果(頭頸部第 44 例、腹部第 2、6 例和盆腔部第 46 例)是受擺位誤差的影響(頭腳方向均偏差 1 mm),1 例 VMAT QA 結果(盆腔部第 129 例)受 ArcCHECK 校準錯誤的影響(執行校準程序時輸入了錯誤的校準劑量)。
3 討論
本文基于 TG-218 報告,利用控制圖持續監測了 287 例 VMAT 調強驗證結果,為不同部位患者個體化 VMAT QA 過程設置了相應的容差限值和干預限值。研究發現,SPC 控制圖在患者個體化 VMAT QA 監測過程中表現出良好的性能。本研究中,腦部、頭頸部、腹部和盆腔部四個部位 VMAT 計劃平均 γ 通過率均大于 97%,不同部位間平均 γ 通過率最大差異小于 1.2%。然而,通過 SPC 技術發現不同部位的容差限值和干預限值處于不同水平。其中,腦部、頭頸部和腹部 VMAT QA 過程容差下限分別為 94.56%、94.68% 和 94.34%,與 TG-218 推薦的通用容差下限(95%)較為接近;盆腔部容差下限為 92.97%,低于通用容差下限。另外,腦部、頭頸部和腹部 VMAT QA 過程干預下限均大于 92%,高于 TG-218 推薦的通用干預下限(90%);盆腔部干預下限(90.29%)則與通用干預下限相當。對于整個 VMAT QA 過程而言,容差下限為 91.46%,遠低于通用容差下限;干預下限為 89.52%,與通用干預下限基本一致。結果提示,相比腦部、頭頸部和腹部,盆腔部 VMAT 計劃還需進一步改進。另外,不同部位容差限值和干預限值處于不同水平,可能與不同部位計劃的復雜性存在差異有關[21-22],其他研究者也建議根據不同部位設置特定的限值更為合理[17,23]。
控制圖作為一種非常經濟高效的報警系統[9],有助于發現 VMAT 計劃實施過程中的重大誤差,減少臨床事故的發生。對于調強驗證結果低于干預限值的 VMAT 計劃,物理師應當馬上采取措施,調查原因并仔細評估該計劃是否能在臨床上使用。對于調強驗證結果低于容差限值的 VMAT 計劃,物理師應當調查過程變差原因,改進流程。本文根據 TG-218 報告中給出的檢查和評估 IMRT/VMAT QA 失敗或處于臨界值的操作流程,調查了各部位 VMAT QA 失控的原因。基于各部位的容差限值,總共發現 5 例 VMAT QA 結果處于失控狀態,其中 4 例(頭頸部第 44 例、腹部第 2、6 例和盆腔部第 46 例)受到擺位誤差影響(頭腳方向均偏差 1 mm),1 例(盆腔部第 129 例)受到 ArcCHECK 校準錯誤的影響(執行校準程序時輸入了錯誤的校準劑量)。因此,腹部相關限值的計算剔除了失控的第 2、6 例,這與 Sanghangthum 等[2]研究一致,剔除受特殊原因影響的失控例后,重新計算控制限值更為合理。5 例 VMAT QA 結果變差均受人為因素的影響,糾正人為誤差后,所有失控的 VMAT QA 結果均在容差下限和干預下限內。另外,在測量過程中不可能完全消除擺位誤差,而調強驗證的結果受計劃系統誤差、MLC 誤差、擺位和射野誤差以及 QA 軟件誤差等的綜合影響,通過 SPC 技術可將綜合誤差控制在可接受的范圍內[3,24]。因此,對于同批次測量中存在擺位誤差但仍在容差限值范圍內的結果,不會影響相關臨床流程及結果,因此無需修正。結果表明,本中心臨床 VMAT QA 過程處于統計控制狀態。然而,若采用 TG-218 報告推薦的通用容差限值調查 VMAT QA 失控原因,顯示共有 18 例(占比 6.27%)處于失控狀態。對各部位低于 TG-218 通用容差限值但高于該部位容差限值的 13 例 VMAT QA 結果進行進一步調查,并未發現可顯著提高 γ 通過率的相關特殊原因。因此,采用 TG-218 報告通用容差限值監測整個 VMAT QA 過程,可能會增加 VMAT QA 過程失控的誤報率,加大物理師調查過程失控原因的難度。
先前的研究將 SPC 技術應用到 IMRT/VMAT QA 過程中已經得到一些臨床經驗,這些研究中提到的控制下限(LCL)即為容差下限。Sanghangthum 等[2]利用 ArcCHECK,采用 3%/3 mm 的標準、10% 的劑量閾值,基于前 50 個受控點得到頭頸部(鼻咽癌)VMAT QA 過程容差下限為 90.3%,IMRT QA 為 85.0%,而本研究中根據前 25 個受控點得到的頭頸部 3%/2 mm 標準的 γ 通過率容差限值為 94.7%。Gagneur 等[11]利用 MapCHECK,采用 3%/3 mm 的標準、10% 的劑量閾值,基于前 25 個受控點得到 IMRT QA 過程容差下限為 93.7%。Lee 等[25]利用 MapCHECK 和 ArcCHECK,采用 3%/3 mm 的標準得到頭頸部 IMRT QA 容差下限為 98.8%,前列腺 IMRT QA 容差下限為 98.1%,乳腺 IMRT QA 容差下限為 83.4%,乳腺 VMAT QA 容差下限為 85.4%。Fuangrod 等[13]利用 EPID,采用 4%/4 mm 的標準進行了 IMRT 和 VMAT 在體劑量驗證,根據 90 個 IMRT 計劃共 13 155 個射野計算得到 IMRT QA 容差下限為 62.5%,根據 10 個 VMAT 計劃共 372 個射野計算得到 VMAT QA 容差下限為 70.0%。Bellec 等[14]利用 EBT3 膠片,采用 3%/1 mm 的標準分析了 CyberKnife 計劃的 γ 通過率,根據 350 個 QA 結果計算得到容差下限為 88%。這些研究基于不同的工具、不同的標準采用 γ 通過率評估了 IMRT/VMAT QA 結果,然而得到的過程容差限值卻無法進行比較。TG-218 報告針對該問題對使用 γ 通過率的情況給出了建議,對絕對劑量進行全局歸一,采用 3%/2 mm 的標準,劑量閾值設為 10%[3]。本研究基于 TG-218 報告中推薦的 SPC 方法,得到了本中心不同部位 VMAT QA 過程的容差限值和干預限值。本中心 VMAT QA 過程干預限值與 TG-218 報告通用干預限值相當,而盆腔部容差下限低于通用容差限值,還需進一步改進流程。
4 結論
SPC 技術是一種監測 VMAT QA 過程的非常經濟、有效的方法,有助于發現影響過程失控的因素,改進質控過程。TG-218 報告給出的基于流程的容差限值和干預限值的操作建議,有助于實現 IMRT/VMAT QA 實施過程的標準化,提高多中心之間的對比性。此外,采用通用容差限值會增加誤報率,根據不同部位設置相應的容差限值更為合理。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
引言
當前,調強適形放療(intensity-modulated radiation therapy,IMRT)和容積旋轉調強放療(volumetric modulated arc therapy,VMAT)采用非均勻射束強度,在提高靶區劑量的同時進一步減少周圍危及器官的受照劑量,已經成為很多疾病外照射放療采用的標準治療方式[1-3]。相比三維適形放療(three-dimensional conformal radiotherapy,3D-CRT),IMRT/VMAT 技術更復雜,需要更全面的質量保證(quality assurance,QA)措施,以實現精確放療實施和保障患者安全[4-5]。其中,患者個體化 IMRT/VMAT QA 過程是臨床調強放療實施流程中重要的一部分[6-7]。治療前劑量驗證分析主要是通過評估計算劑量和測量劑量之間的偏差是否在臨床可接受范圍,對于超出范圍的結果則進行調查以找出造成該結果的原因,并采取糾正措施[8]。然而,計算劑量與實施劑量之間差異的容差限值和干預限值在各中心之間尚缺乏統一的標準[3],且僅基于臨床干預限值評估患者個體化 QA 結果無法有效改進質控過程。統計過程控制(statistical process control,SPC)作為一種功能強大的分析性決策工具,基于過程本身通過統計分析來監視過程行為,在過程變差前發出警報,實現過程穩定性并減少過程可變性[9],近十年來已逐漸用于放療質控過程的監測[8,10-20]。美國醫學物理家協會(American Association of Physicists in Medicine,AAPM)在先前研究的基礎上對患者個體化 IMRT/VMAT QA 過程進行了詳細概括,制定了推動其一致性發展的 TG-218 報告[3]。該報告推薦應用 SPC 技術設定基于流程的容差限值和干預限值,以監測整個 IMRT/VMAT QA 過程的受控狀態,并推薦使用通用的容差限值和干預限值。然而,臨床上不同部位放療計劃的復雜性是不同的[21-22],基于不同部位設定相應的容差限值和干預限值才更為合理。本研究基于 TG-218 報告,評估了 SPC 技術在監測患者個體化 VMAT QA 過程中的有效性,為不同部位 VMAT QA 過程設定適合的容差限值和干預限值,并根據控制圖探查了 VMAT QA 過程失控的原因。
1 材料與方法
1.1 研究對象
選取四川大學華西醫院放療科 2019 年 1 月至 2019 年 11 月的 287 例 VMAT 計劃進行調強驗證。VMAT 計劃納入標準:① 治療加速器采用同一臺瑞典醫科達 Synergy 直線加速器;② 計劃設計采用瑞典 RaySearch 公司 Raystation 放療計劃系統(treatment planning system,TPS);③ 計劃采用 6 MV 光子束均整(flattening filter,FF)模式,最大劑量率為 600 MU/min。該研究已通過華西醫院倫理委員會審查,在中國臨床試驗注冊中心獲得注冊號:ChiCTR1900028032,并免除了知情同意書。
1.2 儀器與軟件
治療加速器采用瑞典醫科達 Synergy 直線加速器,配備 Agility 治療機頭,共有 80 對多葉準直器(multi-leaf collimator,MLC)葉片。劑量測量采用美國 Sun Nuclear 公司螺旋形半導體探測器陣列 ArcCHECK,劑量分析采用其配套軟件 SNC Patient(軟件版本 6.7.4)。ArcCHECK 是由 1 386 個 SunPoint 半導體探頭組成的圓柱形模體,半導體探頭尺寸為 0.8 mm × 0.8 mm,靈敏體積為 0.019 mm3,呈柱形放射狀螺旋分布,有效測量直徑和長度均為 21 cm。每年對 ArcCHECK 半導體陣列進行一次矩陣校準,每次測量前進行劑量校準和本底校準。
1.3 評價指標
通過 SNC Patient 軟件對每個 VMAT 計劃的計算劑量分布和測量劑量分布進行 γ 分析。根據 TG-218 報告推薦,取最大劑量點對絕對劑量進行全局歸一,劑量閾值設為 10%,采用 3%(劑量誤差)/2 mm(距離誤差)的標準計算每個 VMAT 計劃的 γ 通過率。TG-218 報告建議:3%/2 mm 的 γ 通過率通用容差限值:≥ 95%;通用干預限值:≥ 90%。
1.4 SPC 技術分析方法
SPC 技術主要通過控制圖(control charts)對過程進行實時監控,及時發現引起過程失控的異常波動,進而識別并消除引起異常波動的特殊原因(系統誤差),將過程中的隨機誤差維持在可接受的范圍內,使過程處于穩定的受控狀態。基于 TG-218 報告中設置 IMRT/VMAT QA 過程容差限值和干預限值的流程,根據前 25 個受控的 VMAT QA 結果計算過程單值控制圖的控制限值和干預限值。單值控制圖的中心線(central line,CL)、控制上限(upper control limit,UCL)和控制下限(lower control limit,LCL)由以下公式計算得出:
![]() |
![]() |
![]() |
![]() |
![]() |
其中,X為單個 VMAT QA γ 通過率的值,MR 為移動極差(moving range),N為測量個數。控制限值即為容差限值。
干預限值由以下公式計算:
![]() |
![]() |
![]() |
其中,是干預限值作用范圍,即干預上限(upper action limit,UAL)和干預下限(lower action limit,LAL)的差,
是過程方差,T為過程目標值;常數β是兩個因子的組合,TG-218 報告中推薦取值為 6[3,10]。在使用 γ 通過率的情況下,T為 100%。由于 γ 通過率最大值為 100%,故容差限值和干預限值上限均為 100%。
另外,考慮到不同部位 VMAT 計劃復雜性不同,通過以上相同方法得到相應部位的容差限值和干預限值,并持續監測不同部位患者個體化 VMAT QA 過程。對 VMAT QA 處于失敗或處于臨界值的結果根據 TG-218 報告給出的操作流程調查相關的失控原因,以改進質控過程。
1.5 統計分析
采用 MINITAB 19 軟件進行統計學分析,計算不同部位患者個體化 VMAT QA 過程的容差限值和干預限值,并繪制不同部位的單值控制圖。
2 結果
本研究持續監測 VMAT 計劃共 287 例,并對病例數大于 25 的部位進行了分組統計,結果如表 1 所示。其中,病例數大于 25 的部位有腦部、頭頸部、腹部和盆腔部,四個部位 VMAT 計劃平均 γ 通過率均大于 97%,四組間平均 γ 通過率最大差異小于 1.2%。γ 通過率低于 95% 的比例,除盆腔部為 6.72% 外,其余三個部位均低于 5%。γ 通過率低于 90% 的比例,僅在盆腔部有 0.75%,其余三個部位均為 0。

根據每個部位前 25 例受控的調強驗證結果計算該部位 VMAT QA 過程的容差限值和干預限值,結果如表 2 所示。在計算腹部容差下限時發現第 2、6 例受到系統誤差影響(見圖 1),剔除這 2 例后,重新根據前 25 例受控結果計算腹部相關限值。對于容差下限,腦部、頭頸部和腹部相當,均大于 94%;盆腔部略低,為 92.97%。對于干預下限,腦部、頭頸部和腹部均大于 92%,盆腔部較低為 90.29%。對于整個 VMAT QA 過程,容差下限和干預下限均低于各個部位,分別為 91.46% 和 89.52%。由于 γ 通過率最大值為 100%,所有部位的容差上限和干預上限均為 100%。

紅色方塊表示 γ 通過率低于容差下限,紅色菱形表示 γ 通過率低于干預下限,綠色三角形表示糾正誤差后的 γ 通過率
Figure1. Treatment site-specific individuals (X) charts of VMAT QA processesthe red squares indicate the gamma pass rate below the LCL, and red diamonds indicate the gamma pass rate below the LAL, and green triangles indicate the gamma pass rate after error correction

根據每個部位前 25 個受控的調強驗證結果計算得到的容差限值和干預限值繪制單值控制圖,持續監測該部位的 VMAT QA 過程(見圖 1)。腦部所有 VMAT QA 驗證結果均大于 94.56%,處于統計受控中;頭頸部有 1 個 VMAT QA 驗證結果低于容差下限,腹部和盆腔部均有 2 個 VMAT QA 驗證結果低于容差下限。而且,盆腔部有 1 個 VMAT QA 驗證結果低于干預下限。對于整個 VMAT QA 過程,控制圖顯示僅有 1 個點處于統計失控狀態。根據 TG-218 報告給出的檢查和評估 IMRT/VMAT QA 失敗的操作流程探查 QA 失控原因,發現 4 例 VMAT QA 結果(頭頸部第 44 例、腹部第 2、6 例和盆腔部第 46 例)是受擺位誤差的影響(頭腳方向均偏差 1 mm),1 例 VMAT QA 結果(盆腔部第 129 例)受 ArcCHECK 校準錯誤的影響(執行校準程序時輸入了錯誤的校準劑量)。
3 討論
本文基于 TG-218 報告,利用控制圖持續監測了 287 例 VMAT 調強驗證結果,為不同部位患者個體化 VMAT QA 過程設置了相應的容差限值和干預限值。研究發現,SPC 控制圖在患者個體化 VMAT QA 監測過程中表現出良好的性能。本研究中,腦部、頭頸部、腹部和盆腔部四個部位 VMAT 計劃平均 γ 通過率均大于 97%,不同部位間平均 γ 通過率最大差異小于 1.2%。然而,通過 SPC 技術發現不同部位的容差限值和干預限值處于不同水平。其中,腦部、頭頸部和腹部 VMAT QA 過程容差下限分別為 94.56%、94.68% 和 94.34%,與 TG-218 推薦的通用容差下限(95%)較為接近;盆腔部容差下限為 92.97%,低于通用容差下限。另外,腦部、頭頸部和腹部 VMAT QA 過程干預下限均大于 92%,高于 TG-218 推薦的通用干預下限(90%);盆腔部干預下限(90.29%)則與通用干預下限相當。對于整個 VMAT QA 過程而言,容差下限為 91.46%,遠低于通用容差下限;干預下限為 89.52%,與通用干預下限基本一致。結果提示,相比腦部、頭頸部和腹部,盆腔部 VMAT 計劃還需進一步改進。另外,不同部位容差限值和干預限值處于不同水平,可能與不同部位計劃的復雜性存在差異有關[21-22],其他研究者也建議根據不同部位設置特定的限值更為合理[17,23]。
控制圖作為一種非常經濟高效的報警系統[9],有助于發現 VMAT 計劃實施過程中的重大誤差,減少臨床事故的發生。對于調強驗證結果低于干預限值的 VMAT 計劃,物理師應當馬上采取措施,調查原因并仔細評估該計劃是否能在臨床上使用。對于調強驗證結果低于容差限值的 VMAT 計劃,物理師應當調查過程變差原因,改進流程。本文根據 TG-218 報告中給出的檢查和評估 IMRT/VMAT QA 失敗或處于臨界值的操作流程,調查了各部位 VMAT QA 失控的原因。基于各部位的容差限值,總共發現 5 例 VMAT QA 結果處于失控狀態,其中 4 例(頭頸部第 44 例、腹部第 2、6 例和盆腔部第 46 例)受到擺位誤差影響(頭腳方向均偏差 1 mm),1 例(盆腔部第 129 例)受到 ArcCHECK 校準錯誤的影響(執行校準程序時輸入了錯誤的校準劑量)。因此,腹部相關限值的計算剔除了失控的第 2、6 例,這與 Sanghangthum 等[2]研究一致,剔除受特殊原因影響的失控例后,重新計算控制限值更為合理。5 例 VMAT QA 結果變差均受人為因素的影響,糾正人為誤差后,所有失控的 VMAT QA 結果均在容差下限和干預下限內。另外,在測量過程中不可能完全消除擺位誤差,而調強驗證的結果受計劃系統誤差、MLC 誤差、擺位和射野誤差以及 QA 軟件誤差等的綜合影響,通過 SPC 技術可將綜合誤差控制在可接受的范圍內[3,24]。因此,對于同批次測量中存在擺位誤差但仍在容差限值范圍內的結果,不會影響相關臨床流程及結果,因此無需修正。結果表明,本中心臨床 VMAT QA 過程處于統計控制狀態。然而,若采用 TG-218 報告推薦的通用容差限值調查 VMAT QA 失控原因,顯示共有 18 例(占比 6.27%)處于失控狀態。對各部位低于 TG-218 通用容差限值但高于該部位容差限值的 13 例 VMAT QA 結果進行進一步調查,并未發現可顯著提高 γ 通過率的相關特殊原因。因此,采用 TG-218 報告通用容差限值監測整個 VMAT QA 過程,可能會增加 VMAT QA 過程失控的誤報率,加大物理師調查過程失控原因的難度。
先前的研究將 SPC 技術應用到 IMRT/VMAT QA 過程中已經得到一些臨床經驗,這些研究中提到的控制下限(LCL)即為容差下限。Sanghangthum 等[2]利用 ArcCHECK,采用 3%/3 mm 的標準、10% 的劑量閾值,基于前 50 個受控點得到頭頸部(鼻咽癌)VMAT QA 過程容差下限為 90.3%,IMRT QA 為 85.0%,而本研究中根據前 25 個受控點得到的頭頸部 3%/2 mm 標準的 γ 通過率容差限值為 94.7%。Gagneur 等[11]利用 MapCHECK,采用 3%/3 mm 的標準、10% 的劑量閾值,基于前 25 個受控點得到 IMRT QA 過程容差下限為 93.7%。Lee 等[25]利用 MapCHECK 和 ArcCHECK,采用 3%/3 mm 的標準得到頭頸部 IMRT QA 容差下限為 98.8%,前列腺 IMRT QA 容差下限為 98.1%,乳腺 IMRT QA 容差下限為 83.4%,乳腺 VMAT QA 容差下限為 85.4%。Fuangrod 等[13]利用 EPID,采用 4%/4 mm 的標準進行了 IMRT 和 VMAT 在體劑量驗證,根據 90 個 IMRT 計劃共 13 155 個射野計算得到 IMRT QA 容差下限為 62.5%,根據 10 個 VMAT 計劃共 372 個射野計算得到 VMAT QA 容差下限為 70.0%。Bellec 等[14]利用 EBT3 膠片,采用 3%/1 mm 的標準分析了 CyberKnife 計劃的 γ 通過率,根據 350 個 QA 結果計算得到容差下限為 88%。這些研究基于不同的工具、不同的標準采用 γ 通過率評估了 IMRT/VMAT QA 結果,然而得到的過程容差限值卻無法進行比較。TG-218 報告針對該問題對使用 γ 通過率的情況給出了建議,對絕對劑量進行全局歸一,采用 3%/2 mm 的標準,劑量閾值設為 10%[3]。本研究基于 TG-218 報告中推薦的 SPC 方法,得到了本中心不同部位 VMAT QA 過程的容差限值和干預限值。本中心 VMAT QA 過程干預限值與 TG-218 報告通用干預限值相當,而盆腔部容差下限低于通用容差限值,還需進一步改進流程。
4 結論
SPC 技術是一種監測 VMAT QA 過程的非常經濟、有效的方法,有助于發現影響過程失控的因素,改進質控過程。TG-218 報告給出的基于流程的容差限值和干預限值的操作建議,有助于實現 IMRT/VMAT QA 實施過程的標準化,提高多中心之間的對比性。此外,采用通用容差限值會增加誤報率,根據不同部位設置相應的容差限值更為合理。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。