引用本文: 張甲翠, 劉姝嬈, 劉華, 蔡曦光, 宋攀, 吳晚舟, 孫麗娜, 羅云霞, 魏海東. 吡非尼酮對特發性肺纖維化療效的Meta分析. 中國呼吸與危重監護雜志, 2015, 14(6): 569-576. doi: 10.7507/1671-6205.2015138 復制
特發性肺纖維化(IPF)是一種病因不明的慢性肺間質性疾病,其臨床表現為進行性呼吸困難以及肺功能不可逆性逐漸惡化,它的病理特征主要是各種原因所致的肺泡上皮細胞損傷和不正常的組織修復,從而逐漸導致肺纖維化。在缺乏肺移植時IPF 3~5年死亡率分別約為50%和80%[1-2],以存活時間短、病死率高、病情進行性惡化為特點,所以強調早期診斷和最佳治療的必要性。到目前為止,臨床試驗對治療IPF的一些新藥物進行了評估,包括雙重內皮素受體拮抗劑波生坦[3]、γ干擾素[4]、伊馬替尼、依那西普[5]、西地那非[6]與安慰劑對照藥理試驗的結果,試驗結果一直令人失望。吡非尼酮(甲苯吡啶酮)化學名為5-甲基-l苯基-2(IH)-吡啶酮,相對分子質量為185.22,是一種較新的、口服的抗纖維化藥物,獲得美國食品藥品監督管理局(FDA)批準,是第一個通過重復、隨機、安慰劑對照的第三階段臨床試驗的藥物。研究證明口服吡非尼酮36~72周能夠明顯影響IPF患者的第1秒用力呼氣容積占用力肺活量(FVC)的百分率,具有統計學意義,而且與糖皮質激素、免疫抑制劑相比較,安全性更高[7]。1998年在日本對107例IPF患者進行了1年開放標簽的雙盲、安慰劑對照的吡非尼酮的臨床二期試點試驗。與吡非尼酮組相比,大量安慰劑組患者的病情急劇惡化,這項研究被提前終止。這項試驗證實了接受吡非尼酮的患者在9個月內肺功能下降程度減緩。基于這個陽性結果,又對確診的輕度至中度肺功能障礙IPF患者進行了第三階段的試驗。與安慰劑對照組相比,高劑量吡非尼酮組的肺活量發生了明顯的改變,并具有統計學意義;低劑量吡非尼酮組和安慰劑組間也有顯著的差異。相比較而言,吡非尼酮具有良好的耐受性,其主要的不良反應為光敏感、肝功損害及胃腸道不適[8-10]。2011年初公布了在歐洲和北美進行的兩項多國籍、隨機、雙盲試驗,結果顯示,在FVC%pred變化率、FVC絕對改變量以及無疾病進展生存時間(PFS)的改變,吡非尼酮組的療效均顯著優于安慰劑對照組。2 403 mg/d的劑量相對安全并且耐受性良好。應用吡非尼酮和安慰劑的患者中,引起突發的嚴重的不良反應的患者的百分率沒有差異。治療組中惡心、腹瀉是最常見的胃腸道不良反應。若出現3或4級惡心或腹瀉,將終止治療,但胃腸道不適一般為輕至中度,很少導致治療停藥[11]。因此,在若干隨機、雙盲、安慰劑對照研究中,唯一被證明有臨床療效的藥物是吡非尼酮。
基于現有各項研究,我們進行了一項系統性評價吡非尼酮對IPF的療效和安全性的Meta分析。近年來循證醫學的快速發展為醫藥行業的發展提供了更有力的就醫用藥證據。目前世界上公認的循證醫學最高證據為隨機對照試驗,它是驗證臨床干預措施療效的標準設計方案。要想得出合理而真實的試驗結果,試驗設計者必須能夠完善地描述整個臨床試驗的設計、實施、分析和解釋全過程,只有這樣才能提高結果的真實性,為以后的臨床決策提供可靠有力的證據。為此,國際上著名的CONSORT(Consolidated Standards of Reporting Trials)聲明明確提出了隨機對照臨床試驗報告的規范,為廣大臨床醫生開展臨床研究提供了更好的方法學依據。其目的旨在提高臨床隨機對照試驗報告的質量和真實性。就循證醫學而言,目前用于指導臨床決策的最可靠證據是大樣本、多中心的隨機雙盲對照試驗和系統評價。我們采用國際公認的CONSORT標準對本系統評價納入的有關吡非尼酮治療肺纖維化的隨機對照試驗進行報告質量評價,以了解臨床對照試驗的報告質量。
資料與方法
一 納入和排除標準
1.納入標準:(1)研究類型:關于吡非尼酮對IPF治療作用及不良反應的對照試驗,且不受語種及發表限制,無論是否采用盲法。(2)研究對象:符合2011年3月美國呼吸危重癥雜志全文發表的IPF診治指南上的診斷標準,不受年齡、病程限制。
2.排除標準:(1)動物實驗研究;(2)理論探討;(3)綜述及經驗總結;(4)個案報道;(5)重復發表文獻;(6)文獻未設對照組;(7)統計方法不恰當;(8)文獻試驗設計不嚴謹;(9)Meta分析類文章等。
二 干預措施
試驗組:吡非尼酮加減治療;對照組:同等劑量安慰劑,其他干預措施相同。
三 結局指標
1.主要指標:(1)肺活量變化(changes in VC);(2)6分鐘步行試驗最低氧分壓變化(changes in lowest SpO2);(3)無疾病進展生存時間(PFS)。
2.次要指標:(1)用力肺活量(FVC);(2)靜息下肺總量(TLC);(3)肺一氧化碳彌散量(DLCO)變化。
3.終點指標:(1)死亡;(2)主要不良反應:①光敏性(photosensitivity);②頭暈(dizziness);③關節痛(joint pain)等。
四 檢索策略
計算機檢索PubMed、Cochrane Library、中國期刊全文數據庫(CNKI)、中國生物醫學文獻數據庫(CBM)、萬方數據庫、中文科技期刊全文數據庫(VIP)。檢索時間截至2014年5月。同時補充用Google Scholar、百度等搜索引擎在互聯網上查找相關的文獻,追查已納入文獻的參考文獻,以獲取以上檢索未發現的相關信息。所有檢索策略經多次檢索后確定。
1.英文檢索式:
#1:Search “pulmonary fibrosis”[Mesh]
#2:Search(pulmonary fibrosis[Title/Abstract]) OR Fibrosing Alvelitides[Title/Abstract]) OR Fibrosing Alvelitis[Title/Abstract]) OR Pulmonary Fibroses[Title/Abstract]) OR hamman-rich syndrome[Title/Abstract])
#3:Search “Pirfenidone”[Supplementary Concept]
#4:Search (Pirfenidone[Title/Abstract]) OR pirespa[Title/Abstract]) OR deskar[Title/Abstract]
#5:#1 OR #2
#6:#3 OR #4
#7:#5 AND #6
2.中文檢索式:題名或關鍵詞(“肺纖維化”)+題名或關鍵詞(“肺間質病”)+題名或關鍵詞(“肺間質纖維化”)+題名或關鍵詞(“肺纖維變性”)+題名或關鍵詞(“肺間質性病”)*題名或關鍵詞(“吡非尼酮”)*Date:-2014。
五 文獻質量評價與資料提取
由2名研究人員根據納入與排除標準,獨立篩選檢索到的文獻,然后將篩選結果相互比對,如有分歧則進行討論,必要時請第3名研究人員協助決定其是否納入。對資料不全或描述不清楚的文獻,通過電話或郵件方式聯系作者以獲取缺失資料。提取資料內容包括第一作者姓名、發表時間、干預措施、對照措施、結局指標等。
按照臨床流行病學和循證醫學的原則,根據Cochrane手冊所推薦的偏倚風險評估工具,對納入的研究主要從選擇(包括隨機序列產生和分配隱藏)、實施(包括對研究者和受試者施盲)、測量(研究結局盲法評價)、隨訪(結局數據的完整性)、報告(選擇性報告研究結果)及其他(其他偏倚來源)這6個方面總計7個條目對偏倚風險進行評價。根據納入排除標準篩選文獻,并按預先確定的表格提取資料。針對每一個研究,對上述6個方面總計7個條目作出“是”(低風險偏倚)、“否”(高風險偏倚)和“不清楚”(缺乏相關信息或偏倚情況不確定)的評價[12-15]。
六 統計學處理
采用Cochrane協作網RevMan5.2做Meta分析。對納入的研究首先進行異質性檢驗,若納入的各研究具有同質性(P>0.1,I2<50%),使用固定效應模型計算合并統計量;若納入的各研究異質性較明顯(P<0.1,I2>50),則使用隨機效應模型計算合并統計量。計數資料采用相對危險度(RR)或比值比(OR)及其95%可信區間(95%CI),計量資料采用加權均數差(WMD)及其95%CI表示;當測量單位不同時,則選擇標化均數差(SMD)及其95%CI。Meta分析的結果采用森林圖表示。P≤0.05為差異有統計學意義。敏感性分析采用去除納入標準差別較大的研究后進行重新分析,缺失或失訪病例應將其作為治療失敗進行敏感性分析,即“最差情況演示分析”(“worst-case” scenario analysis),此外還進行排除高質量研究后所余文獻的敏感性分析。潛在的發表偏倚采用“倒漏斗”圖示分析,即試驗樣本大小與效應的回歸圖示分析。漏斗圖是根據從單個研究估計得出的危險度值(X軸)與每項研究的樣本量(Y軸)所做的散點圖。效應值的準確性隨樣本量的增加而增加,小樣本研究的估計值應該散在、寬廣地分布在圖形底部,而大樣本研究的估計值相對集中地分布在圖形中部或頂部,在沒有偏倚的情況下,呈現對稱的倒漏斗狀。
結果
一 檢索結果
共檢索出有關文獻285篇,其中PubMed 171篇,Cochrane Library 34篇,萬方14篇,CNKI 26篇,CBM 24篇,維普16篇。去重9篇,然后由2名研究人員通過文獻標題、摘要排除明顯不符合標準的文獻254篇。再通過閱讀全文,根據納入與排除標準排除17篇。本研究最終納入6篇試驗研究[10-11, 16-19],其中5篇為隨機對照試驗研究[10-11, 16, 18-19],1篇為對照研究[17],均為外文文獻。符合納入標準的6篇文獻中,對照組給藥為安慰劑。各研究例數最多者435例,最少者21例,共1 172例患者。文獻篩選流程及結果見圖 1。

二 納入研究的一般特征和質量評價
我們提取了各納入研究的基本資料,包括發表年限、納入病例數、作者、具體干預措施、療程等組間基線特征。各研究實驗組與對照組基線相似性較好。納入的5篇文獻采用隨機對照、雙盲方法研究,亦采用隱蔽分組。納入文獻一般特征見表 1,納入文獻的方法學質量評價見表 2。


三 肺纖維化癥狀及體征改善的總有效率分析
1.治療前后肺活量變化率的Meta分析:納入的6篇文獻中結局指標有肺活量變化的2篇文獻[10, 16]進行Meta分析,結果吡非尼酮組和安慰劑組的治療前后肺活量變化率差異有統計學意義。Meta分析結果:兩個吡非尼酮藥物治療肺纖維化的研究資料具有同質性(異質性檢驗χ2=1.03,P=0.31),合并效應量WMD采用固定效應模型,合并后為0.06,其95%CI為(0.01,0.12),合并效應量的檢驗,Z=2.48,P=0.01。根據此分析結果,可認為吡非尼酮藥物組病死率與安慰劑組比較差異有統計學意義。兩個研究中有1個研究的95%CI橫線與無效豎線相交,表明該研究結果認為吡非尼酮不會提高肺纖維化疾病的治療前后肺活量變化率;另有1個研究的95%CI橫線落在無效豎線右側,故可認為吡非尼酮藥物在提高肺纖維化疾病的治療前后肺活量有效。森林圖見圖 2。

2.治療前后6分鐘步行實驗中最低氧分壓變化的Meta分析:納入的6篇文獻中結局指標有肺活量變化的2篇文獻[10, 16]進行Meta分析,結果吡非尼酮組和安慰劑組的治療前后6分鐘步行實驗中最低氧分壓變化差異無統計學意義。Meta分析結果:2個吡非尼酮藥物治療肺纖維化的研究資料具有異質性(異質性檢驗χ2=8.90,P=0.003),合并效應量WMD采用隨機效應模型,合并后為0.82,其95%CI為(-1.35,2.98),合并效應量的檢驗,Z=0.74,P=0.46。根據此分析結果,可認為吡非尼酮藥物組病死率與安慰劑組比較差異無統計學意義。兩個研究中有1個的95%CI橫線與無效豎線相交,表明該研究結果認為吡非尼酮不會提高肺纖維化疾病的治療前后6分鐘步行實驗中最低氧分壓;另有1個研究的95%CI橫線落在無效豎線右側,故可認為吡非尼酮藥物在提高肺纖維化疾病的治療前后6分鐘步行實驗中最低氧分壓無效。森林圖見圖 3。

3.治療前后總肺容量、肺一氧化碳彌散量、用力肺活量變化率以及無進展生存時間分析:納入的6篇文獻中結局指標有以上指標的有3篇文獻[10-11, 16],數據無法統一進行Meta分析,Azuma等[10]的實驗結果是試驗組和對照組差異無統計學意義。
4. 吡非尼酮組和安慰劑組病死率的Meta分析:對納入的5篇文獻[10-11, 16-18]進行Meta分析,結果吡非尼酮組和安慰劑組的病死率差異無統計學意義。Meta分析結果:5個吡非尼酮藥物治療肺纖維化的研究資料具有同質性(異質性檢驗χ2=3.05,P=0.55),合并效應量RR采用固定效應模型,RR合并=0.62,其95%CI為(0.37,1.03),合并效應量的檢驗,Z=1.85,P=0.06。根據此分析結果,可認為吡非尼酮藥物組病死率與安慰劑組比較差異無統計學意義。5項研究中有4個的95%CI橫線與無效豎線相交,表明該4個研究結果均認為吡非尼酮不會減少肺纖維化疾病的病死率,另有1個研究的95%CI橫線落在無效豎線左側,故可認為吡非尼酮藥物在減少肺纖維化疾病的病死率無效。森林圖見圖 4。

四 不良反應
1.吡非尼酮組和安慰劑組對光敏感發生率的Meta分析:將納入的5篇文獻[10-11, 16-18]對光敏感發生例數作為有效數據作圖,結果吡非尼酮組的對光敏感發生率高于安慰劑組,差異有統計學意義。森林圖見圖 5。

2.吡非尼酮組和安慰劑組頭暈發生率的Meta分析:將納入的6篇文獻報道發生頭暈的4篇文獻[11, 16-18]進行分析,將發生頭暈例數作為有效數據作圖,結果吡非尼酮組的頭暈發生率高于安慰劑組,差異有統計學意義。森林圖見圖 6。

3.吡非尼酮組和安慰劑組關節痛發生率的Meta 分析:將納入的6篇文獻報道關節痛的3篇文獻[11, 17-18]進行分析(將發生關節痛例數作為有效數據作圖),結果吡非尼酮組和安慰劑組的關節痛發生率差異無統計學差異。森林圖見圖 7。

五 發表偏倚
將6篇文獻中吡非尼酮對IPF和安慰劑組治療進行發表偏倚的漏斗圖分析(圖 8),結果表明圖形對稱性一般,存在發表偏倚,提示可能存在發表偏倚以及試驗方法學質量低下。

六 敏感性分析
由于納入文獻數量較少、質量較高,無法作排除陰性結果、高質量研究后所余文獻的敏感性分析,同時所納入研究均報道失訪或退出病例,但具體數據未報道,因而也不能將失訪病例作為治療失敗進行敏感性分析。
討論
Azuma等[10]2000年在日本進行隨機、雙盲、安慰劑對照的吡非尼酮治療IPF的Ⅱ期臨床試驗,其主要指標為6分鐘步行試驗中最低脈搏血氧飽和度最低值的變化,107例IPF患者被隨機分成兩組,接受吡非尼酮(72例,最大劑量為1 800 mg/d)或安慰劑(35例)治療。試驗結果表明吡非尼酮治療6個月及9個月時,血氧飽和度有明顯提高,9個月時肺活量明顯升高(P=0.036);在次要指標方面,吡非尼酮組肺活量下降幅度及急性加重的發生率明顯低于安慰劑組,而對照組9個月期間出現病情惡化。由于安慰劑對照組IPF急性加重發生率高于試驗組,該臨床試驗被數據安全及監督委員會(DSMB)提前終止。現有的臨床試驗證據并不足以支持吡非尼酮成為IPF的治療用藥,2011指南中不推薦使用此類藥物。最新發表的由Taniguchi等[16]在日本進行的吡非尼酮臨床試驗,275例IPF患者隨機分為吡非尼酮低劑量組、高劑量組和安慰劑對照組。經52周隨訪,主要終點指標肺活量下降的速率在吡非尼酮高劑量組優于組安慰劑對照組(-0.09 L比-0.16 L,P=0.04),低劑量組也優于安慰劑對照組(-0.08 L比-0.16 L,P=0.039)。52周內無疾病進展生存期(指肺活量較基線值下降≥10%以上或死亡)差異也有統計學意義(P=0.028)。與其他多項臨床試驗比較,該研究首次證實藥物吡非尼酮減緩IPF疾病的進展。基于該項臨床試驗結果,日本厚生勞動省在2008年10月批準吡非尼酮用于治療IPF,吡非尼酮成為第一個在全球獲得批準用于治療IPF的藥物。但著名的間質性肺疾病專家Collard針對Taniguchi等[16]臨床試驗設計及觀察過程中的問題,對該研究結論的可靠性提出了質疑。Taniguchi等[16]進行的一項Ⅲ期臨床試驗顯示,吡非尼酮可以提高患者的FVC,而且患者的耐受性較好。因此,對少數患者該藥物可能是合理的選擇(弱推薦,低-中等質量證據)[20]。
基于使用吡非尼酮時出現提前撤藥的情況以及其在臨床試驗的結果報道差異較大,我們做一個Meta分析檢查吡非尼酮治療肺纖維化的療效性與安全性,是及時和至關重要的。基于現有的證據,吡非尼酮治療IPF似乎療效沒有那么顯著、不那么安全或患者耐受不那么良好。根據CONSORT標準,本研究納入的6篇隨機對照試驗的報告質量欠佳,從表中可以看出,沒有一篇文獻對治療依從性、藥物的質量控制標準和方法、樣本量估計、隨機分配方案的隱藏和實施、受試對象流程圖、意向性治療分析進行描述;雖然有文獻描述了隨機分配的方法,但大部分文獻未采用盲法,也未結合可能存在的偏倚解釋結果和概括證據;對于退出/失訪的報告也不多;文獻涉及到終點指標觀察設計不合理;雖然報告了不良反應,但對于不良反應的報告都不規范。總之,從這6篇文獻的報告質量評價中可以看出,大部分研究的方法學及結果部分報告不夠詳細,勢必影響研究結論的可靠性。同時,發表偏倚的漏斗圖分析提示可能存在發表偏倚以及試驗方法學質量低下。通常,發表偏倚提示陰性結果的試驗可能存在未發表、語言性偏倚、科研人員離開原單位導致研究未能發表造成的偏倚、多重發表性偏倚、補救性偏倚等[15],也可能與試驗組與對照組采用的藥物種類、劑量、療程的不同,以及試驗樣本偏小等有關。因此,我們建議盡量采用隨機雙盲對照,建立終點指標觀察,規范報告不良反應,在受試對象流程圖、退出/失訪、意向性分析以及重要指標結果報告完整性方面要特別加強,按照CONSORT標準來報告隨機對照試驗,以提高臨床隨機對照試驗報告的質量和真實性。
一 主要終點指標改變的問題
主要終點指標應能反映檢驗的假設、藥物的有效性或安全性,通常只有一個。主要研究終點也可用主要終點事件,也能反映相關的臨床結局(如死亡、絕對肺功能指標改變、急性加重),兩者各有長處,可在臨床研究設計中同時使用。IPF臨床試驗合適的主要研究終點仍然有爭議尚未最后確定。在IPF的Ⅱ期臨床試驗中以用力肺活量、肺一氧化碳彌散量等指標替代生存率作為主要研究終點,可以縮短研究過程、降低費用,減少研究過程中患者的脫落,但Ⅲ期臨床試驗應以生存率作為研究終點。而吡非尼酮的臨床試驗歷時多年,研究者考慮對主要研究終點進行改變也可以理解,但Taniguchi等[16]的主要研究終點改變是由DSMB成員對期中數據盲態分析后推薦。即使盲態,DSMB成員也可能知道主要和次級終點指標兩組之間存在顯著差異。如果一個正在進行的臨床試驗在已知分析數據后改變主要和次級終點指標,其可信性和完整性也就存在問題。
二 缺失值處理的問題
主要研究終點的指標需要從基線縱向測定時,臨床試驗中缺失值問題難以避免。遺憾的是,還沒有一種統計學方法來處理缺失值,同時不帶來誤差。目前對缺失值的處理多采用末次訪視向前結轉法(LOCF),即采用缺失值之前最近一次的觀察數據來代替缺失值,從而建立一個完整的數據集用于意向性分析(ITT)。LOCF可能會低估缺失值真實的變異度,降低相應的標準誤,由此帶來的后果便是增大Ⅰ類錯誤(即在研究中原來不存在的差異,而統計學處理存在顯著性差異)。在Taniguchi等[16]的Ⅰ期臨床試驗中,數據不全病例占1/3,除采用LOCF外,Collard認為應該再用多重替代法和完成病例分析法來驗證LOCF分析結論的穩健性及可靠性。
三 患者報告臨床結局資料的問題
以往的醫學研究非常重視臨床醫務人員報告資料、生物學報告資料以及臨床實驗室或器械檢查所獲得的結果在療效評估中的作用,但這些可能與患者的功能或感覺并不完全一致,不能充分表達患者的自我感受。FDA已將患者的疾病感受和臨床治療后的報告結局(PRO)納入臨床療效評價。因此,IPF臨床試驗結果除生存率外,還包括肺功能測定、功能狀況和健康生活質量等。呼吸困難和生活質量是反映IPF臨床結局的重要指標,與疾病進展的客觀指標相關。因此,在有不良反應的新藥物臨床試驗研究中,生活質量評估是一個重要方面。在Taniguchi等[16]的研究中,吡非尼酮治療組患者退出的主要原因就是藥物不良反應。不排除吡非尼酮能夠減緩IPF患者肺活量下降的速率,但因為光過敏和食欲減退等不良反應反而可能使IPF患者生活質量惡化。缺乏PRO資料,勢必難以全面衡量吡非尼酮治療IPF患者的利弊。
綜上所述,從以上臨床試驗結果來看,FDA要求InterMune公司組織新的臨床試驗以進一步分析吡非尼酮治療IPF的有效性和安全性,也非苛刻。至少現有的臨床試驗證據并不足以支持吡非尼酮成為IPF的治療用藥。
特發性肺纖維化(IPF)是一種病因不明的慢性肺間質性疾病,其臨床表現為進行性呼吸困難以及肺功能不可逆性逐漸惡化,它的病理特征主要是各種原因所致的肺泡上皮細胞損傷和不正常的組織修復,從而逐漸導致肺纖維化。在缺乏肺移植時IPF 3~5年死亡率分別約為50%和80%[1-2],以存活時間短、病死率高、病情進行性惡化為特點,所以強調早期診斷和最佳治療的必要性。到目前為止,臨床試驗對治療IPF的一些新藥物進行了評估,包括雙重內皮素受體拮抗劑波生坦[3]、γ干擾素[4]、伊馬替尼、依那西普[5]、西地那非[6]與安慰劑對照藥理試驗的結果,試驗結果一直令人失望。吡非尼酮(甲苯吡啶酮)化學名為5-甲基-l苯基-2(IH)-吡啶酮,相對分子質量為185.22,是一種較新的、口服的抗纖維化藥物,獲得美國食品藥品監督管理局(FDA)批準,是第一個通過重復、隨機、安慰劑對照的第三階段臨床試驗的藥物。研究證明口服吡非尼酮36~72周能夠明顯影響IPF患者的第1秒用力呼氣容積占用力肺活量(FVC)的百分率,具有統計學意義,而且與糖皮質激素、免疫抑制劑相比較,安全性更高[7]。1998年在日本對107例IPF患者進行了1年開放標簽的雙盲、安慰劑對照的吡非尼酮的臨床二期試點試驗。與吡非尼酮組相比,大量安慰劑組患者的病情急劇惡化,這項研究被提前終止。這項試驗證實了接受吡非尼酮的患者在9個月內肺功能下降程度減緩。基于這個陽性結果,又對確診的輕度至中度肺功能障礙IPF患者進行了第三階段的試驗。與安慰劑對照組相比,高劑量吡非尼酮組的肺活量發生了明顯的改變,并具有統計學意義;低劑量吡非尼酮組和安慰劑組間也有顯著的差異。相比較而言,吡非尼酮具有良好的耐受性,其主要的不良反應為光敏感、肝功損害及胃腸道不適[8-10]。2011年初公布了在歐洲和北美進行的兩項多國籍、隨機、雙盲試驗,結果顯示,在FVC%pred變化率、FVC絕對改變量以及無疾病進展生存時間(PFS)的改變,吡非尼酮組的療效均顯著優于安慰劑對照組。2 403 mg/d的劑量相對安全并且耐受性良好。應用吡非尼酮和安慰劑的患者中,引起突發的嚴重的不良反應的患者的百分率沒有差異。治療組中惡心、腹瀉是最常見的胃腸道不良反應。若出現3或4級惡心或腹瀉,將終止治療,但胃腸道不適一般為輕至中度,很少導致治療停藥[11]。因此,在若干隨機、雙盲、安慰劑對照研究中,唯一被證明有臨床療效的藥物是吡非尼酮。
基于現有各項研究,我們進行了一項系統性評價吡非尼酮對IPF的療效和安全性的Meta分析。近年來循證醫學的快速發展為醫藥行業的發展提供了更有力的就醫用藥證據。目前世界上公認的循證醫學最高證據為隨機對照試驗,它是驗證臨床干預措施療效的標準設計方案。要想得出合理而真實的試驗結果,試驗設計者必須能夠完善地描述整個臨床試驗的設計、實施、分析和解釋全過程,只有這樣才能提高結果的真實性,為以后的臨床決策提供可靠有力的證據。為此,國際上著名的CONSORT(Consolidated Standards of Reporting Trials)聲明明確提出了隨機對照臨床試驗報告的規范,為廣大臨床醫生開展臨床研究提供了更好的方法學依據。其目的旨在提高臨床隨機對照試驗報告的質量和真實性。就循證醫學而言,目前用于指導臨床決策的最可靠證據是大樣本、多中心的隨機雙盲對照試驗和系統評價。我們采用國際公認的CONSORT標準對本系統評價納入的有關吡非尼酮治療肺纖維化的隨機對照試驗進行報告質量評價,以了解臨床對照試驗的報告質量。
資料與方法
一 納入和排除標準
1.納入標準:(1)研究類型:關于吡非尼酮對IPF治療作用及不良反應的對照試驗,且不受語種及發表限制,無論是否采用盲法。(2)研究對象:符合2011年3月美國呼吸危重癥雜志全文發表的IPF診治指南上的診斷標準,不受年齡、病程限制。
2.排除標準:(1)動物實驗研究;(2)理論探討;(3)綜述及經驗總結;(4)個案報道;(5)重復發表文獻;(6)文獻未設對照組;(7)統計方法不恰當;(8)文獻試驗設計不嚴謹;(9)Meta分析類文章等。
二 干預措施
試驗組:吡非尼酮加減治療;對照組:同等劑量安慰劑,其他干預措施相同。
三 結局指標
1.主要指標:(1)肺活量變化(changes in VC);(2)6分鐘步行試驗最低氧分壓變化(changes in lowest SpO2);(3)無疾病進展生存時間(PFS)。
2.次要指標:(1)用力肺活量(FVC);(2)靜息下肺總量(TLC);(3)肺一氧化碳彌散量(DLCO)變化。
3.終點指標:(1)死亡;(2)主要不良反應:①光敏性(photosensitivity);②頭暈(dizziness);③關節痛(joint pain)等。
四 檢索策略
計算機檢索PubMed、Cochrane Library、中國期刊全文數據庫(CNKI)、中國生物醫學文獻數據庫(CBM)、萬方數據庫、中文科技期刊全文數據庫(VIP)。檢索時間截至2014年5月。同時補充用Google Scholar、百度等搜索引擎在互聯網上查找相關的文獻,追查已納入文獻的參考文獻,以獲取以上檢索未發現的相關信息。所有檢索策略經多次檢索后確定。
1.英文檢索式:
#1:Search “pulmonary fibrosis”[Mesh]
#2:Search(pulmonary fibrosis[Title/Abstract]) OR Fibrosing Alvelitides[Title/Abstract]) OR Fibrosing Alvelitis[Title/Abstract]) OR Pulmonary Fibroses[Title/Abstract]) OR hamman-rich syndrome[Title/Abstract])
#3:Search “Pirfenidone”[Supplementary Concept]
#4:Search (Pirfenidone[Title/Abstract]) OR pirespa[Title/Abstract]) OR deskar[Title/Abstract]
#5:#1 OR #2
#6:#3 OR #4
#7:#5 AND #6
2.中文檢索式:題名或關鍵詞(“肺纖維化”)+題名或關鍵詞(“肺間質病”)+題名或關鍵詞(“肺間質纖維化”)+題名或關鍵詞(“肺纖維變性”)+題名或關鍵詞(“肺間質性病”)*題名或關鍵詞(“吡非尼酮”)*Date:-2014。
五 文獻質量評價與資料提取
由2名研究人員根據納入與排除標準,獨立篩選檢索到的文獻,然后將篩選結果相互比對,如有分歧則進行討論,必要時請第3名研究人員協助決定其是否納入。對資料不全或描述不清楚的文獻,通過電話或郵件方式聯系作者以獲取缺失資料。提取資料內容包括第一作者姓名、發表時間、干預措施、對照措施、結局指標等。
按照臨床流行病學和循證醫學的原則,根據Cochrane手冊所推薦的偏倚風險評估工具,對納入的研究主要從選擇(包括隨機序列產生和分配隱藏)、實施(包括對研究者和受試者施盲)、測量(研究結局盲法評價)、隨訪(結局數據的完整性)、報告(選擇性報告研究結果)及其他(其他偏倚來源)這6個方面總計7個條目對偏倚風險進行評價。根據納入排除標準篩選文獻,并按預先確定的表格提取資料。針對每一個研究,對上述6個方面總計7個條目作出“是”(低風險偏倚)、“否”(高風險偏倚)和“不清楚”(缺乏相關信息或偏倚情況不確定)的評價[12-15]。
六 統計學處理
采用Cochrane協作網RevMan5.2做Meta分析。對納入的研究首先進行異質性檢驗,若納入的各研究具有同質性(P>0.1,I2<50%),使用固定效應模型計算合并統計量;若納入的各研究異質性較明顯(P<0.1,I2>50),則使用隨機效應模型計算合并統計量。計數資料采用相對危險度(RR)或比值比(OR)及其95%可信區間(95%CI),計量資料采用加權均數差(WMD)及其95%CI表示;當測量單位不同時,則選擇標化均數差(SMD)及其95%CI。Meta分析的結果采用森林圖表示。P≤0.05為差異有統計學意義。敏感性分析采用去除納入標準差別較大的研究后進行重新分析,缺失或失訪病例應將其作為治療失敗進行敏感性分析,即“最差情況演示分析”(“worst-case” scenario analysis),此外還進行排除高質量研究后所余文獻的敏感性分析。潛在的發表偏倚采用“倒漏斗”圖示分析,即試驗樣本大小與效應的回歸圖示分析。漏斗圖是根據從單個研究估計得出的危險度值(X軸)與每項研究的樣本量(Y軸)所做的散點圖。效應值的準確性隨樣本量的增加而增加,小樣本研究的估計值應該散在、寬廣地分布在圖形底部,而大樣本研究的估計值相對集中地分布在圖形中部或頂部,在沒有偏倚的情況下,呈現對稱的倒漏斗狀。
結果
一 檢索結果
共檢索出有關文獻285篇,其中PubMed 171篇,Cochrane Library 34篇,萬方14篇,CNKI 26篇,CBM 24篇,維普16篇。去重9篇,然后由2名研究人員通過文獻標題、摘要排除明顯不符合標準的文獻254篇。再通過閱讀全文,根據納入與排除標準排除17篇。本研究最終納入6篇試驗研究[10-11, 16-19],其中5篇為隨機對照試驗研究[10-11, 16, 18-19],1篇為對照研究[17],均為外文文獻。符合納入標準的6篇文獻中,對照組給藥為安慰劑。各研究例數最多者435例,最少者21例,共1 172例患者。文獻篩選流程及結果見圖 1。

二 納入研究的一般特征和質量評價
我們提取了各納入研究的基本資料,包括發表年限、納入病例數、作者、具體干預措施、療程等組間基線特征。各研究實驗組與對照組基線相似性較好。納入的5篇文獻采用隨機對照、雙盲方法研究,亦采用隱蔽分組。納入文獻一般特征見表 1,納入文獻的方法學質量評價見表 2。


三 肺纖維化癥狀及體征改善的總有效率分析
1.治療前后肺活量變化率的Meta分析:納入的6篇文獻中結局指標有肺活量變化的2篇文獻[10, 16]進行Meta分析,結果吡非尼酮組和安慰劑組的治療前后肺活量變化率差異有統計學意義。Meta分析結果:兩個吡非尼酮藥物治療肺纖維化的研究資料具有同質性(異質性檢驗χ2=1.03,P=0.31),合并效應量WMD采用固定效應模型,合并后為0.06,其95%CI為(0.01,0.12),合并效應量的檢驗,Z=2.48,P=0.01。根據此分析結果,可認為吡非尼酮藥物組病死率與安慰劑組比較差異有統計學意義。兩個研究中有1個研究的95%CI橫線與無效豎線相交,表明該研究結果認為吡非尼酮不會提高肺纖維化疾病的治療前后肺活量變化率;另有1個研究的95%CI橫線落在無效豎線右側,故可認為吡非尼酮藥物在提高肺纖維化疾病的治療前后肺活量有效。森林圖見圖 2。

2.治療前后6分鐘步行實驗中最低氧分壓變化的Meta分析:納入的6篇文獻中結局指標有肺活量變化的2篇文獻[10, 16]進行Meta分析,結果吡非尼酮組和安慰劑組的治療前后6分鐘步行實驗中最低氧分壓變化差異無統計學意義。Meta分析結果:2個吡非尼酮藥物治療肺纖維化的研究資料具有異質性(異質性檢驗χ2=8.90,P=0.003),合并效應量WMD采用隨機效應模型,合并后為0.82,其95%CI為(-1.35,2.98),合并效應量的檢驗,Z=0.74,P=0.46。根據此分析結果,可認為吡非尼酮藥物組病死率與安慰劑組比較差異無統計學意義。兩個研究中有1個的95%CI橫線與無效豎線相交,表明該研究結果認為吡非尼酮不會提高肺纖維化疾病的治療前后6分鐘步行實驗中最低氧分壓;另有1個研究的95%CI橫線落在無效豎線右側,故可認為吡非尼酮藥物在提高肺纖維化疾病的治療前后6分鐘步行實驗中最低氧分壓無效。森林圖見圖 3。

3.治療前后總肺容量、肺一氧化碳彌散量、用力肺活量變化率以及無進展生存時間分析:納入的6篇文獻中結局指標有以上指標的有3篇文獻[10-11, 16],數據無法統一進行Meta分析,Azuma等[10]的實驗結果是試驗組和對照組差異無統計學意義。
4. 吡非尼酮組和安慰劑組病死率的Meta分析:對納入的5篇文獻[10-11, 16-18]進行Meta分析,結果吡非尼酮組和安慰劑組的病死率差異無統計學意義。Meta分析結果:5個吡非尼酮藥物治療肺纖維化的研究資料具有同質性(異質性檢驗χ2=3.05,P=0.55),合并效應量RR采用固定效應模型,RR合并=0.62,其95%CI為(0.37,1.03),合并效應量的檢驗,Z=1.85,P=0.06。根據此分析結果,可認為吡非尼酮藥物組病死率與安慰劑組比較差異無統計學意義。5項研究中有4個的95%CI橫線與無效豎線相交,表明該4個研究結果均認為吡非尼酮不會減少肺纖維化疾病的病死率,另有1個研究的95%CI橫線落在無效豎線左側,故可認為吡非尼酮藥物在減少肺纖維化疾病的病死率無效。森林圖見圖 4。

四 不良反應
1.吡非尼酮組和安慰劑組對光敏感發生率的Meta分析:將納入的5篇文獻[10-11, 16-18]對光敏感發生例數作為有效數據作圖,結果吡非尼酮組的對光敏感發生率高于安慰劑組,差異有統計學意義。森林圖見圖 5。

2.吡非尼酮組和安慰劑組頭暈發生率的Meta分析:將納入的6篇文獻報道發生頭暈的4篇文獻[11, 16-18]進行分析,將發生頭暈例數作為有效數據作圖,結果吡非尼酮組的頭暈發生率高于安慰劑組,差異有統計學意義。森林圖見圖 6。

3.吡非尼酮組和安慰劑組關節痛發生率的Meta 分析:將納入的6篇文獻報道關節痛的3篇文獻[11, 17-18]進行分析(將發生關節痛例數作為有效數據作圖),結果吡非尼酮組和安慰劑組的關節痛發生率差異無統計學差異。森林圖見圖 7。

五 發表偏倚
將6篇文獻中吡非尼酮對IPF和安慰劑組治療進行發表偏倚的漏斗圖分析(圖 8),結果表明圖形對稱性一般,存在發表偏倚,提示可能存在發表偏倚以及試驗方法學質量低下。

六 敏感性分析
由于納入文獻數量較少、質量較高,無法作排除陰性結果、高質量研究后所余文獻的敏感性分析,同時所納入研究均報道失訪或退出病例,但具體數據未報道,因而也不能將失訪病例作為治療失敗進行敏感性分析。
討論
Azuma等[10]2000年在日本進行隨機、雙盲、安慰劑對照的吡非尼酮治療IPF的Ⅱ期臨床試驗,其主要指標為6分鐘步行試驗中最低脈搏血氧飽和度最低值的變化,107例IPF患者被隨機分成兩組,接受吡非尼酮(72例,最大劑量為1 800 mg/d)或安慰劑(35例)治療。試驗結果表明吡非尼酮治療6個月及9個月時,血氧飽和度有明顯提高,9個月時肺活量明顯升高(P=0.036);在次要指標方面,吡非尼酮組肺活量下降幅度及急性加重的發生率明顯低于安慰劑組,而對照組9個月期間出現病情惡化。由于安慰劑對照組IPF急性加重發生率高于試驗組,該臨床試驗被數據安全及監督委員會(DSMB)提前終止。現有的臨床試驗證據并不足以支持吡非尼酮成為IPF的治療用藥,2011指南中不推薦使用此類藥物。最新發表的由Taniguchi等[16]在日本進行的吡非尼酮臨床試驗,275例IPF患者隨機分為吡非尼酮低劑量組、高劑量組和安慰劑對照組。經52周隨訪,主要終點指標肺活量下降的速率在吡非尼酮高劑量組優于組安慰劑對照組(-0.09 L比-0.16 L,P=0.04),低劑量組也優于安慰劑對照組(-0.08 L比-0.16 L,P=0.039)。52周內無疾病進展生存期(指肺活量較基線值下降≥10%以上或死亡)差異也有統計學意義(P=0.028)。與其他多項臨床試驗比較,該研究首次證實藥物吡非尼酮減緩IPF疾病的進展。基于該項臨床試驗結果,日本厚生勞動省在2008年10月批準吡非尼酮用于治療IPF,吡非尼酮成為第一個在全球獲得批準用于治療IPF的藥物。但著名的間質性肺疾病專家Collard針對Taniguchi等[16]臨床試驗設計及觀察過程中的問題,對該研究結論的可靠性提出了質疑。Taniguchi等[16]進行的一項Ⅲ期臨床試驗顯示,吡非尼酮可以提高患者的FVC,而且患者的耐受性較好。因此,對少數患者該藥物可能是合理的選擇(弱推薦,低-中等質量證據)[20]。
基于使用吡非尼酮時出現提前撤藥的情況以及其在臨床試驗的結果報道差異較大,我們做一個Meta分析檢查吡非尼酮治療肺纖維化的療效性與安全性,是及時和至關重要的。基于現有的證據,吡非尼酮治療IPF似乎療效沒有那么顯著、不那么安全或患者耐受不那么良好。根據CONSORT標準,本研究納入的6篇隨機對照試驗的報告質量欠佳,從表中可以看出,沒有一篇文獻對治療依從性、藥物的質量控制標準和方法、樣本量估計、隨機分配方案的隱藏和實施、受試對象流程圖、意向性治療分析進行描述;雖然有文獻描述了隨機分配的方法,但大部分文獻未采用盲法,也未結合可能存在的偏倚解釋結果和概括證據;對于退出/失訪的報告也不多;文獻涉及到終點指標觀察設計不合理;雖然報告了不良反應,但對于不良反應的報告都不規范。總之,從這6篇文獻的報告質量評價中可以看出,大部分研究的方法學及結果部分報告不夠詳細,勢必影響研究結論的可靠性。同時,發表偏倚的漏斗圖分析提示可能存在發表偏倚以及試驗方法學質量低下。通常,發表偏倚提示陰性結果的試驗可能存在未發表、語言性偏倚、科研人員離開原單位導致研究未能發表造成的偏倚、多重發表性偏倚、補救性偏倚等[15],也可能與試驗組與對照組采用的藥物種類、劑量、療程的不同,以及試驗樣本偏小等有關。因此,我們建議盡量采用隨機雙盲對照,建立終點指標觀察,規范報告不良反應,在受試對象流程圖、退出/失訪、意向性分析以及重要指標結果報告完整性方面要特別加強,按照CONSORT標準來報告隨機對照試驗,以提高臨床隨機對照試驗報告的質量和真實性。
一 主要終點指標改變的問題
主要終點指標應能反映檢驗的假設、藥物的有效性或安全性,通常只有一個。主要研究終點也可用主要終點事件,也能反映相關的臨床結局(如死亡、絕對肺功能指標改變、急性加重),兩者各有長處,可在臨床研究設計中同時使用。IPF臨床試驗合適的主要研究終點仍然有爭議尚未最后確定。在IPF的Ⅱ期臨床試驗中以用力肺活量、肺一氧化碳彌散量等指標替代生存率作為主要研究終點,可以縮短研究過程、降低費用,減少研究過程中患者的脫落,但Ⅲ期臨床試驗應以生存率作為研究終點。而吡非尼酮的臨床試驗歷時多年,研究者考慮對主要研究終點進行改變也可以理解,但Taniguchi等[16]的主要研究終點改變是由DSMB成員對期中數據盲態分析后推薦。即使盲態,DSMB成員也可能知道主要和次級終點指標兩組之間存在顯著差異。如果一個正在進行的臨床試驗在已知分析數據后改變主要和次級終點指標,其可信性和完整性也就存在問題。
二 缺失值處理的問題
主要研究終點的指標需要從基線縱向測定時,臨床試驗中缺失值問題難以避免。遺憾的是,還沒有一種統計學方法來處理缺失值,同時不帶來誤差。目前對缺失值的處理多采用末次訪視向前結轉法(LOCF),即采用缺失值之前最近一次的觀察數據來代替缺失值,從而建立一個完整的數據集用于意向性分析(ITT)。LOCF可能會低估缺失值真實的變異度,降低相應的標準誤,由此帶來的后果便是增大Ⅰ類錯誤(即在研究中原來不存在的差異,而統計學處理存在顯著性差異)。在Taniguchi等[16]的Ⅰ期臨床試驗中,數據不全病例占1/3,除采用LOCF外,Collard認為應該再用多重替代法和完成病例分析法來驗證LOCF分析結論的穩健性及可靠性。
三 患者報告臨床結局資料的問題
以往的醫學研究非常重視臨床醫務人員報告資料、生物學報告資料以及臨床實驗室或器械檢查所獲得的結果在療效評估中的作用,但這些可能與患者的功能或感覺并不完全一致,不能充分表達患者的自我感受。FDA已將患者的疾病感受和臨床治療后的報告結局(PRO)納入臨床療效評價。因此,IPF臨床試驗結果除生存率外,還包括肺功能測定、功能狀況和健康生活質量等。呼吸困難和生活質量是反映IPF臨床結局的重要指標,與疾病進展的客觀指標相關。因此,在有不良反應的新藥物臨床試驗研究中,生活質量評估是一個重要方面。在Taniguchi等[16]的研究中,吡非尼酮治療組患者退出的主要原因就是藥物不良反應。不排除吡非尼酮能夠減緩IPF患者肺活量下降的速率,但因為光過敏和食欲減退等不良反應反而可能使IPF患者生活質量惡化。缺乏PRO資料,勢必難以全面衡量吡非尼酮治療IPF患者的利弊。
綜上所述,從以上臨床試驗結果來看,FDA要求InterMune公司組織新的臨床試驗以進一步分析吡非尼酮治療IPF的有效性和安全性,也非苛刻。至少現有的臨床試驗證據并不足以支持吡非尼酮成為IPF的治療用藥。