引用本文: 陸芳, 唐健元, 趙陽, 李慶娜, 高蕊. 中藥新藥臨床試驗中安慰劑模擬效果評價與思考. 中國循證醫學雜志, 2018, 18(11): 1163-1168. doi: 10.7507/1672-2531.201804065 復制
按照我國《藥物臨床試驗質量管理規范》(GCP)要求,為保證臨床試驗結果的可靠性,新藥臨床試驗必須遵循對照、隨機和重復三大原則[1, 2]。根據研究目的可以設計不同的對照,如安慰劑對照[3]、劑量效應對照、陽性藥物對照等;也可以設計相同藥物不同的用法用量下的療效和安全性比較。為達到實施盲法的目的,這些設計需要制作安慰劑,或者是不同濃度的中藥模擬劑。
與西藥安慰劑相比,中藥制劑由于其特有的氣味、口味和色澤,在人工模擬制作與其外觀、氣味、色澤和口味相似的安慰劑方面確有一定難度。對于中藥安慰劑的質量及制備,國家食品藥品監督管理總局最新發布的《中藥新藥臨床研究一般原則》(以下簡稱《原則》)提出了相關要求[4],首先藥品申請人需對臨床試驗用安慰劑的質量負責,并要保留臨床試驗使用的受試藥物、陽性藥物、安慰劑的樣品。并且,為了減低受試者和研究者在盲法實施過程中出現破盲,《原則》中還明確了安慰劑的制備及對其模擬效果進行評價的要求:“安慰劑應與受試藥物/陽性藥物相似,如口服制劑安慰劑應在顏色、氣味、味道、形狀、質感等特征方面與受試藥物/陽性藥物相似,使臨床試驗參與者難以區分;需采用合理的方法對其相似性和適用性進行判斷和評價”。但到目前為止,還未有評價中藥安慰劑模擬效果的標準規范。本文遵循《原則》的相關要求,以一個口服膠囊劑型的試驗藥物安慰劑為實例,從形、色、氣、味等方面評價安慰劑的模擬效果,探討中藥安慰劑模擬效果評價及中藥臨床試驗盲法實施中存在的實際問題,為行業內安慰劑模擬效果評價及臨床試驗操作提供方法學借鑒。
1 方法
1.1 安慰劑的制備
中藥新藥常見劑型有顆粒劑、口服液、膠囊劑、片劑、丸劑、散劑、膏劑等,不同劑型安慰劑的設計存在差別,但制作方法均涉及到輔料法及其配比問題,一般以矯色劑(食用色素)、矯味劑(食用添加劑)、揮發性物質來模擬安慰劑的色、味、氣[5]。例如某一中藥新藥為口服膠囊劑,其安慰劑采用淀粉、麥芽糊精、焦糖色素、苦精等按照一定比例制作,并裝入膠囊。由于中藥制劑具有獨特的顏色、氣味和口味,為達到安慰劑的模擬效果,在試驗設計和藥物制備中可做一些特別的考慮,如將試驗藥物設計為有包衣材料或膠囊殼的片劑、丸劑或膠囊劑等,掩蓋試驗藥物的氣味和口味 [6];或者在輔料中加入低劑量的原藥,一般劑量不超過原藥含量的 20%,但因其已經不是嚴格意義上的安慰劑,而是低劑量的試驗藥物,故在試驗設計中應予以考慮[7]。
1.2 安慰劑模擬效果測評
1.2.1 試驗藥物可能性評價
將試驗藥與安慰劑各 10 份分裝,采用簡單隨機的方法將分裝藥物標注為 1~20 號,并分發給 20 位評判者,評判者來自于藥品生產廠家、臨床研究人員(研究者、CRC、質控人員等)和患者。評判者在試驗藥物處于盲態的情況下,獨立從包裝、標簽、說明書、藥物的顏色、氣味和口味等幾個方面,對所評價的藥物是試驗藥物的可能性進行整體評估,允許評判者打開藥物最小包裝(如膠囊),可對照藥品說明書判斷。評判者通過執行上述規則,對評價的藥物是試驗藥還是安慰劑做出主觀判斷,有 5 個選擇:肯定是試驗藥、可能是試驗藥、不確定、可能是安慰劑和肯定是安慰劑,從中選擇 1 項,從而判定其為試驗藥物的可能性。揭盲后比較試驗藥和安慰劑對于試驗藥物判斷的人數分布是否一致,采用擬合優度檢驗,如果 P>0.05,則接受評判者判斷試驗藥和安慰劑為試驗藥物的比例一致。
1.2.2 形、色、氣、味模擬效果評價
由于劑型不同,安慰劑模擬的特征也有所不同,不同設計者可根據需求采用合適的評價項目,如外形、顏色、氣味、口味、澄明度(液體)、均勻度(固體)等。
1.2.2.1 制劑與試驗藥的相似性評價
將制劑按照試驗藥與安慰劑分裝,通過簡單隨機的方法分別標注為 A 藥、B 藥(A、B 藥一個為試驗藥一個為安慰劑,但不確定哪個為試驗藥,哪個為安慰劑)。另取一部分試驗藥樣品作為參比藥物,A 藥、B 藥和試驗藥樣品全部采用試驗藥的劑型。
給每位評判者同時發放 A 藥、B 藥和試驗藥樣品,讓評判者將 A 藥和 B 藥分別與試驗藥樣品從外形、顏色、氣味和口味等幾個方面對其相似性進行評價,允許評判者打開藥物的最小包裝(如膠囊),并在視覺模擬量表上進行評分。與試驗藥樣品完全一樣為 10.0 分,比較相似為 7.5 分,不確定為 5.0 分,差異較大為 2.5 分,完全不一樣為 0 分。評分越高,說明與試驗藥越相似。最后比較 A 藥和 B 藥在形、色、氣、味上的評分差異,兩藥評分越接近,說明安慰劑模擬效果越好。
1.2.2.2 制劑與試驗藥相似度的一致性評價
采用相似性評價的數據,擬定評分>5 分為與試驗藥樣品相似,評分≤5 分為與試驗藥樣品不相似;分別計算 A 藥和 B 藥與試驗藥在形、色、氣、味 4 個方面的相似度,及同一名評價者對 A 藥和 B 藥與試驗藥相似性的一致性程度。如果相似度越大、一致性越高,都說明安慰劑模擬效果越好。相似度=兩藥相似的例數/總評判人數×100%。一致性=(A 藥和 B 藥均與試驗藥相似例數+A 藥和 B 藥均與試驗藥不相似例數)/總評價人數×100%。
2 結果
2.1 試驗藥物可能性評價
20 位評判者,分別來自于藥品生產廠家、臨床研究人員(研究者、研究護士、質控人員等)和患者。試驗藥物和安慰劑分配在人群中的分布均衡(Fisher 精確概率 P=0.665 6,見表 1)。

評判者對所發放藥物的判斷結果顯示,10 人不確定所發藥物是安慰劑還是試驗藥,7 人認為自己的藥物可能是安慰劑,3 人認為自己的藥物可能是試驗藥,無人對所發放的藥物做出肯定是試驗藥或者肯定是安慰劑的判斷。揭盲其評價的藥物,發放安慰劑的 10 位評判者中,2 人認為可能是試驗藥,3 人不確定是安慰劑還是試驗藥,5 人認為可能是安慰劑;在發放試驗藥的 10 位評判者中,1 人認為可能是試驗藥,7 人不確定是安慰劑還是試驗藥,2 人認為可能是安慰劑。揭盲后,評價者對于兩種藥物的判斷差異無統計學意義(采用 Fisher 精確概率,P=0.331 7),接受評判者判斷制劑為試驗藥物的比例一致的結論,結果見表 2。

2.2 形、色、氣、味模擬效果評價
2.2.1 制劑與試驗藥的相似性評價
由于允許評判者打開膠囊,所以除外形是對藥物包裝(包括最小包裝,如膠囊外殼)的評價外,顏色、氣味和口味均是評判者打開膠囊后對內容物的評價。揭盲后,A 藥為安慰劑,B 藥為試驗藥,與試驗藥相比,兩種藥物在外觀和顏色上相似性評分較高,但在氣味和口味評價上安慰劑的相似性評分較試驗藥低。采用配對 t 檢驗,兩藥除外觀的評分差異無統計學意義(P>0.05)外;顏色、氣味、口味與試驗藥比較差異均有統計學意義(P<0.05)(表 3)。


2.2.2 制劑與試驗藥相似度的一致性評價
A 藥與試驗藥比較,在外觀上與試驗藥完全一樣(相似度為 100%),顏色、氣味和口味與試驗藥的相似度分別為 50%、10% 和 15%;B 藥與試驗藥比較,在形、色、氣、味四個方面均完全一樣(相似度均為 100%)。同一評價者對不同藥物在外觀上評價的一致性達到 100%,顏色、氣味和口味的一致性分別為 50%、10% 和 15%(表 4)。

3 討論
安慰劑作為模擬藥物,其感觀如劑型、大小、顏色、口味、氣味等都力求與試驗藥盡可能保持一致,但不含有試驗藥物的有效成分。此外,安慰劑在包裝、用法與用量等方面也需要與試驗藥保持完全一致[8]。在實際臨床試驗中,安慰劑的規格、包裝、用法和用量與被試藥物均可采用統一標準。對于安慰劑的評價主要側重于安慰劑是否有藥物活性,以及安慰劑本身在外觀、顏色、氣味、口味等方面是否與試驗藥一致。
3.1 中藥安慰劑模擬效果
從上述安慰劑整體模擬效果評價實例中可看出,在盲態情況下,拿到安慰劑的評判者認為評價的藥物可能是安慰劑的比例占一半;拿到試驗藥的評判者只有 10% 認為其可能是試驗藥,70% 都不確定拿到的藥物是安慰劑或是試驗藥。總體上,在盲態下,單獨接觸試驗藥或者安慰劑,大多數人都認為可能是試驗藥或不確定是試驗藥還是安慰劑。對于安慰劑形、色、氣、味模擬效果的評價結果顯示,中藥安慰劑與試驗藥在外觀上完全一致,評判者打開膠囊后兩種藥物顏色有一定差異,但在氣味(10%)和口味(15%)上則一致性較低。
從上面結果可看出,由于復方中藥成分復雜,中藥安慰劑在氣味和口味上的模擬制作仍存在困難。基于中藥品種劑型的不同,其具體選料和配比也不盡相同,安慰劑的制作不可能采用統一模式,需要在實際生產中摸索和探討。如果選擇有包衣、薄膜或膠囊的劑型,可以掩蓋中藥特殊的氣味和口味,如不刻意打開膠囊或包衣,一般情況下此類安慰劑能夠滿足盲法的實施需求。本研究評價的安慰劑在顏色、氣味和口味上與試驗藥有差別,但是由于安慰劑是膠囊劑劑型,在很大程度上降低了安慰劑制作的難度。并且,受試者每次用藥統一采用鋁塑泡罩包裝,安慰劑的規格、外觀、包裝、標簽、標識等均與試驗藥一致。如果受試者之間不互相溝通交換藥物,并且不刻意打開膠囊,是不易破盲的。
而中藥的顆粒劑、口服液、丸、散、膏、丹等劑型,則對安慰劑的制作工藝要求較高,有時需根據中藥復方的氣味特點選擇合適的輔料,并選擇一定的藥料配比。也可采用具有一定藥理活性但其活性與研究藥物效果無關的物料制作安慰劑,如在“胃癌前病變早期診斷早期治療的關鍵技術研究”科研項目中,試驗藥物是摩羅丹,其安慰劑采用的是黃豆粉、淀粉、炭黑色素和煉蜜按照一定配比制成的棕色小蜜丸,其氣味、崩解度等均能達到試驗藥的標準[9]。還可在安慰劑中添加少量的試驗藥,使其外觀、味道和氣味與試驗藥具有一定的相似性。如在“中德合作中醫藥治療腸易激綜合征的臨床研究”中,試驗藥是中藥湯劑,含黃芪、防風、白芍等 11 味藥,其安慰劑由微火炒至焦黃色的大米加 5% 原藥制成。但此前的基礎實驗結果證實了含 5% 原藥和 10% 原藥的安慰劑對于胃腸動力均沒有影響,無鎮痛抗炎作用[10]。所以對于此類加入一定比例原藥的安慰劑,需要結合藥效學、毒理學試驗研究結果,判斷低劑量藥物是否有藥理活性。
3.2 安慰劑模擬效果評價方法
就安慰劑模擬效果評價方法來看,目前還沒有公認的中藥安慰劑質量評價方法。國外有學者提出了安慰劑質量檢查清單(placebo quality checklist,PQC)的概念,該清單側重從盲法實施是否成功的角度對安慰劑的質量做出評價,但尚缺乏可靠驗證[11]。目前對中藥安慰劑的質量評價多以人工評分為主[9, 12],即在特定條件下,請參與臨床研究的各方人員對安慰劑和試驗藥進行獨立評判,通過觀察和品嘗,對其外觀、顏色、氣味、口味等項目進行打分,以綜合評分結果作為評價考察的指標。
本文介紹了采用人工評判方法從安慰劑成為試驗藥物可能性的整體模擬效果和形、色、氣、味各單項模擬效果的 2 個方面評價安慰劑模擬效果。可以采用不同的評判人員進行評價,也可以是同一批評判者進行評價。后一種情況,需首先進行試驗藥物可能性的安慰劑整體模擬效果評價,以避免評判者在此之前同時拿到不同藥物(安慰劑和試驗藥)進行形、色、氣、味的比較,而無法做出試驗藥物可能性的客觀判斷。對于形、色、氣、味各單項模擬效果評價,本文分別從安慰劑與試驗藥的差異性和安慰劑與試驗藥的一致性評價 2 個方面進行數據分析,這 2 個方面的結果本身具有一致性,只是前者反映的是 2 種藥物與試驗藥相似性的差異,后者表達的是 2 種藥物與試驗藥相似性的一致程度。差異性小,意味著一致性高;反之,差異性大,一致性則低。在實際操作中采用其中一種分析即可達到評價的目的。
但人工評判方法也有不足,不同評判人員可能存在的心理傾向及對于中藥自身的觀感、味感和氣味具有不同的感應性,而導致人工評價方法在一定程度上受主觀因素影響較大。所以在模擬效果評判的標準化和客觀量化方面仍有待進一步提高,這也是行業內中藥安慰劑模擬效果評價面臨的共性問題[13, 14]。針對人工評判中存在的問題,有研究人員提出了改良方案[15],建議在評判中增加隨機設計以排除評判者的主觀偏倚。如將試驗藥和安慰劑按照“試驗藥+試驗藥”及“試驗藥+安慰劑”分別包裝,并隨機分發給若干評判者,評判者在盲態下獨立對所發放包裝中的兩份樣品(“試驗藥+試驗藥”或“試驗藥+安慰劑”)在外形、顏色、氣味、口味、澄明度(液體)、均勻度(固體)等方面的一致性(或差異性)進行評價,并在表格上進行評分。采用此法可盡量減小評判者的主觀傾向。目前還有學者開始嘗試采用智能感官分析技術評價中藥安慰劑質量[16],通過視覺傳感器、電子鼻、電子舌等技術來測定安慰劑在形、色、氣、味等方面與試驗藥的一致性,將主觀評判轉化為客觀數據,以實現評判的標準化控制[17, 18]。
3.3 對中藥臨床試驗盲法實施的思考
在中藥新藥Ⅱ期臨床試驗中可進行多個探索性試驗,如劑量探索、用藥方法探索等,對照組可采用安慰劑、陽性藥或不同劑量對照等。臨床試驗中制作安慰劑的目的是為了保證盲法的實施,除了不同劑型對盲法實施效果有影響外,不同的試驗設計的盲法實施的難度和方法也各不相同。
對于劑量探索臨床試驗,其對照藥物的設計可以按照不同劑量組日服生藥量進行折算,如高劑量組為 100% 原藥,中劑量和低劑量可分別做成減低濃度的制劑,只要保證各個劑量組日服生藥量達到設計的日服生藥量即可,每天分若干次服用。由于每個劑量組藥物均含有一定比例的原藥,更容易達到不同劑量藥物間氣味和口味的一致。
對于藥物用法的探索性臨床試驗,以探索某一中藥口服液每日給藥次數為例,設計 2 種服用方法,分別是每日服用 4 次和服用 3 次,試驗藥為按照日服生藥量計算的 100% 濃度原藥,試驗組 1 按照一天 4 次、每次 2 支進行藥物的服用(早、中、晚和晚睡前各服 1 次);試驗組 2 在早、中、晚各服用 1 次,一天服用 3 次。但為了實施盲法,在晚睡前服用含 10% 原藥的低劑量藥物;對照組每日在早、中、晚和晚睡前各服用 1 次含 10% 原藥的低劑量藥物。對于這種藥物服用方法探索的盲法試驗,試驗組 2 受試者同時服用了 100% 原藥的高劑量藥物和 10% 原藥的低劑量藥物,如這 2 種藥物氣味和口味相差較大,則非常容易導致該試驗組破盲。在實際操作中,將 3 個組(每日用藥次數不同的 2 個試驗組、1 個對照組)早、中、晚服用的藥物全部貼上 1 號藥標簽,晚睡前服用的藥物貼上 2 號藥標簽,明確告知受試者睡前服用的 2 號藥不同于早、中、晚服用的 1 號藥。這樣一來,即使試驗組 2 的受試者嘗出 1 號藥和 2 號藥口味有差異,不排除另外 2 個組的受試者由于自身感覺的差異,在看到其服用不同藥物標簽的藥物(早、中、晚為 1 號標簽,睡前為 2 號標簽)后,也會產生藥物口味有差異的感覺,以此混淆了受試者對其所在組別的判斷,最終達到盲法的目的。
在實際的臨床試驗操作中,破盲的發生,除因安慰劑制作外觀上的明顯不一致外,當試驗藥物有特殊的不良反應或/和功效時, 安慰劑也容易被破盲;另外,還可能出現因受試者或研究者對試驗藥和安慰劑對比服用所致破盲。在臨床試驗中,如有規范的藥品管理和質量控制,可以防止該情況的發生[19]。目前多數中藥安慰劑制作和以上安慰劑評價的案例一樣,外形上基本可以滿足要求,不一致部分主要在顏色、氣味、口味的模擬效果[20]。因中藥安慰劑制作仍存在一些技術困難,如在試驗前對安慰劑模擬效果的評價出現差異,一是應在試驗過程中重視藥品管理,關注藥品的發放、使用、回收,并采取相應的措施,防止受試者或研究者同時拿到 2 個制劑(試驗藥和安慰劑)并對比服用導致破盲的情況發生;二是應在試驗完成時,分別由研究者和受試者評價其所接受的干預措施,以判斷是否破盲。對同一種干預措施破盲者與未破盲者的效應進行評估,如兩者差異明顯,需進一步進行分析以評估破盲對試驗結果的影響大小。
綜上所述,安慰劑的成功制作對于提高臨床患者的依從性,保證臨床試驗的順利實施和試驗結果的科學性具有一定意義。相信隨著中藥制劑臨床研究的深入開展,中藥安慰劑的生產研制技術會更加成熟。安慰劑的制作及模擬效果只是實施盲法試驗中的一個環節,由于中藥安慰劑在色、氣、味上的特殊性,很難做到安慰劑與試驗藥完全一致。所以,在臨床試驗過程中,對于受試者和研究者依從性的管理非常重要,需要避免人為或有意破盲,以保證整個臨床研究的完整性和可靠性。
按照我國《藥物臨床試驗質量管理規范》(GCP)要求,為保證臨床試驗結果的可靠性,新藥臨床試驗必須遵循對照、隨機和重復三大原則[1, 2]。根據研究目的可以設計不同的對照,如安慰劑對照[3]、劑量效應對照、陽性藥物對照等;也可以設計相同藥物不同的用法用量下的療效和安全性比較。為達到實施盲法的目的,這些設計需要制作安慰劑,或者是不同濃度的中藥模擬劑。
與西藥安慰劑相比,中藥制劑由于其特有的氣味、口味和色澤,在人工模擬制作與其外觀、氣味、色澤和口味相似的安慰劑方面確有一定難度。對于中藥安慰劑的質量及制備,國家食品藥品監督管理總局最新發布的《中藥新藥臨床研究一般原則》(以下簡稱《原則》)提出了相關要求[4],首先藥品申請人需對臨床試驗用安慰劑的質量負責,并要保留臨床試驗使用的受試藥物、陽性藥物、安慰劑的樣品。并且,為了減低受試者和研究者在盲法實施過程中出現破盲,《原則》中還明確了安慰劑的制備及對其模擬效果進行評價的要求:“安慰劑應與受試藥物/陽性藥物相似,如口服制劑安慰劑應在顏色、氣味、味道、形狀、質感等特征方面與受試藥物/陽性藥物相似,使臨床試驗參與者難以區分;需采用合理的方法對其相似性和適用性進行判斷和評價”。但到目前為止,還未有評價中藥安慰劑模擬效果的標準規范。本文遵循《原則》的相關要求,以一個口服膠囊劑型的試驗藥物安慰劑為實例,從形、色、氣、味等方面評價安慰劑的模擬效果,探討中藥安慰劑模擬效果評價及中藥臨床試驗盲法實施中存在的實際問題,為行業內安慰劑模擬效果評價及臨床試驗操作提供方法學借鑒。
1 方法
1.1 安慰劑的制備
中藥新藥常見劑型有顆粒劑、口服液、膠囊劑、片劑、丸劑、散劑、膏劑等,不同劑型安慰劑的設計存在差別,但制作方法均涉及到輔料法及其配比問題,一般以矯色劑(食用色素)、矯味劑(食用添加劑)、揮發性物質來模擬安慰劑的色、味、氣[5]。例如某一中藥新藥為口服膠囊劑,其安慰劑采用淀粉、麥芽糊精、焦糖色素、苦精等按照一定比例制作,并裝入膠囊。由于中藥制劑具有獨特的顏色、氣味和口味,為達到安慰劑的模擬效果,在試驗設計和藥物制備中可做一些特別的考慮,如將試驗藥物設計為有包衣材料或膠囊殼的片劑、丸劑或膠囊劑等,掩蓋試驗藥物的氣味和口味 [6];或者在輔料中加入低劑量的原藥,一般劑量不超過原藥含量的 20%,但因其已經不是嚴格意義上的安慰劑,而是低劑量的試驗藥物,故在試驗設計中應予以考慮[7]。
1.2 安慰劑模擬效果測評
1.2.1 試驗藥物可能性評價
將試驗藥與安慰劑各 10 份分裝,采用簡單隨機的方法將分裝藥物標注為 1~20 號,并分發給 20 位評判者,評判者來自于藥品生產廠家、臨床研究人員(研究者、CRC、質控人員等)和患者。評判者在試驗藥物處于盲態的情況下,獨立從包裝、標簽、說明書、藥物的顏色、氣味和口味等幾個方面,對所評價的藥物是試驗藥物的可能性進行整體評估,允許評判者打開藥物最小包裝(如膠囊),可對照藥品說明書判斷。評判者通過執行上述規則,對評價的藥物是試驗藥還是安慰劑做出主觀判斷,有 5 個選擇:肯定是試驗藥、可能是試驗藥、不確定、可能是安慰劑和肯定是安慰劑,從中選擇 1 項,從而判定其為試驗藥物的可能性。揭盲后比較試驗藥和安慰劑對于試驗藥物判斷的人數分布是否一致,采用擬合優度檢驗,如果 P>0.05,則接受評判者判斷試驗藥和安慰劑為試驗藥物的比例一致。
1.2.2 形、色、氣、味模擬效果評價
由于劑型不同,安慰劑模擬的特征也有所不同,不同設計者可根據需求采用合適的評價項目,如外形、顏色、氣味、口味、澄明度(液體)、均勻度(固體)等。
1.2.2.1 制劑與試驗藥的相似性評價
將制劑按照試驗藥與安慰劑分裝,通過簡單隨機的方法分別標注為 A 藥、B 藥(A、B 藥一個為試驗藥一個為安慰劑,但不確定哪個為試驗藥,哪個為安慰劑)。另取一部分試驗藥樣品作為參比藥物,A 藥、B 藥和試驗藥樣品全部采用試驗藥的劑型。
給每位評判者同時發放 A 藥、B 藥和試驗藥樣品,讓評判者將 A 藥和 B 藥分別與試驗藥樣品從外形、顏色、氣味和口味等幾個方面對其相似性進行評價,允許評判者打開藥物的最小包裝(如膠囊),并在視覺模擬量表上進行評分。與試驗藥樣品完全一樣為 10.0 分,比較相似為 7.5 分,不確定為 5.0 分,差異較大為 2.5 分,完全不一樣為 0 分。評分越高,說明與試驗藥越相似。最后比較 A 藥和 B 藥在形、色、氣、味上的評分差異,兩藥評分越接近,說明安慰劑模擬效果越好。
1.2.2.2 制劑與試驗藥相似度的一致性評價
采用相似性評價的數據,擬定評分>5 分為與試驗藥樣品相似,評分≤5 分為與試驗藥樣品不相似;分別計算 A 藥和 B 藥與試驗藥在形、色、氣、味 4 個方面的相似度,及同一名評價者對 A 藥和 B 藥與試驗藥相似性的一致性程度。如果相似度越大、一致性越高,都說明安慰劑模擬效果越好。相似度=兩藥相似的例數/總評判人數×100%。一致性=(A 藥和 B 藥均與試驗藥相似例數+A 藥和 B 藥均與試驗藥不相似例數)/總評價人數×100%。
2 結果
2.1 試驗藥物可能性評價
20 位評判者,分別來自于藥品生產廠家、臨床研究人員(研究者、研究護士、質控人員等)和患者。試驗藥物和安慰劑分配在人群中的分布均衡(Fisher 精確概率 P=0.665 6,見表 1)。

評判者對所發放藥物的判斷結果顯示,10 人不確定所發藥物是安慰劑還是試驗藥,7 人認為自己的藥物可能是安慰劑,3 人認為自己的藥物可能是試驗藥,無人對所發放的藥物做出肯定是試驗藥或者肯定是安慰劑的判斷。揭盲其評價的藥物,發放安慰劑的 10 位評判者中,2 人認為可能是試驗藥,3 人不確定是安慰劑還是試驗藥,5 人認為可能是安慰劑;在發放試驗藥的 10 位評判者中,1 人認為可能是試驗藥,7 人不確定是安慰劑還是試驗藥,2 人認為可能是安慰劑。揭盲后,評價者對于兩種藥物的判斷差異無統計學意義(采用 Fisher 精確概率,P=0.331 7),接受評判者判斷制劑為試驗藥物的比例一致的結論,結果見表 2。

2.2 形、色、氣、味模擬效果評價
2.2.1 制劑與試驗藥的相似性評價
由于允許評判者打開膠囊,所以除外形是對藥物包裝(包括最小包裝,如膠囊外殼)的評價外,顏色、氣味和口味均是評判者打開膠囊后對內容物的評價。揭盲后,A 藥為安慰劑,B 藥為試驗藥,與試驗藥相比,兩種藥物在外觀和顏色上相似性評分較高,但在氣味和口味評價上安慰劑的相似性評分較試驗藥低。采用配對 t 檢驗,兩藥除外觀的評分差異無統計學意義(P>0.05)外;顏色、氣味、口味與試驗藥比較差異均有統計學意義(P<0.05)(表 3)。


2.2.2 制劑與試驗藥相似度的一致性評價
A 藥與試驗藥比較,在外觀上與試驗藥完全一樣(相似度為 100%),顏色、氣味和口味與試驗藥的相似度分別為 50%、10% 和 15%;B 藥與試驗藥比較,在形、色、氣、味四個方面均完全一樣(相似度均為 100%)。同一評價者對不同藥物在外觀上評價的一致性達到 100%,顏色、氣味和口味的一致性分別為 50%、10% 和 15%(表 4)。

3 討論
安慰劑作為模擬藥物,其感觀如劑型、大小、顏色、口味、氣味等都力求與試驗藥盡可能保持一致,但不含有試驗藥物的有效成分。此外,安慰劑在包裝、用法與用量等方面也需要與試驗藥保持完全一致[8]。在實際臨床試驗中,安慰劑的規格、包裝、用法和用量與被試藥物均可采用統一標準。對于安慰劑的評價主要側重于安慰劑是否有藥物活性,以及安慰劑本身在外觀、顏色、氣味、口味等方面是否與試驗藥一致。
3.1 中藥安慰劑模擬效果
從上述安慰劑整體模擬效果評價實例中可看出,在盲態情況下,拿到安慰劑的評判者認為評價的藥物可能是安慰劑的比例占一半;拿到試驗藥的評判者只有 10% 認為其可能是試驗藥,70% 都不確定拿到的藥物是安慰劑或是試驗藥。總體上,在盲態下,單獨接觸試驗藥或者安慰劑,大多數人都認為可能是試驗藥或不確定是試驗藥還是安慰劑。對于安慰劑形、色、氣、味模擬效果的評價結果顯示,中藥安慰劑與試驗藥在外觀上完全一致,評判者打開膠囊后兩種藥物顏色有一定差異,但在氣味(10%)和口味(15%)上則一致性較低。
從上面結果可看出,由于復方中藥成分復雜,中藥安慰劑在氣味和口味上的模擬制作仍存在困難。基于中藥品種劑型的不同,其具體選料和配比也不盡相同,安慰劑的制作不可能采用統一模式,需要在實際生產中摸索和探討。如果選擇有包衣、薄膜或膠囊的劑型,可以掩蓋中藥特殊的氣味和口味,如不刻意打開膠囊或包衣,一般情況下此類安慰劑能夠滿足盲法的實施需求。本研究評價的安慰劑在顏色、氣味和口味上與試驗藥有差別,但是由于安慰劑是膠囊劑劑型,在很大程度上降低了安慰劑制作的難度。并且,受試者每次用藥統一采用鋁塑泡罩包裝,安慰劑的規格、外觀、包裝、標簽、標識等均與試驗藥一致。如果受試者之間不互相溝通交換藥物,并且不刻意打開膠囊,是不易破盲的。
而中藥的顆粒劑、口服液、丸、散、膏、丹等劑型,則對安慰劑的制作工藝要求較高,有時需根據中藥復方的氣味特點選擇合適的輔料,并選擇一定的藥料配比。也可采用具有一定藥理活性但其活性與研究藥物效果無關的物料制作安慰劑,如在“胃癌前病變早期診斷早期治療的關鍵技術研究”科研項目中,試驗藥物是摩羅丹,其安慰劑采用的是黃豆粉、淀粉、炭黑色素和煉蜜按照一定配比制成的棕色小蜜丸,其氣味、崩解度等均能達到試驗藥的標準[9]。還可在安慰劑中添加少量的試驗藥,使其外觀、味道和氣味與試驗藥具有一定的相似性。如在“中德合作中醫藥治療腸易激綜合征的臨床研究”中,試驗藥是中藥湯劑,含黃芪、防風、白芍等 11 味藥,其安慰劑由微火炒至焦黃色的大米加 5% 原藥制成。但此前的基礎實驗結果證實了含 5% 原藥和 10% 原藥的安慰劑對于胃腸動力均沒有影響,無鎮痛抗炎作用[10]。所以對于此類加入一定比例原藥的安慰劑,需要結合藥效學、毒理學試驗研究結果,判斷低劑量藥物是否有藥理活性。
3.2 安慰劑模擬效果評價方法
就安慰劑模擬效果評價方法來看,目前還沒有公認的中藥安慰劑質量評價方法。國外有學者提出了安慰劑質量檢查清單(placebo quality checklist,PQC)的概念,該清單側重從盲法實施是否成功的角度對安慰劑的質量做出評價,但尚缺乏可靠驗證[11]。目前對中藥安慰劑的質量評價多以人工評分為主[9, 12],即在特定條件下,請參與臨床研究的各方人員對安慰劑和試驗藥進行獨立評判,通過觀察和品嘗,對其外觀、顏色、氣味、口味等項目進行打分,以綜合評分結果作為評價考察的指標。
本文介紹了采用人工評判方法從安慰劑成為試驗藥物可能性的整體模擬效果和形、色、氣、味各單項模擬效果的 2 個方面評價安慰劑模擬效果。可以采用不同的評判人員進行評價,也可以是同一批評判者進行評價。后一種情況,需首先進行試驗藥物可能性的安慰劑整體模擬效果評價,以避免評判者在此之前同時拿到不同藥物(安慰劑和試驗藥)進行形、色、氣、味的比較,而無法做出試驗藥物可能性的客觀判斷。對于形、色、氣、味各單項模擬效果評價,本文分別從安慰劑與試驗藥的差異性和安慰劑與試驗藥的一致性評價 2 個方面進行數據分析,這 2 個方面的結果本身具有一致性,只是前者反映的是 2 種藥物與試驗藥相似性的差異,后者表達的是 2 種藥物與試驗藥相似性的一致程度。差異性小,意味著一致性高;反之,差異性大,一致性則低。在實際操作中采用其中一種分析即可達到評價的目的。
但人工評判方法也有不足,不同評判人員可能存在的心理傾向及對于中藥自身的觀感、味感和氣味具有不同的感應性,而導致人工評價方法在一定程度上受主觀因素影響較大。所以在模擬效果評判的標準化和客觀量化方面仍有待進一步提高,這也是行業內中藥安慰劑模擬效果評價面臨的共性問題[13, 14]。針對人工評判中存在的問題,有研究人員提出了改良方案[15],建議在評判中增加隨機設計以排除評判者的主觀偏倚。如將試驗藥和安慰劑按照“試驗藥+試驗藥”及“試驗藥+安慰劑”分別包裝,并隨機分發給若干評判者,評判者在盲態下獨立對所發放包裝中的兩份樣品(“試驗藥+試驗藥”或“試驗藥+安慰劑”)在外形、顏色、氣味、口味、澄明度(液體)、均勻度(固體)等方面的一致性(或差異性)進行評價,并在表格上進行評分。采用此法可盡量減小評判者的主觀傾向。目前還有學者開始嘗試采用智能感官分析技術評價中藥安慰劑質量[16],通過視覺傳感器、電子鼻、電子舌等技術來測定安慰劑在形、色、氣、味等方面與試驗藥的一致性,將主觀評判轉化為客觀數據,以實現評判的標準化控制[17, 18]。
3.3 對中藥臨床試驗盲法實施的思考
在中藥新藥Ⅱ期臨床試驗中可進行多個探索性試驗,如劑量探索、用藥方法探索等,對照組可采用安慰劑、陽性藥或不同劑量對照等。臨床試驗中制作安慰劑的目的是為了保證盲法的實施,除了不同劑型對盲法實施效果有影響外,不同的試驗設計的盲法實施的難度和方法也各不相同。
對于劑量探索臨床試驗,其對照藥物的設計可以按照不同劑量組日服生藥量進行折算,如高劑量組為 100% 原藥,中劑量和低劑量可分別做成減低濃度的制劑,只要保證各個劑量組日服生藥量達到設計的日服生藥量即可,每天分若干次服用。由于每個劑量組藥物均含有一定比例的原藥,更容易達到不同劑量藥物間氣味和口味的一致。
對于藥物用法的探索性臨床試驗,以探索某一中藥口服液每日給藥次數為例,設計 2 種服用方法,分別是每日服用 4 次和服用 3 次,試驗藥為按照日服生藥量計算的 100% 濃度原藥,試驗組 1 按照一天 4 次、每次 2 支進行藥物的服用(早、中、晚和晚睡前各服 1 次);試驗組 2 在早、中、晚各服用 1 次,一天服用 3 次。但為了實施盲法,在晚睡前服用含 10% 原藥的低劑量藥物;對照組每日在早、中、晚和晚睡前各服用 1 次含 10% 原藥的低劑量藥物。對于這種藥物服用方法探索的盲法試驗,試驗組 2 受試者同時服用了 100% 原藥的高劑量藥物和 10% 原藥的低劑量藥物,如這 2 種藥物氣味和口味相差較大,則非常容易導致該試驗組破盲。在實際操作中,將 3 個組(每日用藥次數不同的 2 個試驗組、1 個對照組)早、中、晚服用的藥物全部貼上 1 號藥標簽,晚睡前服用的藥物貼上 2 號藥標簽,明確告知受試者睡前服用的 2 號藥不同于早、中、晚服用的 1 號藥。這樣一來,即使試驗組 2 的受試者嘗出 1 號藥和 2 號藥口味有差異,不排除另外 2 個組的受試者由于自身感覺的差異,在看到其服用不同藥物標簽的藥物(早、中、晚為 1 號標簽,睡前為 2 號標簽)后,也會產生藥物口味有差異的感覺,以此混淆了受試者對其所在組別的判斷,最終達到盲法的目的。
在實際的臨床試驗操作中,破盲的發生,除因安慰劑制作外觀上的明顯不一致外,當試驗藥物有特殊的不良反應或/和功效時, 安慰劑也容易被破盲;另外,還可能出現因受試者或研究者對試驗藥和安慰劑對比服用所致破盲。在臨床試驗中,如有規范的藥品管理和質量控制,可以防止該情況的發生[19]。目前多數中藥安慰劑制作和以上安慰劑評價的案例一樣,外形上基本可以滿足要求,不一致部分主要在顏色、氣味、口味的模擬效果[20]。因中藥安慰劑制作仍存在一些技術困難,如在試驗前對安慰劑模擬效果的評價出現差異,一是應在試驗過程中重視藥品管理,關注藥品的發放、使用、回收,并采取相應的措施,防止受試者或研究者同時拿到 2 個制劑(試驗藥和安慰劑)并對比服用導致破盲的情況發生;二是應在試驗完成時,分別由研究者和受試者評價其所接受的干預措施,以判斷是否破盲。對同一種干預措施破盲者與未破盲者的效應進行評估,如兩者差異明顯,需進一步進行分析以評估破盲對試驗結果的影響大小。
綜上所述,安慰劑的成功制作對于提高臨床患者的依從性,保證臨床試驗的順利實施和試驗結果的科學性具有一定意義。相信隨著中藥制劑臨床研究的深入開展,中藥安慰劑的生產研制技術會更加成熟。安慰劑的制作及模擬效果只是實施盲法試驗中的一個環節,由于中藥安慰劑在色、氣、味上的特殊性,很難做到安慰劑與試驗藥完全一致。所以,在臨床試驗過程中,對于受試者和研究者依從性的管理非常重要,需要避免人為或有意破盲,以保證整個臨床研究的完整性和可靠性。