在臨床干預試驗中,運用隨機分配是對照試驗中控制偏倚和混雜的最佳工具。研究人員必須確保在試驗報告中包含讀者所需要的信息,以判斷結果的有效性及其意義。事實上,完整的試驗報告可讓臨床醫生改進他們的臨床實踐,以反映當前最佳證據,并改善患者臨床終點。制定 CONSORT 聲明可協助研究人員、作者、審稿人及編輯了解臨床試驗報告中所需的必要信息。CONSORT 聲明適用于任何干預措施,包括草藥產品。當前草藥干預措施的對照試驗未充分報告 CONSORT 建議的信息條目。我們希望最近制定的 CONSORT 建議條目擴展版能更準確地報告草藥干預措施隨機對照試驗,使其更加完整。我們編寫的這份解釋性文件除概述了每項建議的理由外,還提供了 CONSORT 條目和相關詳細說明,并為每項建議提供了良好報告和經驗證據的范例,以幫助作者能更好地運用它們。隨著越來越多的證據積累和反饋意見的收集,這些有關草藥產品臨床試驗報告的建議可隨時進行修訂。
引用本文: 田然, 林偉青, 段玉婷, 商洪才, 張弛, 卞兆祥, 譯. 報告草藥干預措施隨機對照試驗的建議:解釋和說明. 中國循證醫學雜志, 2021, 21(1): 100-110. doi: 10.7507/1672-2531.202008179 復制
隨機對照試驗(randomized controlled trials,RCT)為醫療保健干預措施的療效提供了最佳證據[1]。詳細計劃和良好執行的隨機對照試驗,為我們提供了對干預措施治療效果的最佳評估,以此指導臨床決策[2, 3],但一些試驗常因方法學不嚴謹,受到偏倚或混雜因素的影響,導致過高或過低評估了干預措施的治療效果[4-9]。因此人們一直在努力改進 RCT 的設計和報告質量[1, 6, 10, 11]。
當前的研究表明:補充和替代醫學(complementary and alternative medicine,CAM)試驗的報告質量較差[12, 13]。Linde 等[12, 14]發現,大多數 CAM 試驗并未描述隨機序列的產生、適當的分配隱藏方法、脫落和退出的病例數量和理由[12]。Moher 等[9, 13]指出,與兒科相關的補充和替代醫學的隨機對照試驗報告中,報告的內容不足 CONSORT 報告清單條目的 40%,而隨著時間的推移,雖然報告內容增加了 24%,但總體而言,這些試驗報告中報告的信息內容仍不足報告清單的一半。特別值得指出的是,只有不到 50% 的試驗報告了隨機序列的產生方法,僅 25% 的試驗報告了是否采用了分配隱藏[13]。這些結果表明,大部分補充和替代醫學RCT的報告質量較差,導致對內部和外部效度的評估很困難[12, 13]。
Linde 等[12](2001 年)的研究表明,不同類型補充替代療法研究的報告質量可能會有所不同,其中草藥試驗比順勢療法和針刺試驗更好,但一些系統評價指出在植物藥試驗報告中,仍未能為判斷內部效度、外部效度和可重復性提供所需的信息[15, 16](Gagnier JJ,2003 年,未發表的數據)。一個針對以英文出版的 206 個草藥 RCT 報告質量的研究發現,CONSORT 聲明中所建議條目報告內容不到 45%[17]。例如,大約 28% 的試驗描述了執行干預措施的人員是否對分組使用了盲法,只有 22% 的試驗描述了執行分配序列的方法,而 21% 的報告描述了產生分配序列的方法。此外,不同植物藥的臨床試驗報告質量也各不相同,且從 1980 到 2000 年間,一直在改善中[17]。有研究發現草藥臨床試驗的報告,常不包括草藥產品本身的詳細信息[15](Gagnier JJ,2003 年,未發表的數據)。
眾所周知,草藥可能會因所用植物的部位、采集時間、活性成分水平、提取類型(水、酒精、甘油)和服用方法而產生差異。因此即便使用相同的植物種類,不同產品的臨床試驗結果也可能有很大的差異。由于合并數據可能導致無效的推論,因此有差異的草藥產品的兩次試驗通常會被排除在系統評價之外[14, 15](Gagnier JJ,2003 年,未發表的數據)。顯然,讀者、編輯和審稿人要求增加植物藥 RCT 報告的透明度。現在,對照臨床試驗的報告規范也已被制訂。
CONSORT 聲明于 1996 年首次發布,并于 2001 年進行了修訂[7, 8]。該聲明包括一個清單和流程圖,用以指導作者和審稿人有關雙組平行設計 RCT 發表時應報告的信息資料[7, 8]。CONSORT 聲明已得到了許多行業領先的醫學期刊、編輯協會、專業協會和資助機構的認可[9]。自發表以來,CONSORT 聲明已制定了不同擴展版[10, 18],最近 CONSORT 已擴展到整群隨機試驗[18]和評價治療危害性的試驗[10]。此外,一個國際針刺研究工作組提出了一系列建議,用以改善針刺平行試驗中干預措施的報告(針刺對照試驗報告標準或 STRICTA)[11]。盡管這不是 CONSORT 的正式擴展版,但 MacPherson 等[11]將 STRICTA 描述為對 CONSORT 條目 4 的詳細說明,并建議作者在報告針刺試驗時將 STRICTA 與 CONSORT 結合使用。
2004 年 6 月,一個由臨床試驗學家、方法學家、藥理學家組成的國際小組在加拿大多倫多進行了共識會議,討論了草藥研究報告的建議[19](表 1 和表 2)。由此產生的指南對當前的 CONSORT 條目如何適用于草藥臨床試驗報告進行了詳細闡述,這將有助于編輯和審稿人評估草藥試驗的內、外部效度和可重復性,從而準確評估草藥干預措施的安全性和有效性。

通過闡述擴展條目的細節和理由,此說明文件將有助于研究人員計劃、開展和撰寫草藥 RCT 報告。在本文中,我們討論了每一條目擴展的理由和科學背景,并提供了良好報告的范例。在可能的情況下,我們也討論了每個條目擴展的經驗證據。應當指出,每個詳細的解釋說明都是對現有 CONSORT 建議條目的補充,因此所有 CONSORT 原條目都首先在表 1 中列出,而詳細的解釋說明在表 2 中列出。
1 CONSORT 用于草藥干預措施試驗的詳細說明
我們已詳細闡述了 CONSORT 用于草藥干預試驗的必要說明。在報告草藥的 RCT 時,除了這些詳細說明中建議的信息外,作者還應考慮是否報告 CONSORT 聲明中所闡述的內容。在以下內容中,我們不僅列出了 CONSORT 原始條目(常規)的內容,還列出了專門針對草藥干預措施 RCT 的詳細說明(條目內容中字體加粗部分)。源自試驗報告的摘錄包括了 CONSORT 條目建議的信息和已拓展的詳細說明。
1.1 標題和摘要
1.1.1 條目 1
受試者如何接受干預措施分配(如“隨機分配”、“隨機化”或“隨機指派”)。標題或摘要或兩者應說明草藥產品的拉丁學名,所用植物的部位及制劑的類型。
1.1.2 范例
題目:“銀杏(Ginko biloba)提取物 Egb 761 在認知功能完善的老年人中進行的一個雙盲安慰劑對照的臨床試驗:神經心理學研究結果”[20]。
摘要:“這是一個隨機雙盲安慰劑對照的……治療組接受了含有 300 mg 大蒜粉(Garlic Powder,Kwai)……這相當于每日大約 2.7 g 或大約 1 瓣鮮大蒜”[21]。
1.1.3 說明
CONSORT 條目 1 旨在幫助 RCT 報告在電子數據庫中的索引和標識[1]。因此需要使用“隨機”、“隨機化”或“隨機分配”一詞。在文章標題和摘要中,有必要附加語言文字說明是草藥的臨床試驗。
循證草藥臨床實踐,需要文獻支撐。識別草藥的臨床試驗,要求在文章的標題和摘要中報告草藥的拉丁學名、所用植物的部位及制劑類型。這些信息將有助于特定草藥產品或制劑的 RCT 索引和標識。一些草藥可能有特定的商標或商品名;如果合適,那么這些名稱應該與所含植物的拉丁學名一起列出。當試驗中使用的草藥產品為復方品種時,我們建議在標題中列出產品名稱,并在摘要中列出該產品中包含的所有草藥品種。這樣臨床報告文章的標題就不會因為要列出所有單獨的草藥拉丁學名而太長。
研究表明,由于不同數據庫檢索詞和索引程序的多樣性,檢索與 CAM 相關的主題具有挑戰性[22]。有研究發現,如果 CAM 試驗(例如植物藥試驗)的作者在摘要或標題中不參考標準檢索詞匯,數據庫可能無法為其分配適當的索引詞[22, 23]。另外,數據庫沒有對不同 CAM 干預措施建立足夠的索引詞及屬性描述也是一個問題[24]。在報告草藥 RCT 時,在標題和摘要中使用前面建議的說明內容,可能會改善索引和檢索情況。
2 介紹
2.1 背景
2.1.1 條目 2
科學背景和基本理由說明,包括關于使用特定草藥產品的簡要試驗理由;如適用,說明所試驗的為新適應癥或傳統適應癥。
2.1.2 范例
“銀杏葉提取物 Egb 761 是一種復合物,以黃酮醇糖苷(24%)和萜烯內酯(6%)含量為質量標準[1, 2]。已經證實含這兩類化合物的 Egb 761 在治療外周血管和腦血管疾病、年齡相關性腦損傷及缺氧或缺血綜合征方面的有益作用[1, 3]。體外進行的電子自旋共振(electron spin resonance,ESR)研究表明,Egb 761 是多種活性氧的有效清除劑,包括超氧化物陰離子根(O2?)和羥基根(HO?)[4]。最近用動物模型進行的體外研究表明,該提取物可能在心肌缺血再灌注損傷中發揮抗自由基作用。在這些研究中[5, 6],在用于灌注離體缺血大鼠心臟的溶媒中加入 200 mg/L 的 Egb 761,可顯著改善缺血后舒張功能的恢復,減少室性心律失常和酶滲漏,降低自旋截留氧自由基在冠狀動脈流出物中的含量。有趣的是,如在心臟灌注之前給動物口服 Egb 761,也觀察到了抗心律失常的作用,但只有高劑量(100 mg/kg,持續 10 天)才能顯著降低室性心律失常[5]。除使用 Egb 761 進行這些研究[5, 6]外,許多其他相關動物實驗研究也表明,活性氧的還原形式包括 O2?、HO?和過氧化氫(H2O2),參與心肌缺血性灌注后組織損傷的發病機制[7-10, 25]。在進行 CPB(心肺搭橋)手術的患者為治療對象的雙盲研究中,我們對通過手動觸診的體外循環手術患者,評價了 Egb 761 口服治療對于心臟的保護作用[25],體外試驗證實 Egb 761 具有抗氧化特性[4-6]。”
2.1.3 說明
對照臨床試驗報告的背景部分,部分是為了闡明試驗的理由[1],同時提供個別干預措施的特定文獻支持。現有草藥產品類型存在很大的異質性。同一草藥的兩種不同制劑可能具有不同的植物化學特性、不同的藥代動力學特征等。鑒于不同產品的異質性,就所研究草藥產品的科研數據(例如 Egb 761)及其研究理由應清楚地闡明。如果沒有可供參考的臨床試驗數據,基于臨床前研究數據(即動物研究、觀察性研究、病例報告、已知機制)的推論亦可接受。如果沒有關于該研究產品的數據,則應參考與當前試驗中所評價產品類似的研究資料。在理想情況下,應該很清楚地說明這些信息,包括對使用的草藥產品的先前研究進行系統評價[1, 26]。
另外,如果作者評價的是傳統適應癥,則應報告對該適應癥所依據的理論和相關概念。具有該領域相關知識的讀者應該能夠確定該適應癥的理由。例如,中醫藥臨床試驗選擇了驗證中醫診斷(例如肝血不足)而不是西醫診斷(例如肝炎)的疾病。如是,那么作者應該清楚地說明為什么選擇特定干預措施。例如,在傳統中醫中,“內關”穴位(EH-6,EH 代表心臟經絡)被認為與心臟的功能有關(Chuang,1977)。最近一些研究者(Mah 等,1992;Hsu 等,1989)觀察到,針刺內關穴可改善冠心病患者的左心室功能[27]。
此外,其他有助于構建臨床試驗依據理由的數據(如臨床試驗、動物試驗、觀察性研究、病例報告、已知/推測的機制),即使是針對傳統適應癥,也可在背景部分進行描述。這是基于研究假設能夠被清晰闡明的理由,可能來源于科學性的、經驗性的、歷史性的,或者傳統意義上的資料。
3 方法
3.1 受試者
3.1.1 條目 3
受試者的合格標準及收集數據的試驗場所設置和地點。如果是評價傳統適應癥,則應描述如何應用傳統理論和概念。例如,受試者的納入標準應反映傳統理論和概念的要求。
3.1.2 范例
“臨床試驗中有 118 例受試者,隨機分為兩組:清絡通痹顆粒治療組和雷公藤多甙對照組。在治療組(n=63)中,男 18 例,女 45 例,年齡 18~65 歲,平均 39.5±16.6 歲,病程 2~22 年,平均 7.5±3.6 年。根據美國風濕性關節炎協會(American Association of Rheumatoid arthritis,ARA)設定的標準對這些患者進行 X 光線分級:I 級 7 例,II 級 30 例和 III 級 26 例。對照組(n=55)中,男 10 例,女 45 例,年齡 18~65 歲,平均 38.3±16.7 歲,病程 1~21 年,平均 6.9±3.1 年。其中,I 級 15 例,II 級 21 例,III 級 19 例。兩組病例在性別、年齡、病程和 X 光線分級方面具有可比性(P>0.05)。
診斷標準和中醫辨證標準:ARA 的診斷是根據 1987 年修訂的 ARA 標準進行的。中醫辨證陰虛血熱:關節灼痛、局部腫脹或畸形、僵硬;皮膚發紅、有熱感;低燒;口干;尿黃;舌苔紅或暗紅色,有瘀斑,皮毛發黃或油膩或稀少,有裂痕;脈細數滑或細數。
該研究包括住院和門診患者,這些患者被診斷為陰虛血熱型類風濕性關節炎[28]。”
臨床試驗的外部效度和可推廣性在一定程度上取決于受試者的合格標準[1]。在草藥干預措施試驗中,關于合格標準的報告通常很少。一個研究發現,不到 75% 草藥干預措施的 RCT 充分報告了受試者的合格標準[17]。因此,通過閱讀已發表的臨床試驗報告,發現其中 1/4 的報告無法判斷其可推廣性。旨在評價傳統適應癥的草藥臨床試驗,必須報告受試者的合格標準。
與此相關的,作者可選擇排除以前使用過該特定草藥產品的受試者。例如曾有報道在試驗開始之前使用草藥產品會導致副作用增加的情況。在艾菊(Feverfew)[29]對照安慰劑預防偏頭痛的試驗中,納入了正在使用艾菊的受試者,導致安慰劑組受試者出現了更多的副作用,這可歸因于“艾菊停藥后綜合征”,即與戒斷反應相當。其他試驗也有過報道:長期使用艾菊,停止使用后出現系統性癥狀加重[29]。到目前為止,沒有經驗證據表明草藥的臨床對照試驗之前使用該草藥,對治療效果的估計存在偏差。盡管如此,仍建議在采用和報告合格受試者標準時,排除最近使用過該草藥的受試者。
3.1.3 范例
“排除先前用貫葉連翹(至少 450 mg/d)治療抑郁癥,或上個月因任何理由服用過貫葉連翹的受試者。為減少納入潛在的治療無效病例,排除在當前抗抑郁藥(鹽酸氟西汀 20 mg/d,至少 4 周或同等水平)試驗無反應的,或在之前超過 1 個抗抑郁藥試驗中無反應的受試者[30]。”
草藥臨床試驗報告數據收集的環境和地點至關重要[1]。地點高度概括了可能影響研究可推廣性的物理因素(如氣候和食物來源)、經濟因素、地理因素及社會文化因素等。同樣,研究環境可因機構、資源、經驗、基準風險和外觀等有很大差異[1]。一個研究發現,不到 40% 的草藥試驗報告充分報告了試驗環境和地點[17]。試驗結果的外部可推廣性部分取決于這些信息的完整性。
3.1.4 條目 4
各組干預措施的詳細信息及實際實施的方式和時間。如適用,對于草藥干預措施的描述應包括表內以下內容:

任何干預措施需要完整描述的信息類型與待評價的干預措施類型有關。如將外科手術作為干預措施的試驗,可能需要完整地描述施行手術的個體[1, 31]。對于草藥,則需要上述信息來判斷試驗用藥的關鍵特性。對試驗用藥的完整描述將有助于判斷其相對于其他產品的功效和安全性。
含有草藥成分的商業產品種類繁多[32-34]。此外,這些產品的成分含量有很大的差異[34-40],一些產品通常不會列出標簽上注明的各個成分的含量(重量、體積和比例)[41],有的甚至不列出任何成分。即使是相同植物種類的產品(如貫葉連翹)也通常包含不同含量的植物標記物/活性成分。例如,有研究表明以下植物種類的商品,其相應成分的含量不同:貫葉連翹(圣約翰草)[42, 43]、茶花(綠茶)[41]、單葉艾菊(Feverfew)[37-39]、刺五加(西伯利亞人參)、西洋參(美國/加拿大人參)[34]、金印草(白毛茛)[44]和 Paullinia cupana(瓜拉納)[45]。因此,不同產品之間的藥理學特性和體外活性可能會有所不同[33, 46]。此外,一些研究表明,某些植物產品不僅包含不同的有益成分,有益成分含量亦有所不同[47, 48]。因此,草藥干預試驗的作者有必要完整描述所使用的產品。
3.1.4.1 草藥產品名稱(4A)
范例:“AG(西洋參)膠囊包含由同一供應商(Chai-Na-Ta Corp.,BC,Canada.)供應的 3 年生/安大略種植、干燥、磨碎的西洋參根(Panax quinqueefolius L.)……這是同樣的商品,但批次與原始批次不同[49]。”
草藥試驗報告應注明拉丁學名和通用名稱連同命名者姓名和所屬科的名稱。在條目 1 中,也建議報告拉丁學名和通用名稱。按國際公認的植物命名法[50],植物的科學名必須包括拉丁雙名(屬和特定的上位詞)及權威命名者姓名。例如,屬:蒲公英,上位詞:鐵皮石斛,權威命名者:林奈。因此,全名應為 Taraxicum officinale L.(林奈在這里縮寫為L.)。附加命名者確認了最初描述此植物的人。常用名稱也應在此處列出(如蒲公英、艾菊、圣約翰草)。單獨使用通用名稱是不夠的,因為不同的草藥種類可能具有相同的通用名稱。例如,Echinacea 是 Echinacea angustifolia、Echinacea pallida 和 Echinacea purpura 的通用名稱。但這些植物具有不同的生化特征[51]。
如有關聯,應報告專利產品名稱(商標名稱,如 Kwai)或提取物名稱(如 LI 160)和產品的制造商。這些名稱是識別特定草藥產品(包括其內容及制造或生產)的快速方法。但僅憑這些名稱不足以描述產品信息。
作者還應該報告該產品是否在臨床試驗的地區獲得注冊許可及為草藥產品頒發許可證的具體監管機構。在不同的司法管轄區,獲得許可證的規定各不相同。盡管許可證不能保證產品質量或為讀者提供充足的草藥產品描述,但它讓讀者確定特定草藥的監管狀態和可獲得性。
3.1.4.2 草藥產品的物理特性(4B)
范例(生草藥):“人參膠囊包含 3 年生安大略干燥和研磨的人參根。所有人參和安慰劑膠囊都來自同一批次[52]。”范例(提取物):“……所有患者在 30~60 分鐘內輸注銀杏特殊提取物 Egb 761(批次號:5242)(1 個干瓶的 Egb 761 溶于 500 mL 等滲溶液),每天 1 次。干燥的小瓶中含有 200 mg 的銀杏葉干燥提取物(藥物萃取比為 50∶1),……3 mL 溶液中的 H2O 用作溶劑[53]。”必須對草藥產品的物理特性有完整的描述,包括產品或提取物中所含植物的部位及產品的類型[如生(新鮮或干燥)或提取物]。產品中的植物部位與所含成分的數量和種類有關[54]。此外,產品類型亦應該報告,因為不同的產品形式有不同的類型和成分含量[55]。如果產品是提取物,應報告提取溶劑的種類和濃度(如 80% 酒精,100% 水,90% 甘油)及植物與植物提取物的比例[如植物∶植物提取物(2∶1)]。該比例告訴讀者生產特定量的最終提取物需要多少植物原料(按重量或體積)。原料認證的方法(即完成方式和由誰進行認證)描述了如何鑒別原料或植物,并允許讀者在一定程度上判斷草藥產品的原料是否來源于被報告的植物。原料的批號為讀者提供有關原料來源的關鍵信息。
3.1.4.3 劑量方案和定量說明(4C)
范例:“該治療提供 252 片含有 50 mg 銀杏標準化提取物 LI 1370(含有 25% 的黃酮類化合物,3% 的銀杏內酯和 5% 的雙葉內酯)或安慰劑(均由 Lichtwer 制藥提供)。受試者每天服用 3 片藥片,持續 12 周。銀杏葉提取物及其劑量的選擇是根據先前試驗的結果,據報道該提取物可有效治療腦供血不足[56]。”
草藥試驗的作者應報告劑量方案并提供草藥產品的定量說明。試驗劑量和療程的相關信息對于重復試驗、確立特定劑量和療程情況下藥物的療效或副作用及其外部可推廣性,都非常重要[1]。試驗劑量和療程的理論依據應該是明確的,因為不清晰的描述會引起對試驗方法的質疑,并可能會引發一些倫理問題,如為何要開展這個試驗。
應該報告所有草藥產品成分的重量或含量,無論是天然的還是按劑量單位形式添加的(即添加的材料,如粘合劑、填充劑、賦形劑;如每粒膠囊含 17% 的麥芽糊精,3% 的二氧化硅),及每個劑量單位形式的活性成分/標記成分的百分比(如每粒膠囊含 0.3% 金絲桃素)。這為讀者提供了植物產品成分量化的概述。
3.1.4.4 定性測試(4D)
范例:“不同類型的人參皂苷(Rg1,Re,Rf,Rb,Rc,Rb2 和 Rd),其為人參屬中的達瑪烷皂苷,由加拿大安大略省渥太華大學理學院生物系的阿納森使用高效液相色譜(high-performance liquid chromatography,HPLC)法分析,該方法類似于美國植物評議會人參評估項目開發的評估程序[27]。具有反相超球體 C-18、5 微米十八烷基硅烷的 HPLC 系統,使用 250×4.6 mm 色譜柱進行分析。用于比較的人參皂苷標準品由兩個來源提供。Rg1 和 Re 由伊利諾伊大學的 Fong 博士提供,Rf,Rb1,Rc,Rb2 和 Rd 由 In Somefine Chemical Co.,Somerville NJ 提供[57]。”
臨床試驗應報告草藥產品的化學指紋圖譜和使用的方法(機械和化學參考標準)及執行者(使用實驗室的名稱)。可在描述草藥產品關鍵成分的圖表或表格中報告指紋圖譜。使用正確的技術進行化學分析對于提供清晰準確的產品成分報告至關重要,并且可提供定性和定量信息[58-60]。Bauer 和 Tittel[61]提供了一些用于藥理學、臨床和毒理學研究的植物材料表征和標準化的指南。分析團體協會(the Association of Analytical Communities,AOAC)也概述了分析特定草藥產品的標準[62]美國植物理事會出版的《美國草藥藥典》[63]和美國藥典[64]。報告可能還會描述憑證樣本(即保留樣本)是否被保留;如果保留,則描述在何處保存或存放,以便有獨立的樣本可供驗證化學特征。因此,在相關的報告中應包括對所有特殊測試/純度測試(例如,重金屬或其他污染物測試)的完整描述及有害成分的去除(其方式及方法)。所有這些方法都是相關的,因為它們可能會改變草藥產品的成分。
標準化一直是文章中的辯論焦點[58]。通常,公司或研究人員經常將植物產品標準化為特定的化學“標記”成分。這些“標記”成分可被視為主要的“活性”成分,或僅用作產品化學特性的指標[58]。盡管商業市場上的產品可能尚未標準化,并且經常不知道“有效”成分,但如果在草藥產品的臨床試驗中進行了標準化,則應進行報告。作者應報告產品標準化的內容(如化學成分)、完成方式(如化學反應過程或活性的生物/功能度量)[66]及每個劑量單位形式中該特定成分的百分比。
3.1.4.5 所用對照/安慰劑類型的理論依據(4E)
范例:“此外,安慰劑由含有玉米粉的相同膠囊組成。安慰劑的能量、碳水化合物含量和外觀被設計為與 AG(美國花旗參膠囊)相類似[49]。”
在草藥臨床試驗中,像在其他試驗中一樣重要的是要完整地描述對照組的特征及其設盲方式[1]。如果使用安慰劑對照,則安慰劑應與對照的干預措施密切匹配[67]。對于草藥干預措施試驗,應當描述使用該對照/安慰劑類型的理由。有一些試驗報告使用安慰劑的顏色和氣味與活性干預措施相匹配,但安慰劑包含一定的自身活性成分[68]。如果對照組使用的安慰劑有一定的活性,則它與試驗組之間的比較將會造成影響。設計與某些草藥產品相匹配的安慰劑,雖然是一種挑戰,但并非不可能。
3.1.4.6 對于實施干預措施的研究者的描述(4F)
范例:“為參與研究,醫師必須是擁有醫學學位的醫學專家,獲得德國醫學針灸學會的中醫認證學位,并且至少有 5 年的中醫實踐經驗(根據德國針灸學會工作組標準)。中藥組的草藥配方由中醫師(Carl-Hermann Hempen)設計,并由 1 名藥劑師來制備,他們均是中草藥專家(S. Dietz,Franz-Joseph Pharmacy,慕尼黑,德國)。除了基本處方外,每位患者還根據“辨證論治”服用第二種附加處方(表 3)[69]。”

有時候,草藥干預試驗可能包括 1 名實施者作為干預措施的一部分。不同研究人員擁有不同的培訓水平、年資、理論偏向及在不同環境中的工作經驗。類似于外科手術試驗,此類試驗應提供對作為干預措施一部分的實施者的描述(例如,培訓和實踐經驗)[1]。
3.2 結果
3.2.1 條目 6
清晰定義主要和次要結局測量指標,及在適用時使用任何方法提高測量質量(如多次觀察,評估人員的培訓)。終點指標應反映干預措施和受試適應癥的考慮,如適用,包含其基礎理論和概念。
3.2.2 范例
“在基線和治療后 30 天隨訪時評估所有終點措施。主要終點措施是生活質量的變化,該變化通過 12 個簡短健康調查(the 12-item short form health survey,SF-12)的“身體和心理組成部分摘要”量表進行衡量。SF-12 被廣泛用于測量健康和生活質量,并且與原始 36 個簡短健康調查(the 36-item short form health survey,SF-36)的分數顯示出較高的一致性[11]。SF-36 在幾個中國研究中得到了驗證,而對 SF-12 的評估正在進行中[11]。次要結局指標包括對身體機能、記憶力、性功能和“氣”……“氣”的評估量表包含 17 個指標(由訪調員管理的問卷中有 14 個,而身體檢查則有 3 個),是通過國際合作由中醫藥領域具有專業知識的臨床研究人員研發的。問卷調查表針對的是中醫傳統問診中通常包括的癥狀,包括呼吸、精力、食欲、胃灼熱、出汗、腸蠕動、疼痛、溫度、睡眠習慣和性能力。體格檢查條目涉及舌苔、舌質和脈搏,該量表是為這個研究開發的,尚未進行驗證。14 個問卷條目的得分為 0~4 分,體檢項目的得分為 0~3 分。“氣”的量表的總得分是每個得分的總和,范圍從 0(最佳)到 65(最差)[70]。”
與任何 RCT 一樣,主要和次要終點指標應與適應癥相關,要充分報告并描述用于提高終點指標質量的任何方法[1, 8]。使用 RCT 評價草藥干預措施時,可能出現與西方醫學術語和概念不能融合的情況。例如,在上述試驗中,據稱要評價的特定中草藥可提高壽命、生活質量、精力、記憶力、性功能和氣。“氣”是一種中醫概念,大致可理解為生命能量。因此,除了健康和生活質量的衡量標準之外,這些研究人員還采取“氣”作為衡量指標,測量該試驗過程中生命能量的變化。最終,為了評價傳統草藥的功能,我們建議終點指標應反映基礎理論和概念,并且應反映研究中特定草藥干預措施的適應癥。
4 結果
4.1 基線數據
4.1.1 條目 15
每組的基線人口統計學和臨床特征。包括合并用藥或合并用草藥產品。
4.1.2 范例
“8 例患者(平均年齡 44.9±4.2 歲)使用了艾菊,9 例患者(平均年齡 51.2±2.3 歲)使用了安慰劑膠囊。在研究前,試驗組的受試者每天服用 2.44±0.2 艾菊小葉,持續了 3.38±0.58 年,安慰劑組的受試者每天服用 2.33±0.48 小葉,持續 4.18±0.67 年。因此,兩組在每天消耗的艾菊數量或持續時間方面差異無統計學意義。
每組有 1 例患者正在服用結合型雌激素(Premarin);安慰劑組的患者也正在服用匹佐替芬。1 例服用艾菊的患者合并服用了口服避孕藥 Orlest 21。每組有 1 例患者服用利尿劑:服用艾菊組的患者同時服用了氯拉西,而服用安慰劑的患者服用了含有轉氨環丙胺和三氟哌嗪的產品。此外,安慰劑組中的兩個人正在服用維生素制劑,而一個人服用氯哌嗪[71]。”
受試者進入試驗后的完整描述使讀者和臨床醫生能夠評估試驗與特定患者的相關性。作為草藥產品試驗中基線評估的一部分,作者應明確評估和描述當前使用的任何藥物或草藥產品。組間藥物或草藥產品使用的差異,可能會使結果受到這些混雜因素的影響[72]。
5 討論
5.1 解釋
5.1.1 條目 20
對結果的解釋,考慮到研究假說、潛在偏倚或不精確的來源及多重分析和結局指標所帶來的風險。根據所用產品和劑量方案對結果進行解釋。
5.1.2 范例
“盡管 Egb 761 是常規使用 120 mg/天的劑量治療慢性疾病,但我們選擇服用超常規劑量兩倍以上的該提取物,僅在手術前 5 天服用以應對由于夾鉗松開后過量氧化物的產生。DMSO/AFR 濃度的測量結果表明,Egb 761 處理在再灌注的最初 5 至 10 分鐘內顯著保護了所有采樣部位的血漿抗壞血酸水平(表 3)。血漿 TBArs 濃度的分析表明,Egb 761 治療還抑制(或大大減弱了)MDA 的釋放,表明對自由基誘導的脂質過氧化具有保護作用。這兩個發現為 Egb 761 在心臟直視手術中的保護作用基礎提供了一些線索。據報道,Egb 761 可保護心肌缺血大鼠抗再灌注引起的抗壞血酸減少[6]。我們沒有發現 Egb 761 與 AFR 或 DMSO/AFR 之間有能保持抗壞血酸水平的體外化學相互作用。因此,在發揮其抗氧化作用時,提取物能有效抗衡循環的抗壞血酸(如一旦形成氧自由基,則直接將其淬滅)[73]。”
5.1.3 解釋
臨床試驗報告的討論部分為讀者提供了可確定研究的利弊及該研究與該領域其他研究關系的信息。了解該產品和劑量方案的結果與其他采用相似或不同產品或劑量方案的試驗結果之間的關系,使讀者能夠獲得一個背景知識,從中確定所使用的特定干預措施的優缺點。因此,作者應清楚說明可能導致試驗發現產品或劑量方案的特定原因。
本文在條目 20 下討論了這一概念,以強調草藥 RCT 報告的作者必須明確地將產品和劑量方案視為研究的潛在優勢或劣勢。盡管我們已將其與條目 22 下的闡述正式分開,在當前證據的背景下討論試驗結果(條目 22);但我們認為討論部分這些方面是密切相關的,可一并寫進稿件正文。
5.2 可推廣性
5.2.1 條目 21
試驗結果的可推廣性(外部有效性)。如可能,討論使用的草藥產品與自我護理和/或實踐中使用的產品之間的關系。
5.2.2 范例
“G115 是標準化的人參提取物,通常與多種其他物質組合成為復方制劑并在市場上出售。Ginsana?,Gericomplex?,Geriatric Pharaton?和 ARM229 是幾種已研究的商業標準化人參產品,除 G115 之外還可能包括以下物質中的一部分或全部:維生素、礦物質、微量元素和二甲基氨基乙醇酸氫鹽。
對消費者的忠告:如前所述,FDA 將人參歸為食品補充劑,因此在保健食品商店中廣泛銷售。估計有五千六百萬美國人使用人參產品[6]。但是,Chong 和 Oberholzer[11]指出質量控制存在問題。事實上,最近的一份報告[12]指出,在 50 種商業化的人參制劑中,有 44 種所含人參皂甙的濃度范圍為 1.9%~9.0%,而其中 6 種產品中均未檢測到人參皂甙[74]。”
可推廣性或外部效度,是研究結果在其他情況中成立的程度[75]。這里的“情況”一詞可表示其他個人或人群,或其他類似的干預措施、劑量、用藥時間、給藥途徑及其他初次用藥時的設定。鑒于市場上出售的草藥產品千差萬別,而且它們的質量和含量也各不相同,因此對當前試驗中所用產品與消費者和從業者所能獲得和/或使用的產品之間的關系進行回顧非常有價值。該信息將使讀者能夠確定其他同樣的產品與試驗中的產品是否有類似的可用性。臨床試驗結果的應用部分取決于干預措施或類似干預措施的可用性。
5.2.3 條目 22
在當前證據的背景下對結果進行一般性解釋。將試驗結果與其他產品的試驗結果進行一般討論。
5.2.4 范例
“迄今大多數已發表的研究都使用了大蒜粉制劑,類似于本研究中使用的制備方法。這些研究之間結果存在相當大的差異。例如,Adler 等[13]使用商業化的脫水大蒜片,報告稱 LDL-C 水平相對于安慰劑組在 12 周內凈下降了 13.1%。Jain 等[15]使用相同的產品和類似的設計,報告中度高膽固醇血癥成年人的 LDL-C 水平顯著凈下降 8%。但是,其他三個研究[19, 20, 22]使用相同劑量的相同商品化脫水大蒜粉產品(Lichtwer Pharmaceuticals 的 Kwai?)報告沒有明顯效果。剛剛引用的 5 個研究中使用的大蒜粉片劑為 900 mg/天,與本研究中使用的 1000 mg/天的總量相似。本研究中使用的片劑中大蒜素含量為總量 1500 mg/天,低于其他大蒜粉制劑研究中的大蒜素含量。降脂試驗中使用的其他類型的大蒜制劑包括陳年大蒜提取物和成組的大蒜油。Steiner 等[14]使用大劑量,每天 9 片的老化大蒜提取物,并報告其血漿 LDL-C 水平降低了 4.6%,差異有統計學意義。相比之下,最近一個使用蒸大蒜油補充劑的研究表明,高膽固醇血癥成年人在 12 周后對膽固醇水平沒有明顯影響[18]。一種解釋可能是該油不如脫水大蒜粉有效,因為它含有不同的含硫植物化學物質[30]。這些研究中報告的差異可用研究設計、持續時間、受試者特征、依從性或混雜因素(例如體重,飲食和運動)方面存在的異質性來解釋[76]。”
將試驗結果置于現有經驗證據的背景下作相關討論非常重要[1, 77]。一些試驗未能為讀者提供足夠的信息去確定當前的結果如何與其他研究相關。例如,Drew 和 Davies[56]報告“銀杏葉提取物 LI 1370 在治療耳鳴方面比安慰劑沒有更大的治療作用。此外,其他腦功能不全的癥狀并未受到治療的顯著影響(表 3)。該試驗的結果與某些報告相似,但與其他報告相反,該研究在許多方面與其他試驗有所不同”。相對于已評價的其他產品,這為讀者提供了很少的信息來判斷當前評價產品的功效。不同的植物產品可能具有不同的成分,因此具有不同的治療效果[34-40]。
建議在植物干預措施試驗的討論部分,結合先前研究的結果討論其試驗結果,同時明確考慮所用產品之間的相似性或差異性。參考已經評價過的其他產品的文獻來支持或推翻試驗結果是不合適的。作者在不同產品的試驗結果間推論時,應非常謹慎小心。如果不存在特定產品相關的臨床試驗,則應討論臨床前數據,這包括動物、體外和其他數據。
6 評價
在臨床干預措施的對照試驗中,隨機分配是控制偏倚和混雜的最佳工具。研究者必須確保在這些試驗的報告中包括讀者需要的信息,以判斷研究結果的有效性。在某種程度上,完整的臨床試驗報告將使臨床醫生能夠準確評估研究結果,從而反映當前證據,改變其臨床實踐。CONSORT 聲明旨在幫助研究人員、作者、審稿人和編輯了解臨床試驗中必要的信息。CONSORT 聲明適用于任何干預措施,包括草藥產品。
草藥干預措施的對照試驗未能充分報告 CONSORT 報告規范中建議的報告內容。最近,數個 CONSORT 條目得以詳細解釋,以便更適用于草藥對照試驗[19]。我們希望這些建議能夠幫助更完整、準確地報告草藥試驗的內容。
我們編寫此說明性文件,是為了進一步詳細說明并幫助作者使用。我們會提供 CONSORT 條目和相關的詳細說明,并在可用的情況下提供良好報告和經驗證據的示例。隨著越來越多的證據積累和批評意見的收集,這些有關草藥 RCT 報告的建議可隨時更改和修訂。
參考文獻
見原文。

隨機對照試驗(randomized controlled trials,RCT)為醫療保健干預措施的療效提供了最佳證據[1]。詳細計劃和良好執行的隨機對照試驗,為我們提供了對干預措施治療效果的最佳評估,以此指導臨床決策[2, 3],但一些試驗常因方法學不嚴謹,受到偏倚或混雜因素的影響,導致過高或過低評估了干預措施的治療效果[4-9]。因此人們一直在努力改進 RCT 的設計和報告質量[1, 6, 10, 11]。
當前的研究表明:補充和替代醫學(complementary and alternative medicine,CAM)試驗的報告質量較差[12, 13]。Linde 等[12, 14]發現,大多數 CAM 試驗并未描述隨機序列的產生、適當的分配隱藏方法、脫落和退出的病例數量和理由[12]。Moher 等[9, 13]指出,與兒科相關的補充和替代醫學的隨機對照試驗報告中,報告的內容不足 CONSORT 報告清單條目的 40%,而隨著時間的推移,雖然報告內容增加了 24%,但總體而言,這些試驗報告中報告的信息內容仍不足報告清單的一半。特別值得指出的是,只有不到 50% 的試驗報告了隨機序列的產生方法,僅 25% 的試驗報告了是否采用了分配隱藏[13]。這些結果表明,大部分補充和替代醫學RCT的報告質量較差,導致對內部和外部效度的評估很困難[12, 13]。
Linde 等[12](2001 年)的研究表明,不同類型補充替代療法研究的報告質量可能會有所不同,其中草藥試驗比順勢療法和針刺試驗更好,但一些系統評價指出在植物藥試驗報告中,仍未能為判斷內部效度、外部效度和可重復性提供所需的信息[15, 16](Gagnier JJ,2003 年,未發表的數據)。一個針對以英文出版的 206 個草藥 RCT 報告質量的研究發現,CONSORT 聲明中所建議條目報告內容不到 45%[17]。例如,大約 28% 的試驗描述了執行干預措施的人員是否對分組使用了盲法,只有 22% 的試驗描述了執行分配序列的方法,而 21% 的報告描述了產生分配序列的方法。此外,不同植物藥的臨床試驗報告質量也各不相同,且從 1980 到 2000 年間,一直在改善中[17]。有研究發現草藥臨床試驗的報告,常不包括草藥產品本身的詳細信息[15](Gagnier JJ,2003 年,未發表的數據)。
眾所周知,草藥可能會因所用植物的部位、采集時間、活性成分水平、提取類型(水、酒精、甘油)和服用方法而產生差異。因此即便使用相同的植物種類,不同產品的臨床試驗結果也可能有很大的差異。由于合并數據可能導致無效的推論,因此有差異的草藥產品的兩次試驗通常會被排除在系統評價之外[14, 15](Gagnier JJ,2003 年,未發表的數據)。顯然,讀者、編輯和審稿人要求增加植物藥 RCT 報告的透明度。現在,對照臨床試驗的報告規范也已被制訂。
CONSORT 聲明于 1996 年首次發布,并于 2001 年進行了修訂[7, 8]。該聲明包括一個清單和流程圖,用以指導作者和審稿人有關雙組平行設計 RCT 發表時應報告的信息資料[7, 8]。CONSORT 聲明已得到了許多行業領先的醫學期刊、編輯協會、專業協會和資助機構的認可[9]。自發表以來,CONSORT 聲明已制定了不同擴展版[10, 18],最近 CONSORT 已擴展到整群隨機試驗[18]和評價治療危害性的試驗[10]。此外,一個國際針刺研究工作組提出了一系列建議,用以改善針刺平行試驗中干預措施的報告(針刺對照試驗報告標準或 STRICTA)[11]。盡管這不是 CONSORT 的正式擴展版,但 MacPherson 等[11]將 STRICTA 描述為對 CONSORT 條目 4 的詳細說明,并建議作者在報告針刺試驗時將 STRICTA 與 CONSORT 結合使用。
2004 年 6 月,一個由臨床試驗學家、方法學家、藥理學家組成的國際小組在加拿大多倫多進行了共識會議,討論了草藥研究報告的建議[19](表 1 和表 2)。由此產生的指南對當前的 CONSORT 條目如何適用于草藥臨床試驗報告進行了詳細闡述,這將有助于編輯和審稿人評估草藥試驗的內、外部效度和可重復性,從而準確評估草藥干預措施的安全性和有效性。

通過闡述擴展條目的細節和理由,此說明文件將有助于研究人員計劃、開展和撰寫草藥 RCT 報告。在本文中,我們討論了每一條目擴展的理由和科學背景,并提供了良好報告的范例。在可能的情況下,我們也討論了每個條目擴展的經驗證據。應當指出,每個詳細的解釋說明都是對現有 CONSORT 建議條目的補充,因此所有 CONSORT 原條目都首先在表 1 中列出,而詳細的解釋說明在表 2 中列出。
1 CONSORT 用于草藥干預措施試驗的詳細說明
我們已詳細闡述了 CONSORT 用于草藥干預試驗的必要說明。在報告草藥的 RCT 時,除了這些詳細說明中建議的信息外,作者還應考慮是否報告 CONSORT 聲明中所闡述的內容。在以下內容中,我們不僅列出了 CONSORT 原始條目(常規)的內容,還列出了專門針對草藥干預措施 RCT 的詳細說明(條目內容中字體加粗部分)。源自試驗報告的摘錄包括了 CONSORT 條目建議的信息和已拓展的詳細說明。
1.1 標題和摘要
1.1.1 條目 1
受試者如何接受干預措施分配(如“隨機分配”、“隨機化”或“隨機指派”)。標題或摘要或兩者應說明草藥產品的拉丁學名,所用植物的部位及制劑的類型。
1.1.2 范例
題目:“銀杏(Ginko biloba)提取物 Egb 761 在認知功能完善的老年人中進行的一個雙盲安慰劑對照的臨床試驗:神經心理學研究結果”[20]。
摘要:“這是一個隨機雙盲安慰劑對照的……治療組接受了含有 300 mg 大蒜粉(Garlic Powder,Kwai)……這相當于每日大約 2.7 g 或大約 1 瓣鮮大蒜”[21]。
1.1.3 說明
CONSORT 條目 1 旨在幫助 RCT 報告在電子數據庫中的索引和標識[1]。因此需要使用“隨機”、“隨機化”或“隨機分配”一詞。在文章標題和摘要中,有必要附加語言文字說明是草藥的臨床試驗。
循證草藥臨床實踐,需要文獻支撐。識別草藥的臨床試驗,要求在文章的標題和摘要中報告草藥的拉丁學名、所用植物的部位及制劑類型。這些信息將有助于特定草藥產品或制劑的 RCT 索引和標識。一些草藥可能有特定的商標或商品名;如果合適,那么這些名稱應該與所含植物的拉丁學名一起列出。當試驗中使用的草藥產品為復方品種時,我們建議在標題中列出產品名稱,并在摘要中列出該產品中包含的所有草藥品種。這樣臨床報告文章的標題就不會因為要列出所有單獨的草藥拉丁學名而太長。
研究表明,由于不同數據庫檢索詞和索引程序的多樣性,檢索與 CAM 相關的主題具有挑戰性[22]。有研究發現,如果 CAM 試驗(例如植物藥試驗)的作者在摘要或標題中不參考標準檢索詞匯,數據庫可能無法為其分配適當的索引詞[22, 23]。另外,數據庫沒有對不同 CAM 干預措施建立足夠的索引詞及屬性描述也是一個問題[24]。在報告草藥 RCT 時,在標題和摘要中使用前面建議的說明內容,可能會改善索引和檢索情況。
2 介紹
2.1 背景
2.1.1 條目 2
科學背景和基本理由說明,包括關于使用特定草藥產品的簡要試驗理由;如適用,說明所試驗的為新適應癥或傳統適應癥。
2.1.2 范例
“銀杏葉提取物 Egb 761 是一種復合物,以黃酮醇糖苷(24%)和萜烯內酯(6%)含量為質量標準[1, 2]。已經證實含這兩類化合物的 Egb 761 在治療外周血管和腦血管疾病、年齡相關性腦損傷及缺氧或缺血綜合征方面的有益作用[1, 3]。體外進行的電子自旋共振(electron spin resonance,ESR)研究表明,Egb 761 是多種活性氧的有效清除劑,包括超氧化物陰離子根(O2?)和羥基根(HO?)[4]。最近用動物模型進行的體外研究表明,該提取物可能在心肌缺血再灌注損傷中發揮抗自由基作用。在這些研究中[5, 6],在用于灌注離體缺血大鼠心臟的溶媒中加入 200 mg/L 的 Egb 761,可顯著改善缺血后舒張功能的恢復,減少室性心律失常和酶滲漏,降低自旋截留氧自由基在冠狀動脈流出物中的含量。有趣的是,如在心臟灌注之前給動物口服 Egb 761,也觀察到了抗心律失常的作用,但只有高劑量(100 mg/kg,持續 10 天)才能顯著降低室性心律失常[5]。除使用 Egb 761 進行這些研究[5, 6]外,許多其他相關動物實驗研究也表明,活性氧的還原形式包括 O2?、HO?和過氧化氫(H2O2),參與心肌缺血性灌注后組織損傷的發病機制[7-10, 25]。在進行 CPB(心肺搭橋)手術的患者為治療對象的雙盲研究中,我們對通過手動觸診的體外循環手術患者,評價了 Egb 761 口服治療對于心臟的保護作用[25],體外試驗證實 Egb 761 具有抗氧化特性[4-6]。”
2.1.3 說明
對照臨床試驗報告的背景部分,部分是為了闡明試驗的理由[1],同時提供個別干預措施的特定文獻支持。現有草藥產品類型存在很大的異質性。同一草藥的兩種不同制劑可能具有不同的植物化學特性、不同的藥代動力學特征等。鑒于不同產品的異質性,就所研究草藥產品的科研數據(例如 Egb 761)及其研究理由應清楚地闡明。如果沒有可供參考的臨床試驗數據,基于臨床前研究數據(即動物研究、觀察性研究、病例報告、已知機制)的推論亦可接受。如果沒有關于該研究產品的數據,則應參考與當前試驗中所評價產品類似的研究資料。在理想情況下,應該很清楚地說明這些信息,包括對使用的草藥產品的先前研究進行系統評價[1, 26]。
另外,如果作者評價的是傳統適應癥,則應報告對該適應癥所依據的理論和相關概念。具有該領域相關知識的讀者應該能夠確定該適應癥的理由。例如,中醫藥臨床試驗選擇了驗證中醫診斷(例如肝血不足)而不是西醫診斷(例如肝炎)的疾病。如是,那么作者應該清楚地說明為什么選擇特定干預措施。例如,在傳統中醫中,“內關”穴位(EH-6,EH 代表心臟經絡)被認為與心臟的功能有關(Chuang,1977)。最近一些研究者(Mah 等,1992;Hsu 等,1989)觀察到,針刺內關穴可改善冠心病患者的左心室功能[27]。
此外,其他有助于構建臨床試驗依據理由的數據(如臨床試驗、動物試驗、觀察性研究、病例報告、已知/推測的機制),即使是針對傳統適應癥,也可在背景部分進行描述。這是基于研究假設能夠被清晰闡明的理由,可能來源于科學性的、經驗性的、歷史性的,或者傳統意義上的資料。
3 方法
3.1 受試者
3.1.1 條目 3
受試者的合格標準及收集數據的試驗場所設置和地點。如果是評價傳統適應癥,則應描述如何應用傳統理論和概念。例如,受試者的納入標準應反映傳統理論和概念的要求。
3.1.2 范例
“臨床試驗中有 118 例受試者,隨機分為兩組:清絡通痹顆粒治療組和雷公藤多甙對照組。在治療組(n=63)中,男 18 例,女 45 例,年齡 18~65 歲,平均 39.5±16.6 歲,病程 2~22 年,平均 7.5±3.6 年。根據美國風濕性關節炎協會(American Association of Rheumatoid arthritis,ARA)設定的標準對這些患者進行 X 光線分級:I 級 7 例,II 級 30 例和 III 級 26 例。對照組(n=55)中,男 10 例,女 45 例,年齡 18~65 歲,平均 38.3±16.7 歲,病程 1~21 年,平均 6.9±3.1 年。其中,I 級 15 例,II 級 21 例,III 級 19 例。兩組病例在性別、年齡、病程和 X 光線分級方面具有可比性(P>0.05)。
診斷標準和中醫辨證標準:ARA 的診斷是根據 1987 年修訂的 ARA 標準進行的。中醫辨證陰虛血熱:關節灼痛、局部腫脹或畸形、僵硬;皮膚發紅、有熱感;低燒;口干;尿黃;舌苔紅或暗紅色,有瘀斑,皮毛發黃或油膩或稀少,有裂痕;脈細數滑或細數。
該研究包括住院和門診患者,這些患者被診斷為陰虛血熱型類風濕性關節炎[28]。”
臨床試驗的外部效度和可推廣性在一定程度上取決于受試者的合格標準[1]。在草藥干預措施試驗中,關于合格標準的報告通常很少。一個研究發現,不到 75% 草藥干預措施的 RCT 充分報告了受試者的合格標準[17]。因此,通過閱讀已發表的臨床試驗報告,發現其中 1/4 的報告無法判斷其可推廣性。旨在評價傳統適應癥的草藥臨床試驗,必須報告受試者的合格標準。
與此相關的,作者可選擇排除以前使用過該特定草藥產品的受試者。例如曾有報道在試驗開始之前使用草藥產品會導致副作用增加的情況。在艾菊(Feverfew)[29]對照安慰劑預防偏頭痛的試驗中,納入了正在使用艾菊的受試者,導致安慰劑組受試者出現了更多的副作用,這可歸因于“艾菊停藥后綜合征”,即與戒斷反應相當。其他試驗也有過報道:長期使用艾菊,停止使用后出現系統性癥狀加重[29]。到目前為止,沒有經驗證據表明草藥的臨床對照試驗之前使用該草藥,對治療效果的估計存在偏差。盡管如此,仍建議在采用和報告合格受試者標準時,排除最近使用過該草藥的受試者。
3.1.3 范例
“排除先前用貫葉連翹(至少 450 mg/d)治療抑郁癥,或上個月因任何理由服用過貫葉連翹的受試者。為減少納入潛在的治療無效病例,排除在當前抗抑郁藥(鹽酸氟西汀 20 mg/d,至少 4 周或同等水平)試驗無反應的,或在之前超過 1 個抗抑郁藥試驗中無反應的受試者[30]。”
草藥臨床試驗報告數據收集的環境和地點至關重要[1]。地點高度概括了可能影響研究可推廣性的物理因素(如氣候和食物來源)、經濟因素、地理因素及社會文化因素等。同樣,研究環境可因機構、資源、經驗、基準風險和外觀等有很大差異[1]。一個研究發現,不到 40% 的草藥試驗報告充分報告了試驗環境和地點[17]。試驗結果的外部可推廣性部分取決于這些信息的完整性。
3.1.4 條目 4
各組干預措施的詳細信息及實際實施的方式和時間。如適用,對于草藥干預措施的描述應包括表內以下內容:

任何干預措施需要完整描述的信息類型與待評價的干預措施類型有關。如將外科手術作為干預措施的試驗,可能需要完整地描述施行手術的個體[1, 31]。對于草藥,則需要上述信息來判斷試驗用藥的關鍵特性。對試驗用藥的完整描述將有助于判斷其相對于其他產品的功效和安全性。
含有草藥成分的商業產品種類繁多[32-34]。此外,這些產品的成分含量有很大的差異[34-40],一些產品通常不會列出標簽上注明的各個成分的含量(重量、體積和比例)[41],有的甚至不列出任何成分。即使是相同植物種類的產品(如貫葉連翹)也通常包含不同含量的植物標記物/活性成分。例如,有研究表明以下植物種類的商品,其相應成分的含量不同:貫葉連翹(圣約翰草)[42, 43]、茶花(綠茶)[41]、單葉艾菊(Feverfew)[37-39]、刺五加(西伯利亞人參)、西洋參(美國/加拿大人參)[34]、金印草(白毛茛)[44]和 Paullinia cupana(瓜拉納)[45]。因此,不同產品之間的藥理學特性和體外活性可能會有所不同[33, 46]。此外,一些研究表明,某些植物產品不僅包含不同的有益成分,有益成分含量亦有所不同[47, 48]。因此,草藥干預試驗的作者有必要完整描述所使用的產品。
3.1.4.1 草藥產品名稱(4A)
范例:“AG(西洋參)膠囊包含由同一供應商(Chai-Na-Ta Corp.,BC,Canada.)供應的 3 年生/安大略種植、干燥、磨碎的西洋參根(Panax quinqueefolius L.)……這是同樣的商品,但批次與原始批次不同[49]。”
草藥試驗報告應注明拉丁學名和通用名稱連同命名者姓名和所屬科的名稱。在條目 1 中,也建議報告拉丁學名和通用名稱。按國際公認的植物命名法[50],植物的科學名必須包括拉丁雙名(屬和特定的上位詞)及權威命名者姓名。例如,屬:蒲公英,上位詞:鐵皮石斛,權威命名者:林奈。因此,全名應為 Taraxicum officinale L.(林奈在這里縮寫為L.)。附加命名者確認了最初描述此植物的人。常用名稱也應在此處列出(如蒲公英、艾菊、圣約翰草)。單獨使用通用名稱是不夠的,因為不同的草藥種類可能具有相同的通用名稱。例如,Echinacea 是 Echinacea angustifolia、Echinacea pallida 和 Echinacea purpura 的通用名稱。但這些植物具有不同的生化特征[51]。
如有關聯,應報告專利產品名稱(商標名稱,如 Kwai)或提取物名稱(如 LI 160)和產品的制造商。這些名稱是識別特定草藥產品(包括其內容及制造或生產)的快速方法。但僅憑這些名稱不足以描述產品信息。
作者還應該報告該產品是否在臨床試驗的地區獲得注冊許可及為草藥產品頒發許可證的具體監管機構。在不同的司法管轄區,獲得許可證的規定各不相同。盡管許可證不能保證產品質量或為讀者提供充足的草藥產品描述,但它讓讀者確定特定草藥的監管狀態和可獲得性。
3.1.4.2 草藥產品的物理特性(4B)
范例(生草藥):“人參膠囊包含 3 年生安大略干燥和研磨的人參根。所有人參和安慰劑膠囊都來自同一批次[52]。”范例(提取物):“……所有患者在 30~60 分鐘內輸注銀杏特殊提取物 Egb 761(批次號:5242)(1 個干瓶的 Egb 761 溶于 500 mL 等滲溶液),每天 1 次。干燥的小瓶中含有 200 mg 的銀杏葉干燥提取物(藥物萃取比為 50∶1),……3 mL 溶液中的 H2O 用作溶劑[53]。”必須對草藥產品的物理特性有完整的描述,包括產品或提取物中所含植物的部位及產品的類型[如生(新鮮或干燥)或提取物]。產品中的植物部位與所含成分的數量和種類有關[54]。此外,產品類型亦應該報告,因為不同的產品形式有不同的類型和成分含量[55]。如果產品是提取物,應報告提取溶劑的種類和濃度(如 80% 酒精,100% 水,90% 甘油)及植物與植物提取物的比例[如植物∶植物提取物(2∶1)]。該比例告訴讀者生產特定量的最終提取物需要多少植物原料(按重量或體積)。原料認證的方法(即完成方式和由誰進行認證)描述了如何鑒別原料或植物,并允許讀者在一定程度上判斷草藥產品的原料是否來源于被報告的植物。原料的批號為讀者提供有關原料來源的關鍵信息。
3.1.4.3 劑量方案和定量說明(4C)
范例:“該治療提供 252 片含有 50 mg 銀杏標準化提取物 LI 1370(含有 25% 的黃酮類化合物,3% 的銀杏內酯和 5% 的雙葉內酯)或安慰劑(均由 Lichtwer 制藥提供)。受試者每天服用 3 片藥片,持續 12 周。銀杏葉提取物及其劑量的選擇是根據先前試驗的結果,據報道該提取物可有效治療腦供血不足[56]。”
草藥試驗的作者應報告劑量方案并提供草藥產品的定量說明。試驗劑量和療程的相關信息對于重復試驗、確立特定劑量和療程情況下藥物的療效或副作用及其外部可推廣性,都非常重要[1]。試驗劑量和療程的理論依據應該是明確的,因為不清晰的描述會引起對試驗方法的質疑,并可能會引發一些倫理問題,如為何要開展這個試驗。
應該報告所有草藥產品成分的重量或含量,無論是天然的還是按劑量單位形式添加的(即添加的材料,如粘合劑、填充劑、賦形劑;如每粒膠囊含 17% 的麥芽糊精,3% 的二氧化硅),及每個劑量單位形式的活性成分/標記成分的百分比(如每粒膠囊含 0.3% 金絲桃素)。這為讀者提供了植物產品成分量化的概述。
3.1.4.4 定性測試(4D)
范例:“不同類型的人參皂苷(Rg1,Re,Rf,Rb,Rc,Rb2 和 Rd),其為人參屬中的達瑪烷皂苷,由加拿大安大略省渥太華大學理學院生物系的阿納森使用高效液相色譜(high-performance liquid chromatography,HPLC)法分析,該方法類似于美國植物評議會人參評估項目開發的評估程序[27]。具有反相超球體 C-18、5 微米十八烷基硅烷的 HPLC 系統,使用 250×4.6 mm 色譜柱進行分析。用于比較的人參皂苷標準品由兩個來源提供。Rg1 和 Re 由伊利諾伊大學的 Fong 博士提供,Rf,Rb1,Rc,Rb2 和 Rd 由 In Somefine Chemical Co.,Somerville NJ 提供[57]。”
臨床試驗應報告草藥產品的化學指紋圖譜和使用的方法(機械和化學參考標準)及執行者(使用實驗室的名稱)。可在描述草藥產品關鍵成分的圖表或表格中報告指紋圖譜。使用正確的技術進行化學分析對于提供清晰準確的產品成分報告至關重要,并且可提供定性和定量信息[58-60]。Bauer 和 Tittel[61]提供了一些用于藥理學、臨床和毒理學研究的植物材料表征和標準化的指南。分析團體協會(the Association of Analytical Communities,AOAC)也概述了分析特定草藥產品的標準[62]美國植物理事會出版的《美國草藥藥典》[63]和美國藥典[64]。報告可能還會描述憑證樣本(即保留樣本)是否被保留;如果保留,則描述在何處保存或存放,以便有獨立的樣本可供驗證化學特征。因此,在相關的報告中應包括對所有特殊測試/純度測試(例如,重金屬或其他污染物測試)的完整描述及有害成分的去除(其方式及方法)。所有這些方法都是相關的,因為它們可能會改變草藥產品的成分。
標準化一直是文章中的辯論焦點[58]。通常,公司或研究人員經常將植物產品標準化為特定的化學“標記”成分。這些“標記”成分可被視為主要的“活性”成分,或僅用作產品化學特性的指標[58]。盡管商業市場上的產品可能尚未標準化,并且經常不知道“有效”成分,但如果在草藥產品的臨床試驗中進行了標準化,則應進行報告。作者應報告產品標準化的內容(如化學成分)、完成方式(如化學反應過程或活性的生物/功能度量)[66]及每個劑量單位形式中該特定成分的百分比。
3.1.4.5 所用對照/安慰劑類型的理論依據(4E)
范例:“此外,安慰劑由含有玉米粉的相同膠囊組成。安慰劑的能量、碳水化合物含量和外觀被設計為與 AG(美國花旗參膠囊)相類似[49]。”
在草藥臨床試驗中,像在其他試驗中一樣重要的是要完整地描述對照組的特征及其設盲方式[1]。如果使用安慰劑對照,則安慰劑應與對照的干預措施密切匹配[67]。對于草藥干預措施試驗,應當描述使用該對照/安慰劑類型的理由。有一些試驗報告使用安慰劑的顏色和氣味與活性干預措施相匹配,但安慰劑包含一定的自身活性成分[68]。如果對照組使用的安慰劑有一定的活性,則它與試驗組之間的比較將會造成影響。設計與某些草藥產品相匹配的安慰劑,雖然是一種挑戰,但并非不可能。
3.1.4.6 對于實施干預措施的研究者的描述(4F)
范例:“為參與研究,醫師必須是擁有醫學學位的醫學專家,獲得德國醫學針灸學會的中醫認證學位,并且至少有 5 年的中醫實踐經驗(根據德國針灸學會工作組標準)。中藥組的草藥配方由中醫師(Carl-Hermann Hempen)設計,并由 1 名藥劑師來制備,他們均是中草藥專家(S. Dietz,Franz-Joseph Pharmacy,慕尼黑,德國)。除了基本處方外,每位患者還根據“辨證論治”服用第二種附加處方(表 3)[69]。”

有時候,草藥干預試驗可能包括 1 名實施者作為干預措施的一部分。不同研究人員擁有不同的培訓水平、年資、理論偏向及在不同環境中的工作經驗。類似于外科手術試驗,此類試驗應提供對作為干預措施一部分的實施者的描述(例如,培訓和實踐經驗)[1]。
3.2 結果
3.2.1 條目 6
清晰定義主要和次要結局測量指標,及在適用時使用任何方法提高測量質量(如多次觀察,評估人員的培訓)。終點指標應反映干預措施和受試適應癥的考慮,如適用,包含其基礎理論和概念。
3.2.2 范例
“在基線和治療后 30 天隨訪時評估所有終點措施。主要終點措施是生活質量的變化,該變化通過 12 個簡短健康調查(the 12-item short form health survey,SF-12)的“身體和心理組成部分摘要”量表進行衡量。SF-12 被廣泛用于測量健康和生活質量,并且與原始 36 個簡短健康調查(the 36-item short form health survey,SF-36)的分數顯示出較高的一致性[11]。SF-36 在幾個中國研究中得到了驗證,而對 SF-12 的評估正在進行中[11]。次要結局指標包括對身體機能、記憶力、性功能和“氣”……“氣”的評估量表包含 17 個指標(由訪調員管理的問卷中有 14 個,而身體檢查則有 3 個),是通過國際合作由中醫藥領域具有專業知識的臨床研究人員研發的。問卷調查表針對的是中醫傳統問診中通常包括的癥狀,包括呼吸、精力、食欲、胃灼熱、出汗、腸蠕動、疼痛、溫度、睡眠習慣和性能力。體格檢查條目涉及舌苔、舌質和脈搏,該量表是為這個研究開發的,尚未進行驗證。14 個問卷條目的得分為 0~4 分,體檢項目的得分為 0~3 分。“氣”的量表的總得分是每個得分的總和,范圍從 0(最佳)到 65(最差)[70]。”
與任何 RCT 一樣,主要和次要終點指標應與適應癥相關,要充分報告并描述用于提高終點指標質量的任何方法[1, 8]。使用 RCT 評價草藥干預措施時,可能出現與西方醫學術語和概念不能融合的情況。例如,在上述試驗中,據稱要評價的特定中草藥可提高壽命、生活質量、精力、記憶力、性功能和氣。“氣”是一種中醫概念,大致可理解為生命能量。因此,除了健康和生活質量的衡量標準之外,這些研究人員還采取“氣”作為衡量指標,測量該試驗過程中生命能量的變化。最終,為了評價傳統草藥的功能,我們建議終點指標應反映基礎理論和概念,并且應反映研究中特定草藥干預措施的適應癥。
4 結果
4.1 基線數據
4.1.1 條目 15
每組的基線人口統計學和臨床特征。包括合并用藥或合并用草藥產品。
4.1.2 范例
“8 例患者(平均年齡 44.9±4.2 歲)使用了艾菊,9 例患者(平均年齡 51.2±2.3 歲)使用了安慰劑膠囊。在研究前,試驗組的受試者每天服用 2.44±0.2 艾菊小葉,持續了 3.38±0.58 年,安慰劑組的受試者每天服用 2.33±0.48 小葉,持續 4.18±0.67 年。因此,兩組在每天消耗的艾菊數量或持續時間方面差異無統計學意義。
每組有 1 例患者正在服用結合型雌激素(Premarin);安慰劑組的患者也正在服用匹佐替芬。1 例服用艾菊的患者合并服用了口服避孕藥 Orlest 21。每組有 1 例患者服用利尿劑:服用艾菊組的患者同時服用了氯拉西,而服用安慰劑的患者服用了含有轉氨環丙胺和三氟哌嗪的產品。此外,安慰劑組中的兩個人正在服用維生素制劑,而一個人服用氯哌嗪[71]。”
受試者進入試驗后的完整描述使讀者和臨床醫生能夠評估試驗與特定患者的相關性。作為草藥產品試驗中基線評估的一部分,作者應明確評估和描述當前使用的任何藥物或草藥產品。組間藥物或草藥產品使用的差異,可能會使結果受到這些混雜因素的影響[72]。
5 討論
5.1 解釋
5.1.1 條目 20
對結果的解釋,考慮到研究假說、潛在偏倚或不精確的來源及多重分析和結局指標所帶來的風險。根據所用產品和劑量方案對結果進行解釋。
5.1.2 范例
“盡管 Egb 761 是常規使用 120 mg/天的劑量治療慢性疾病,但我們選擇服用超常規劑量兩倍以上的該提取物,僅在手術前 5 天服用以應對由于夾鉗松開后過量氧化物的產生。DMSO/AFR 濃度的測量結果表明,Egb 761 處理在再灌注的最初 5 至 10 分鐘內顯著保護了所有采樣部位的血漿抗壞血酸水平(表 3)。血漿 TBArs 濃度的分析表明,Egb 761 治療還抑制(或大大減弱了)MDA 的釋放,表明對自由基誘導的脂質過氧化具有保護作用。這兩個發現為 Egb 761 在心臟直視手術中的保護作用基礎提供了一些線索。據報道,Egb 761 可保護心肌缺血大鼠抗再灌注引起的抗壞血酸減少[6]。我們沒有發現 Egb 761 與 AFR 或 DMSO/AFR 之間有能保持抗壞血酸水平的體外化學相互作用。因此,在發揮其抗氧化作用時,提取物能有效抗衡循環的抗壞血酸(如一旦形成氧自由基,則直接將其淬滅)[73]。”
5.1.3 解釋
臨床試驗報告的討論部分為讀者提供了可確定研究的利弊及該研究與該領域其他研究關系的信息。了解該產品和劑量方案的結果與其他采用相似或不同產品或劑量方案的試驗結果之間的關系,使讀者能夠獲得一個背景知識,從中確定所使用的特定干預措施的優缺點。因此,作者應清楚說明可能導致試驗發現產品或劑量方案的特定原因。
本文在條目 20 下討論了這一概念,以強調草藥 RCT 報告的作者必須明確地將產品和劑量方案視為研究的潛在優勢或劣勢。盡管我們已將其與條目 22 下的闡述正式分開,在當前證據的背景下討論試驗結果(條目 22);但我們認為討論部分這些方面是密切相關的,可一并寫進稿件正文。
5.2 可推廣性
5.2.1 條目 21
試驗結果的可推廣性(外部有效性)。如可能,討論使用的草藥產品與自我護理和/或實踐中使用的產品之間的關系。
5.2.2 范例
“G115 是標準化的人參提取物,通常與多種其他物質組合成為復方制劑并在市場上出售。Ginsana?,Gericomplex?,Geriatric Pharaton?和 ARM229 是幾種已研究的商業標準化人參產品,除 G115 之外還可能包括以下物質中的一部分或全部:維生素、礦物質、微量元素和二甲基氨基乙醇酸氫鹽。
對消費者的忠告:如前所述,FDA 將人參歸為食品補充劑,因此在保健食品商店中廣泛銷售。估計有五千六百萬美國人使用人參產品[6]。但是,Chong 和 Oberholzer[11]指出質量控制存在問題。事實上,最近的一份報告[12]指出,在 50 種商業化的人參制劑中,有 44 種所含人參皂甙的濃度范圍為 1.9%~9.0%,而其中 6 種產品中均未檢測到人參皂甙[74]。”
可推廣性或外部效度,是研究結果在其他情況中成立的程度[75]。這里的“情況”一詞可表示其他個人或人群,或其他類似的干預措施、劑量、用藥時間、給藥途徑及其他初次用藥時的設定。鑒于市場上出售的草藥產品千差萬別,而且它們的質量和含量也各不相同,因此對當前試驗中所用產品與消費者和從業者所能獲得和/或使用的產品之間的關系進行回顧非常有價值。該信息將使讀者能夠確定其他同樣的產品與試驗中的產品是否有類似的可用性。臨床試驗結果的應用部分取決于干預措施或類似干預措施的可用性。
5.2.3 條目 22
在當前證據的背景下對結果進行一般性解釋。將試驗結果與其他產品的試驗結果進行一般討論。
5.2.4 范例
“迄今大多數已發表的研究都使用了大蒜粉制劑,類似于本研究中使用的制備方法。這些研究之間結果存在相當大的差異。例如,Adler 等[13]使用商業化的脫水大蒜片,報告稱 LDL-C 水平相對于安慰劑組在 12 周內凈下降了 13.1%。Jain 等[15]使用相同的產品和類似的設計,報告中度高膽固醇血癥成年人的 LDL-C 水平顯著凈下降 8%。但是,其他三個研究[19, 20, 22]使用相同劑量的相同商品化脫水大蒜粉產品(Lichtwer Pharmaceuticals 的 Kwai?)報告沒有明顯效果。剛剛引用的 5 個研究中使用的大蒜粉片劑為 900 mg/天,與本研究中使用的 1000 mg/天的總量相似。本研究中使用的片劑中大蒜素含量為總量 1500 mg/天,低于其他大蒜粉制劑研究中的大蒜素含量。降脂試驗中使用的其他類型的大蒜制劑包括陳年大蒜提取物和成組的大蒜油。Steiner 等[14]使用大劑量,每天 9 片的老化大蒜提取物,并報告其血漿 LDL-C 水平降低了 4.6%,差異有統計學意義。相比之下,最近一個使用蒸大蒜油補充劑的研究表明,高膽固醇血癥成年人在 12 周后對膽固醇水平沒有明顯影響[18]。一種解釋可能是該油不如脫水大蒜粉有效,因為它含有不同的含硫植物化學物質[30]。這些研究中報告的差異可用研究設計、持續時間、受試者特征、依從性或混雜因素(例如體重,飲食和運動)方面存在的異質性來解釋[76]。”
將試驗結果置于現有經驗證據的背景下作相關討論非常重要[1, 77]。一些試驗未能為讀者提供足夠的信息去確定當前的結果如何與其他研究相關。例如,Drew 和 Davies[56]報告“銀杏葉提取物 LI 1370 在治療耳鳴方面比安慰劑沒有更大的治療作用。此外,其他腦功能不全的癥狀并未受到治療的顯著影響(表 3)。該試驗的結果與某些報告相似,但與其他報告相反,該研究在許多方面與其他試驗有所不同”。相對于已評價的其他產品,這為讀者提供了很少的信息來判斷當前評價產品的功效。不同的植物產品可能具有不同的成分,因此具有不同的治療效果[34-40]。
建議在植物干預措施試驗的討論部分,結合先前研究的結果討論其試驗結果,同時明確考慮所用產品之間的相似性或差異性。參考已經評價過的其他產品的文獻來支持或推翻試驗結果是不合適的。作者在不同產品的試驗結果間推論時,應非常謹慎小心。如果不存在特定產品相關的臨床試驗,則應討論臨床前數據,這包括動物、體外和其他數據。
6 評價
在臨床干預措施的對照試驗中,隨機分配是控制偏倚和混雜的最佳工具。研究者必須確保在這些試驗的報告中包括讀者需要的信息,以判斷研究結果的有效性。在某種程度上,完整的臨床試驗報告將使臨床醫生能夠準確評估研究結果,從而反映當前證據,改變其臨床實踐。CONSORT 聲明旨在幫助研究人員、作者、審稿人和編輯了解臨床試驗中必要的信息。CONSORT 聲明適用于任何干預措施,包括草藥產品。
草藥干預措施的對照試驗未能充分報告 CONSORT 報告規范中建議的報告內容。最近,數個 CONSORT 條目得以詳細解釋,以便更適用于草藥對照試驗[19]。我們希望這些建議能夠幫助更完整、準確地報告草藥試驗的內容。
我們編寫此說明性文件,是為了進一步詳細說明并幫助作者使用。我們會提供 CONSORT 條目和相關的詳細說明,并在可用的情況下提供良好報告和經驗證據的示例。隨著越來越多的證據積累和批評意見的收集,這些有關草藥 RCT 報告的建議可隨時更改和修訂。
參考文獻
見原文。
