遺傳模型的選擇在基因-疾病關聯研究 Meta 分析中是較為關鍵的難點。本文對 Minelli 等提出的無遺傳模型約束的貝葉斯 Meta 分析方法進行深入討論,利用 JAGS 和 R 語言對其進行實現,并在實例中比較了不同參數先驗信息對合并效應量的影響,特別是外部臨床先驗的影響。實例研究結果顯示,無論是無信息先驗還是外部臨床先驗,在納入研究個數較多的情況下,對合并效應量的影響均較小。
目的利用多中心數據構建臨床預測模型時,數據的獨立性假設會發生違背,研究對象之間存在明顯中心聚集效應,為了充分考慮聚集性問題,本研究擬比較考慮中心聚集效應的隨機截距Logistic回歸模型(RI)和固定效應模型(FEM)與不考慮中心聚集效應的標準Logistic回歸模型(SLR)和隨機森林算法(RF)在不同場景下的模型性能。方法模擬預測模型建立過程中,存在不同程度中心聚集效應時,在中心水平上不同模型的預測性能,包括在不同場景中的區分度和校準度差異,同時比較這種差異在不同事件率時的變化趨勢。結果在中心水平,不同模型(除RF外)在中心聚集效應下不同場景的區分度差異不大,其C-index均值變化很小。利用多中心高度聚集的數據進行預測時,邊緣預測(M.RI、SLR和RF)與條件預測相比校準截距略小于0,高估了預測的平均概率。其中RF則在多中心大樣本條件下截距校準表現很好,這也體現了機器學習算法對處理大樣本數據的優勢。在中心多患者少時,FEM進行條件預測,校準截距大于0,預測的平均概率被低估。此外,在利用多中心大樣本數據開發預測模型時,三個條件預測(FEM、A.RI、C.RI)斜率校準較好,邊緣預測(M.RI和SLR)的校準斜率大于1出現了欠擬合的問題,且隨著中心聚集效應增加欠擬合問題越發凸顯。特別是在中心少患者少時,數據的過擬合會掩蓋邊緣預測與條件預測校準性能上的差異。最后,越低的事件發生率時,中心聚集效應在中心水平對不同模型預測性能的影響越明顯。結論利用高度聚集的多中心數據構建模型并應用于特定環境中預測,當中心數較少或因不同發病率導致中心間差異較大時可以選擇RI和FEM進行條件預測;當中心數較多、樣本量較大時可選擇RI進行條件預測或RF進行邊緣預測。