妊娠期糖尿病(gestational diabetes mellitus,GDM)是妊娠期最常見的代謝性疾病[1]。根據2021年國際糖尿病聯盟發布的第十版“糖尿病地圖”,全球有16.7%的育齡期婦女會出現妊娠期血糖升高,其中80.3%由GDM導致[2]。根據國際糖尿病和妊娠研究協會(the International Association of Diabetes and Pregnancy Study Groups,IADPSG)診斷標準,中國大陸GDM的總發病率為14.8%,患者人數高居世界第二[3]。GDM顯著增加了產婦不良妊娠及分娩結局的風險。目前我國普遍采納孕24~28周行2小時75克口服葡萄糖耐量試驗(oral glucose tolerance test,OGTT)作為GDM的篩查、診斷和規范化管理的依據[1]。但多個研究指出,在GDM確診前,高血糖的母體環境已經開始對胎兒產生不利影響,并增加了子代兒童期葡萄糖不耐受和胰島素抵抗的風險[4-9]。因此,近年來大量研究開始關注GDM的危險因素,并構建風險預測模型,以期對GDM的發病風險和預后進行早期預測,從而篩選高危人群,實現早期管理。與GDM風險預測模型相關的研究數量持續增加,但由于不同模型納入的風險因素不同、預測效能不同、模型的外推性缺乏驗證等原因[10-11],給實踐者選擇合適的預測模型帶來了挑戰。因此,本研究系統評價GDM發病風險預測模型開發和驗證的相關研究,為遴選恰當的GDM風險預測模型提供依據,也為進一步研究提供方向。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
隊列研究、病例-對照研究、橫斷面研究。
1.1.2 研究對象
育齡期、妊娠期婦女。
1.1.3 研究內容
GDM發病風險早期預測模型的構建及驗證。
1.1.4 排除標準
① 無法獲取全文;② 重復發表的研究;③ 預測變量包含侵入性檢查指標。
1.2 文獻檢索策略
計算機檢索CNKI、WanFang Data、VIP、CBM、PubMed、JBI EBP、Ovid Medline、EMbase、Web of Science和Cochrane Library數據庫,搜集GDM風險預測模型的相關文獻,檢索時限均為建庫至2022年10月。檢索采用主題詞與自由詞相結合的方式進行,并根據各數據庫特點進行調整。同時檢索納入研究的參考文獻,以補充獲取相關資料。中文檢索詞包括:孕婦、妊娠、孕期、孕產婦、糖尿病、高血糖癥、餐后高血糖癥、胰島素抗藥性、胰島素抵抗、葡萄糖耐受不良、高血糖、模型、列線圖、風險評分、預測、風險因素評分、高危因素評分、篩查模型、篩查工具、危險因素評分;英文檢索詞包括:diabetes, gestational、diabetes, pregnancy-induced、diabetes, pregnancy induced、pregnancy-induced diabetes、gestational diabetes、diabetes mellitus、gestational、pregnancy、gravidity、conception、pregnanc*、gestation、gravidit*、nulligravidit*、primigravidit*、multigravidit*、fertilization*、delayed fertilization*、polyspermic fertilization*、conception*、diabetes mellitus、insulin resistance、diabet*、hyperglycemia*、insulin sensitivity、glucose intolerance*、impaired glucose tolerance*、predict*、epidemiological model*、epidemiological tool*、prediction model*、prediction tool*、predictive model*、predictive tool*、forecasting model*、forecasting tool*、risk model*、risk tool*、practical tool*、assessment tool*、assessment model*、model、risk score、risk factor scoring、risk prediction model*、machine learning technique*、logistic regression*、development and validation。
1.3 文獻篩選與資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。資料提取內容包括:① 文獻的基本信息:題目、發表時間、研究類型、樣本量、缺失數據、預測因子等;② 驗證情況:校準方法、模型構建方法、受試者工作特征(receiver operating characteristic,ROC)曲線下面積(area under the curve,AUC)值等。
1.4 納入研究的偏倚風險和適用性評價
由2名研究者采用預測模型研究的偏倚風險評估工具(PROBAST)[10,12-13]對納入研究的偏倚風險和適用性進行評價,出現分歧時通過討論或由第三名研究者裁定。
1.5 統計分析
由于納入研究的異質性較大、研究的偏倚來源不同、模型構建方法不同等原因,本研究僅對結果進行描述性分析。
2 結果
2.1 文獻篩選流程與結果
初檢共獲得相關文獻7 504篇,包括:CNKI(n=490)、WanFang Data(n=664)、VIP(n=449)、CBM(n=534)、PubMed(n=226)、JBI EBP(n=91)、Ovid Medline(n=30)、EMbase(n=25)、Web of Science(n=2 633)、Cochrane Library(n=111)。經逐層篩選,最終納入19個研究[14-32]。
2.2 納入研究的基本特征
納入研究的基本特征見表1。

2.3 納入研究的偏倚風險和適用性評價結果
2.3.1 偏倚風險評價結果
納入研究總體偏倚風險較高:① 研究對象領域:8個研究存在高偏倚風險,主要與研究數據來自于回顧性隊列研究有關,此類數據最初的記錄目的與預測模型的構建與驗證無關,且難以排除回憶偏倚。② 預測因子領域:8個研究的偏倚風險不清楚,主要原因是缺少相關信息;6個研究存在高偏倚風險,主要與結果評價階段未使用盲法有關。③ 研究結果領域:7個研究的偏倚風險不清楚,主要原因是缺少相關信息;7個研究為高偏倚風險,主要與多中心研究各中心GDM診斷標準不同有關。④ 結果與分析領域:17個研究為高偏倚風險,1個研究的偏倚風險不清楚,主要是未明確報告缺失數據率和缺失數據的處理方法。見表2。

2.3.2 適用性評價結果
納入研究總體上適用性風險高:① 研究對象領域:2個研究缺少相關信息導致偏倚風險不清楚,4個研究適用性風險較高,主要與原始研究納排標準與系統評價問題不相符有關。② 預測因子領域:2個研究的偏倚風險不清楚,主要與納入研究未報告預測因子的定義、評估方法及時間有關。③ 研究結果領域:1個研究缺少相關信息,11個研究的適用性風險較高,主要與研究中GDM診斷標準與系統評價的診斷標準不符有關。見表2。
2.4 預測模型的基本情況
納入研究共構建了19個GDM風險預測模型。在建模方式上,18個研究采用Logistic回歸分析建立模型,1個研究采用貝葉斯平均法建立模型;在變量選擇上,19個研究均是先采用單因素回歸篩選變量,再通過多因素回歸分析確定納入變量的方式;在變量處理方法上,7個研究將連續變量(如年齡)轉換為分類變量;在數據缺失方面,僅2個研究報告了缺失數據率。納入的19個預測模型中,預測因子主要分為人口學變量、體格檢查指標和生活方式相關變量三類。在預測模型的驗證上,19個研究均采用ROC曲線對預測模型進行內部驗證,AUC值為0.69~0.88,僅有7個研究對預測模型進行了外部驗證,AUC值為0.67~0.77。納入模型的基本情況見表3。

3 討論
本研究納入的19個GDM風險預測模型,由于研究對象和研究目的不同,其模型不僅最終納入的預測因子存在差異[33],預測因子的測量時間也存在差異,因此部分模型臨床適用性受到目標人群和使用時期的限制。如適用于經產婦的GDM預測模型中納入了產次、不良妊娠結局等預測因子,而初產婦則不適用此類模型。此外,預測因子依據測量時間不同可分為孕前、孕早期和孕中期BMI,如Caliskan模型[31]收集數據的時間為24~28周,其納入模型的預測因子就是孕中期的BMI。
此外,本研究發現各研究的預測因子存在一定共性。本研究對出現頻率較高的5個風險預測因子(年齡、孕前BMI、DM家族史、GDM史、巨大兒分娩史)進行探討,發現母親年齡(>24歲)是GDM的危險因素。原因可能是產婦在妊娠期的代謝容易出現紊亂、抗胰島素激素分泌增加,本就容易發生高血糖[34],而孕婦年齡越大對胰島素的敏感性就越低,因此高齡產婦極易確診GDM[4]。有研究表明,肥胖女性患GDM的風險比正常BMI女性增加了1.3~3.8倍[35]。一項包含33個研究的Meta分析結果表明,DM家族史也是GDM的重要危險因素[36]。也有研究發現,既往患GDM的女性再次發生妊娠高血糖的風險較正常女性增加了35%~50%[37-38]。對我國浙江省嘉興市128例曾確診為GDM孕婦的回顧性研究[5]發現,這部分孕婦GDM再發率可達43.75%,故GDM史是GDM的獨立風險因素,孕婦GDM史會導致孕婦下次妊娠患GDM的風險直線上升。既往研究發現,巨大兒(≥4kg)分娩史是GDM的獨立危險因素[39],這與本研究結果相符。因此,在孕前、孕中期保健中,應有針對性進行預防,如規范調整飲食、睡眠、控制體重、規范使用胰島素等,同時要開展宣教工作,避免高齡妊娠,加強高危孕婦妊娠管理,降低不良妊娠結局的發生風險[14]。
本研究納入的19個模型中,經過內部驗證的AUC為0.69~0.88。在建立模型或驗證模型時,4個模型的AUC均>0.8,6個模型的AUC在0.7~0.8之間,具有較好的預測性能,能很好辨別出有GDM高風險的孕婦。研究對象方面,納入研究大部分采用前瞻性隊列研究的方法開發及驗證模型,但也有一部分研究采用回顧性隊列研究的方法開發及驗證模型。這部分研究可能存在納入的預測因子不全面、忽略數據缺失的預測因子等問題[13]。在預測因子方面,不同的研究的測量時間和定義差別較大,僅有5個研究采用盲法,可能導致預測模型的預測能力被高估。結果與分析方面,有7個研究采用多種GDM診斷標準,多中心研究存在各中心使用不同GDM診斷標準的情況,可能導致較高的偏倚風險。此外,大部分研究沒有報告缺失數據率和缺失數據的處理方式,如果未采用多重插補法等處理方式,可能導致一定的偏倚風險[13]。
在納入的19個模型中,僅有7個模型進行了外部驗證,AUC值為0.67~0.77。19個研究總體偏倚風險評價結果為高偏倚,大部分研究未進行外部驗證,其臨床適用性有待進一步驗證。預測模型的驗證是模型開發過程中不可或缺的步驟,而模型從初步建立到實際應用,最重要、核心的步驟便是必須要對預測模型進行外部驗證,即對模型的區分度及其校準度進行考察的過程,外部驗證可認為是模型驗證的“金標準”[40]。良好的風險預測模型,需具備足夠穩定的特點,并經過嚴格的內部驗證和外部驗證。《個體預后與診斷的多變量預測模型透明報告》[41]中,就將模型的驗證作為獨立的研究類別,并專門設置模型驗證的相關評價條目。目前,大部分預測模型研究尚停留在預測模型的開發階段,鮮少對預測模型進行外部驗證,這造成對同一疾病或終點事件的新預測模型雖然不斷涌現,但模型的穩定性和外推性卻未被有效驗證,構建的模型難以應用于臨床實際工作。
本研究的局限性:考慮到模型使用的便利性,本研究未納入含有侵入性檢查指標作為預測因子的研究,并且由于納入模型之間的異質性較大,本研究未進行定量分析。
綜上所述,本研究對GDM風險預測模型開發及驗證相關的研究進行系統評價,總體上模型的性能良好,但整體偏倚風險偏高,且大部分模型未進行外部驗證。建議未來研究嚴格遵循PROBAST條目,降低研究的偏倚風險,并對模型進行外部驗證,提高預測模型的臨床適用性。
聲明 本文不存在任何利益沖突。
妊娠期糖尿病(gestational diabetes mellitus,GDM)是妊娠期最常見的代謝性疾病[1]。根據2021年國際糖尿病聯盟發布的第十版“糖尿病地圖”,全球有16.7%的育齡期婦女會出現妊娠期血糖升高,其中80.3%由GDM導致[2]。根據國際糖尿病和妊娠研究協會(the International Association of Diabetes and Pregnancy Study Groups,IADPSG)診斷標準,中國大陸GDM的總發病率為14.8%,患者人數高居世界第二[3]。GDM顯著增加了產婦不良妊娠及分娩結局的風險。目前我國普遍采納孕24~28周行2小時75克口服葡萄糖耐量試驗(oral glucose tolerance test,OGTT)作為GDM的篩查、診斷和規范化管理的依據[1]。但多個研究指出,在GDM確診前,高血糖的母體環境已經開始對胎兒產生不利影響,并增加了子代兒童期葡萄糖不耐受和胰島素抵抗的風險[4-9]。因此,近年來大量研究開始關注GDM的危險因素,并構建風險預測模型,以期對GDM的發病風險和預后進行早期預測,從而篩選高危人群,實現早期管理。與GDM風險預測模型相關的研究數量持續增加,但由于不同模型納入的風險因素不同、預測效能不同、模型的外推性缺乏驗證等原因[10-11],給實踐者選擇合適的預測模型帶來了挑戰。因此,本研究系統評價GDM發病風險預測模型開發和驗證的相關研究,為遴選恰當的GDM風險預測模型提供依據,也為進一步研究提供方向。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
隊列研究、病例-對照研究、橫斷面研究。
1.1.2 研究對象
育齡期、妊娠期婦女。
1.1.3 研究內容
GDM發病風險早期預測模型的構建及驗證。
1.1.4 排除標準
① 無法獲取全文;② 重復發表的研究;③ 預測變量包含侵入性檢查指標。
1.2 文獻檢索策略
計算機檢索CNKI、WanFang Data、VIP、CBM、PubMed、JBI EBP、Ovid Medline、EMbase、Web of Science和Cochrane Library數據庫,搜集GDM風險預測模型的相關文獻,檢索時限均為建庫至2022年10月。檢索采用主題詞與自由詞相結合的方式進行,并根據各數據庫特點進行調整。同時檢索納入研究的參考文獻,以補充獲取相關資料。中文檢索詞包括:孕婦、妊娠、孕期、孕產婦、糖尿病、高血糖癥、餐后高血糖癥、胰島素抗藥性、胰島素抵抗、葡萄糖耐受不良、高血糖、模型、列線圖、風險評分、預測、風險因素評分、高危因素評分、篩查模型、篩查工具、危險因素評分;英文檢索詞包括:diabetes, gestational、diabetes, pregnancy-induced、diabetes, pregnancy induced、pregnancy-induced diabetes、gestational diabetes、diabetes mellitus、gestational、pregnancy、gravidity、conception、pregnanc*、gestation、gravidit*、nulligravidit*、primigravidit*、multigravidit*、fertilization*、delayed fertilization*、polyspermic fertilization*、conception*、diabetes mellitus、insulin resistance、diabet*、hyperglycemia*、insulin sensitivity、glucose intolerance*、impaired glucose tolerance*、predict*、epidemiological model*、epidemiological tool*、prediction model*、prediction tool*、predictive model*、predictive tool*、forecasting model*、forecasting tool*、risk model*、risk tool*、practical tool*、assessment tool*、assessment model*、model、risk score、risk factor scoring、risk prediction model*、machine learning technique*、logistic regression*、development and validation。
1.3 文獻篩選與資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。資料提取內容包括:① 文獻的基本信息:題目、發表時間、研究類型、樣本量、缺失數據、預測因子等;② 驗證情況:校準方法、模型構建方法、受試者工作特征(receiver operating characteristic,ROC)曲線下面積(area under the curve,AUC)值等。
1.4 納入研究的偏倚風險和適用性評價
由2名研究者采用預測模型研究的偏倚風險評估工具(PROBAST)[10,12-13]對納入研究的偏倚風險和適用性進行評價,出現分歧時通過討論或由第三名研究者裁定。
1.5 統計分析
由于納入研究的異質性較大、研究的偏倚來源不同、模型構建方法不同等原因,本研究僅對結果進行描述性分析。
2 結果
2.1 文獻篩選流程與結果
初檢共獲得相關文獻7 504篇,包括:CNKI(n=490)、WanFang Data(n=664)、VIP(n=449)、CBM(n=534)、PubMed(n=226)、JBI EBP(n=91)、Ovid Medline(n=30)、EMbase(n=25)、Web of Science(n=2 633)、Cochrane Library(n=111)。經逐層篩選,最終納入19個研究[14-32]。
2.2 納入研究的基本特征
納入研究的基本特征見表1。

2.3 納入研究的偏倚風險和適用性評價結果
2.3.1 偏倚風險評價結果
納入研究總體偏倚風險較高:① 研究對象領域:8個研究存在高偏倚風險,主要與研究數據來自于回顧性隊列研究有關,此類數據最初的記錄目的與預測模型的構建與驗證無關,且難以排除回憶偏倚。② 預測因子領域:8個研究的偏倚風險不清楚,主要原因是缺少相關信息;6個研究存在高偏倚風險,主要與結果評價階段未使用盲法有關。③ 研究結果領域:7個研究的偏倚風險不清楚,主要原因是缺少相關信息;7個研究為高偏倚風險,主要與多中心研究各中心GDM診斷標準不同有關。④ 結果與分析領域:17個研究為高偏倚風險,1個研究的偏倚風險不清楚,主要是未明確報告缺失數據率和缺失數據的處理方法。見表2。

2.3.2 適用性評價結果
納入研究總體上適用性風險高:① 研究對象領域:2個研究缺少相關信息導致偏倚風險不清楚,4個研究適用性風險較高,主要與原始研究納排標準與系統評價問題不相符有關。② 預測因子領域:2個研究的偏倚風險不清楚,主要與納入研究未報告預測因子的定義、評估方法及時間有關。③ 研究結果領域:1個研究缺少相關信息,11個研究的適用性風險較高,主要與研究中GDM診斷標準與系統評價的診斷標準不符有關。見表2。
2.4 預測模型的基本情況
納入研究共構建了19個GDM風險預測模型。在建模方式上,18個研究采用Logistic回歸分析建立模型,1個研究采用貝葉斯平均法建立模型;在變量選擇上,19個研究均是先采用單因素回歸篩選變量,再通過多因素回歸分析確定納入變量的方式;在變量處理方法上,7個研究將連續變量(如年齡)轉換為分類變量;在數據缺失方面,僅2個研究報告了缺失數據率。納入的19個預測模型中,預測因子主要分為人口學變量、體格檢查指標和生活方式相關變量三類。在預測模型的驗證上,19個研究均采用ROC曲線對預測模型進行內部驗證,AUC值為0.69~0.88,僅有7個研究對預測模型進行了外部驗證,AUC值為0.67~0.77。納入模型的基本情況見表3。

3 討論
本研究納入的19個GDM風險預測模型,由于研究對象和研究目的不同,其模型不僅最終納入的預測因子存在差異[33],預測因子的測量時間也存在差異,因此部分模型臨床適用性受到目標人群和使用時期的限制。如適用于經產婦的GDM預測模型中納入了產次、不良妊娠結局等預測因子,而初產婦則不適用此類模型。此外,預測因子依據測量時間不同可分為孕前、孕早期和孕中期BMI,如Caliskan模型[31]收集數據的時間為24~28周,其納入模型的預測因子就是孕中期的BMI。
此外,本研究發現各研究的預測因子存在一定共性。本研究對出現頻率較高的5個風險預測因子(年齡、孕前BMI、DM家族史、GDM史、巨大兒分娩史)進行探討,發現母親年齡(>24歲)是GDM的危險因素。原因可能是產婦在妊娠期的代謝容易出現紊亂、抗胰島素激素分泌增加,本就容易發生高血糖[34],而孕婦年齡越大對胰島素的敏感性就越低,因此高齡產婦極易確診GDM[4]。有研究表明,肥胖女性患GDM的風險比正常BMI女性增加了1.3~3.8倍[35]。一項包含33個研究的Meta分析結果表明,DM家族史也是GDM的重要危險因素[36]。也有研究發現,既往患GDM的女性再次發生妊娠高血糖的風險較正常女性增加了35%~50%[37-38]。對我國浙江省嘉興市128例曾確診為GDM孕婦的回顧性研究[5]發現,這部分孕婦GDM再發率可達43.75%,故GDM史是GDM的獨立風險因素,孕婦GDM史會導致孕婦下次妊娠患GDM的風險直線上升。既往研究發現,巨大兒(≥4kg)分娩史是GDM的獨立危險因素[39],這與本研究結果相符。因此,在孕前、孕中期保健中,應有針對性進行預防,如規范調整飲食、睡眠、控制體重、規范使用胰島素等,同時要開展宣教工作,避免高齡妊娠,加強高危孕婦妊娠管理,降低不良妊娠結局的發生風險[14]。
本研究納入的19個模型中,經過內部驗證的AUC為0.69~0.88。在建立模型或驗證模型時,4個模型的AUC均>0.8,6個模型的AUC在0.7~0.8之間,具有較好的預測性能,能很好辨別出有GDM高風險的孕婦。研究對象方面,納入研究大部分采用前瞻性隊列研究的方法開發及驗證模型,但也有一部分研究采用回顧性隊列研究的方法開發及驗證模型。這部分研究可能存在納入的預測因子不全面、忽略數據缺失的預測因子等問題[13]。在預測因子方面,不同的研究的測量時間和定義差別較大,僅有5個研究采用盲法,可能導致預測模型的預測能力被高估。結果與分析方面,有7個研究采用多種GDM診斷標準,多中心研究存在各中心使用不同GDM診斷標準的情況,可能導致較高的偏倚風險。此外,大部分研究沒有報告缺失數據率和缺失數據的處理方式,如果未采用多重插補法等處理方式,可能導致一定的偏倚風險[13]。
在納入的19個模型中,僅有7個模型進行了外部驗證,AUC值為0.67~0.77。19個研究總體偏倚風險評價結果為高偏倚,大部分研究未進行外部驗證,其臨床適用性有待進一步驗證。預測模型的驗證是模型開發過程中不可或缺的步驟,而模型從初步建立到實際應用,最重要、核心的步驟便是必須要對預測模型進行外部驗證,即對模型的區分度及其校準度進行考察的過程,外部驗證可認為是模型驗證的“金標準”[40]。良好的風險預測模型,需具備足夠穩定的特點,并經過嚴格的內部驗證和外部驗證。《個體預后與診斷的多變量預測模型透明報告》[41]中,就將模型的驗證作為獨立的研究類別,并專門設置模型驗證的相關評價條目。目前,大部分預測模型研究尚停留在預測模型的開發階段,鮮少對預測模型進行外部驗證,這造成對同一疾病或終點事件的新預測模型雖然不斷涌現,但模型的穩定性和外推性卻未被有效驗證,構建的模型難以應用于臨床實際工作。
本研究的局限性:考慮到模型使用的便利性,本研究未納入含有侵入性檢查指標作為預測因子的研究,并且由于納入模型之間的異質性較大,本研究未進行定量分析。
綜上所述,本研究對GDM風險預測模型開發及驗證相關的研究進行系統評價,總體上模型的性能良好,但整體偏倚風險偏高,且大部分模型未進行外部驗證。建議未來研究嚴格遵循PROBAST條目,降低研究的偏倚風險,并對模型進行外部驗證,提高預測模型的臨床適用性。
聲明 本文不存在任何利益沖突。