本文介紹了國家科技部重點研發計劃精準醫學專項“京津冀地區生活社區自然人群慢性病隊列研究”的背景和研究設計方案(調查地點、研究對象、基線調查和隨訪監測)。
引用本文: 曹寒, 單廣良, 張玲. “京津冀地區生活社區自然人群慢性病隊列研究”介紹. 中國循證醫學雜志, 2018, 18(6): 640-644. doi: 10.7507/1672-2531.201801026 復制
隨著基因組測序的快速發展以及生物信息學與大數據科學的交叉應用,以個體化醫療為基礎的“精準醫學”醫療模式應運而生。2015 年,美國總統奧巴馬正式推出“精準醫學計劃”,并向該計劃投入 2.15 億美元(其中 1.3 億美元用于建立生物樣本庫),以推動個體化醫療的發展。2016 年,中國吹響了進軍“精準醫學”時代的號角。中科院、科技部、國家發改委、國家衛計委等部門公布了相關重大科研計劃和政策舉措,“精準醫學研究”被列為 2016 年優先啟動的重點專項之一。
我國欲構建百萬人以上自然人群國家大型健康隊列和重大疾病專病隊列,建立多層次精準醫學知識庫體系和安全穩定可操作的生物醫學大數據共享平臺,明確重大疾病病因及危險因素,找尋其治療靶點,實現個體化醫療。為我國精準醫學研究提供基于流行病學的人群研究樣本和超大隊列研究證據。由中國醫學科學院基礎醫學研究所單廣良教授牽頭,與首都醫科大學、天津市婦女兒童保健中心、南開大學和華北理工大學等 10 家單位共同申報的“京津冀地區生活社區自然人群慢性病隊列研究”獲得了國家科技部重點研發計劃“精準醫學專項”的首批資助。該隊列是國家百萬級大型前瞻性隊列研究的重要組成部分,承擔京津冀地區 10 萬自然人群健康相關數據的收集工作。按照示范隊列提供的技術、標準和規范,整合京津冀三地已有的優質隊列,建立多層次精準醫學知識庫體系和安全穩定可操作的生物醫學大數據共享平臺,為明確京津冀地區重大疾病病因及危險因素,尋找治療靶點,實現精準治療打下重要基礎。
該項目一共包括 5 個課題,擬建立嬰幼兒及兒童青少年生長發育隊列、生活社區自然人群隊列、體檢中心自然人群健康趨勢隊列和職業人群健康效應隊列 4 個子隊列,覆蓋生命全程,研究從孕期至老年期多種暴露對慢性病發生的作用及其作用程度;此外,由于京津冀地區大氣污染極為嚴重,健康效應十分復雜,在國內具有典型意義,此隊列還將重點關注大氣污染對不同年齡人群的健康效應影響。
由首都醫科大學負責的“京津冀地區生活社區自然人群慢性病隊列研究”將覆蓋北京、天津和河北(京津冀地區一省兩市)20 歲以上 3.5 萬社區自然人群,收集健康相關數據,建立自然人群健康大數據庫和生物樣本庫。該部分重點關注京津冀地區生活社區自然人群的生活行為方式、疾病史及家族史、空氣污染暴露史和生理參數,通過高效靈敏的隨訪監測技術,獲得準確的結局指標信息,旨在明確京津冀地區重大慢性病(如缺血性心臟病、腦血管病、糖尿病、慢性阻塞性肺疾病和惡性腫瘤)的病因和危險因素,并分析空氣污染暴露的健康損害效應,從而建立疾病發病風險預測模型,用于社區慢性病的精準預防和精準干預。
1 調查地點
考慮京津冀地區各省市經濟水平、醫療水平和大氣污染水平的差異,進行調查地點的選擇:北京市和天津市為京津冀中部核心功能區,經濟水平最為發達,大氣污染相對嚴重;石家莊市和保定市為京津冀南部功能拓展區,經濟水平變化快,大氣污染最為嚴重,位列全國 74 個城市空氣質量排名相對較差的 10 個城市之中;承德市為京津冀西北部生態涵養區,經濟水平相對落后,空氣質量好。此外,同時考慮調查地區城市農村水平差異。故最終選擇 10 個地區作為項目調查地區:5 個城市地區(北京市城區、天津市城區、河北省承德市雙橋區、河北省石家莊市橋西區和河北省石家莊市長安區)和 5 個農村地區(北京市郊區、天津市郊區、河北省承德市圍場縣、河北省承德市豐寧縣和河北省石家莊市鹿泉區)。調查地點分布見圖 1。
每個調查地區以街道或鄉鎮行政區劃為調查單位。根據當地戶籍底冊或登記確定調查地區所有符合納入標準的居民。由當地社區衛生服務中心(城市)或村委會(農村)的工作人員,通過上門(農村)、電話或社交網絡平臺(城市)發送邀請信及項目背景介紹,并為志愿參與者預約體檢時間。對所有參加調查的對象,要求攜帶身份證,在指定時間到達現場調查診室(常設立在社區衛生服務中心、居委會、村衛生室和學校等)接受調查。

2 研究對象
“京津冀地區生活社區自然人群慢性病隊列研究”共納入 3.5 萬的生活社區自然人群,其中北京市 1.5 萬人,天津市 1 萬人,河北省 1 萬人(保定市、承德市和石家莊市分別納入 1 500 人、4 000 人和 4 500 人)。研究對象納入標準為:① 年齡 20~80 周歲;② 在當地居住 1 年以上;③ 身體無重大殘疾,無精神疾患;④ 非孕產婦。為保護受試者參與的積極性及依從性,實際調查中還接受了少數年齡略超出預設范圍但自愿參加項目的對象。研究對象性別、年齡結構依據全國第六次人口普查結果分層計算后納入,確保研究人群具有一定的地域代表性。
在調查開始前,本項目已通過首都醫科大學倫理委員會的審查。
3 基線調查
基線調查于 2017 年 7 月首先在河北省啟動,現已完成河北省 1 萬人的基線調查工作; 2017 年 11 月啟動北京市和天津市基線調查,預計在 2018 年結束全部 3.5 萬人基線調查工作。
基線調查統一按照項目組制定的標準化現場操作手冊實施,主要包括問卷調查、體格檢查和實驗室檢查,共涉及 273 項指標(現場調查流程見圖 2)。① 所有調查對象采用統一紙質問卷,問卷調查主要涉及一般情況、吸煙史、飲酒史、體力活動、疾病史、家族史和空氣污染暴露史共 160 項指標。所有調查問卷均通過調查員詢問填寫(禁止自填問卷),并由核查員進行現場核查,保證問卷信息的準確性。所有回收的問卷,通過項目組問卷電子化信息系統進行掃描保存和問卷信息的二次錄入。② 體格檢查主要涉及身體成分、血壓、骨密度、心電圖、握力、血氧飽和度和肺功能共 64 項指標。用于體格檢查的各項儀器均經過專家論證,為國內外認可的標準化器材。所有體檢項目結果均采用計算機軟件進行實時保存,以受試者唯一編號進行連通,整合后存儲于數據庫保存。③ 實驗室檢查涉及肝功能、腎功能、血脂、血糖和心血管疾病相關生物標志物指標。現場采集受試者 4 mL 抗凝血和 5 mL 促凝血,其中促凝血進行當場離心,分離血清用于血生化檢測,剩余血清分離提取保存于–80℃ 冰箱;抗凝血在當日進行離心分離,血漿和血細胞保存于–80℃ 冰箱。所有血液樣本分段、分批次冷鏈運回首都醫科大學生物樣本庫,進行統一保存,見圖 3。


采用項目組開發的專用登記系統實現受試者身份證信息自動錄入和導出,以及采集受試者問卷發放和回收情況。在進行基線調查時,項目組工作人員每天從登記系統導出受試者基本信息清單,按照性別和年齡進行分層統計,并與預先根據人口普查結果算出的人口結構表進行比對,根據比對結果通知當地社區衛生服務中心或鄉鎮衛生所,靈活調整后續受試者的人口結構,使調查整體人群的性別和年齡結構符合當地實際情況,盡量保證各年齡組和性別的均衡性,以確保研究對象的代表性和控制選擇偏倚(圖 4)。

4 隨訪監測
隨訪監測的結局事件主要分為兩部分:① 死亡結局:全死因監測;② 發病結局:重點關注缺血性心臟病(I20-I25)、腦血管病(I60-I69)、糖尿病(E10-E14)、慢性阻塞性肺疾病(J44)和全部惡性腫瘤(C00-C97)的發病情況。隨訪監測的內容主要涉及三方面:① 收集結局事件(死亡和發病)相關影響因素(生活行為方式、空氣污染暴露史和生理指標等)的長期變化趨勢;② 明確研究對象結局事件(死亡和發病)的發生情況和時間;③ 明確研究對象的遷移和失訪狀況。
本隊列研究擬采取綜合的隨訪監測方法,即常規監測、社區定向監測和重復現場調查相結合的方法(參考示范隊列的隨訪監測方法)來控制失訪偏倚。按照研究計劃,項目組將在基線調查后三年內,對基線所有調查對象進行一次隨訪,按照與基線調查類似的程序收集生活行為方式和生理指標等信息,以明確研究對象結局影響因素的動態變化情況并校正回歸稀釋偏倚(regression dilution bias)。對于研究對象死亡和發病結局的實時監測,我們擬采取常規監測和社區定向監測相結合的方式:① 常規監測主要是利用當前運行的死亡發病監測系統或當地衛生部門常規工作中形成的資料或數據庫來獲取研究對象結局的信息,其中涉及的死亡結局的常規監測系統為全國死因監測系統(new mortality surveillance system,NMSS)和居民死亡登記系統;發病結局的常規監測主要為《慢病報告卡》和社區居民健康檔案。② 社區定向監測主要是由項目組產生隨訪名單下發給社區、居委會或鄉鎮、村的相關工作人員,由這些當地的工作人員定期聯系研究對象,以確定結局信息(主要彌補常規監測的漏報情況)和遷移失訪情況。項目組首先從數據庫產生隨訪名單,同時下發給當地疾控中心和項目社區,疾控中心根據隨訪名單以研究對象身份證號為依據,在常規監測系統(死亡證明書、發病報告卡和遷移人口清單)中進行初篩;社區工作人員按照隨訪清單,根據基線調查時記錄的聯系方式,通過入戶、電話或項目組開發的應用軟件進行隨訪。最終將常規監測和定向監測的隨訪結果統一上報項目組核心成員進行比對核實后統一將隨訪信息錄入數據庫保存(圖 5)。
本隊列研究依據國家“精準醫學專項”指南要求,5 年失訪率應控制在 10% 以下。失訪主要通過納入地區常住居民和采取常規監測、社區定向監測和重復現場調查相結合的隨訪監測方法來控制。

5 質量控制
所有調查地區采用項目組統一的研究方案和標準化調查手冊,采用同一套儀器進行檢測,統一采購所有調查用耗材,以控制系統誤差,確保研究結果的可比性。項目實行全程計算機化管理,問卷數據及現場體檢數據的采集均通過項目專用軟件系統進行導出、清洗和規范化管理。所有數據均由項目組指定人員進行雙備份管理(硬盤備份及云端備份)。
每個調查現場均有項目組人員進行全程質控,現場調查開始之前均對所有調查員按照項目組編寫的《京津冀地區生活社區自然人群慢性病隊列研究標準化調查手冊》進行嚴格培訓。
6 結語
本項目將建立京津冀地區生活社區自然人群 3.5 萬人的隊列基線、隨訪信息數據庫和生物樣本庫,統一提交國家精準醫學健康大數據平臺實現數據共享。同時,本項目將闡明京津冀地區重大慢性病的主要危險因素和易感特征,分析空氣污染暴露的健康損害效應,從而建立疾病發病風險預測模型,用于社區慢性病的精準預防和精準干預。旨在實現社區人群慢性病的個體化防治,提高生命質量,降低疾病負擔,為全社會經濟和健康的可持續發展貢獻力量。
隨著基因組測序的快速發展以及生物信息學與大數據科學的交叉應用,以個體化醫療為基礎的“精準醫學”醫療模式應運而生。2015 年,美國總統奧巴馬正式推出“精準醫學計劃”,并向該計劃投入 2.15 億美元(其中 1.3 億美元用于建立生物樣本庫),以推動個體化醫療的發展。2016 年,中國吹響了進軍“精準醫學”時代的號角。中科院、科技部、國家發改委、國家衛計委等部門公布了相關重大科研計劃和政策舉措,“精準醫學研究”被列為 2016 年優先啟動的重點專項之一。
我國欲構建百萬人以上自然人群國家大型健康隊列和重大疾病專病隊列,建立多層次精準醫學知識庫體系和安全穩定可操作的生物醫學大數據共享平臺,明確重大疾病病因及危險因素,找尋其治療靶點,實現個體化醫療。為我國精準醫學研究提供基于流行病學的人群研究樣本和超大隊列研究證據。由中國醫學科學院基礎醫學研究所單廣良教授牽頭,與首都醫科大學、天津市婦女兒童保健中心、南開大學和華北理工大學等 10 家單位共同申報的“京津冀地區生活社區自然人群慢性病隊列研究”獲得了國家科技部重點研發計劃“精準醫學專項”的首批資助。該隊列是國家百萬級大型前瞻性隊列研究的重要組成部分,承擔京津冀地區 10 萬自然人群健康相關數據的收集工作。按照示范隊列提供的技術、標準和規范,整合京津冀三地已有的優質隊列,建立多層次精準醫學知識庫體系和安全穩定可操作的生物醫學大數據共享平臺,為明確京津冀地區重大疾病病因及危險因素,尋找治療靶點,實現精準治療打下重要基礎。
該項目一共包括 5 個課題,擬建立嬰幼兒及兒童青少年生長發育隊列、生活社區自然人群隊列、體檢中心自然人群健康趨勢隊列和職業人群健康效應隊列 4 個子隊列,覆蓋生命全程,研究從孕期至老年期多種暴露對慢性病發生的作用及其作用程度;此外,由于京津冀地區大氣污染極為嚴重,健康效應十分復雜,在國內具有典型意義,此隊列還將重點關注大氣污染對不同年齡人群的健康效應影響。
由首都醫科大學負責的“京津冀地區生活社區自然人群慢性病隊列研究”將覆蓋北京、天津和河北(京津冀地區一省兩市)20 歲以上 3.5 萬社區自然人群,收集健康相關數據,建立自然人群健康大數據庫和生物樣本庫。該部分重點關注京津冀地區生活社區自然人群的生活行為方式、疾病史及家族史、空氣污染暴露史和生理參數,通過高效靈敏的隨訪監測技術,獲得準確的結局指標信息,旨在明確京津冀地區重大慢性病(如缺血性心臟病、腦血管病、糖尿病、慢性阻塞性肺疾病和惡性腫瘤)的病因和危險因素,并分析空氣污染暴露的健康損害效應,從而建立疾病發病風險預測模型,用于社區慢性病的精準預防和精準干預。
1 調查地點
考慮京津冀地區各省市經濟水平、醫療水平和大氣污染水平的差異,進行調查地點的選擇:北京市和天津市為京津冀中部核心功能區,經濟水平最為發達,大氣污染相對嚴重;石家莊市和保定市為京津冀南部功能拓展區,經濟水平變化快,大氣污染最為嚴重,位列全國 74 個城市空氣質量排名相對較差的 10 個城市之中;承德市為京津冀西北部生態涵養區,經濟水平相對落后,空氣質量好。此外,同時考慮調查地區城市農村水平差異。故最終選擇 10 個地區作為項目調查地區:5 個城市地區(北京市城區、天津市城區、河北省承德市雙橋區、河北省石家莊市橋西區和河北省石家莊市長安區)和 5 個農村地區(北京市郊區、天津市郊區、河北省承德市圍場縣、河北省承德市豐寧縣和河北省石家莊市鹿泉區)。調查地點分布見圖 1。
每個調查地區以街道或鄉鎮行政區劃為調查單位。根據當地戶籍底冊或登記確定調查地區所有符合納入標準的居民。由當地社區衛生服務中心(城市)或村委會(農村)的工作人員,通過上門(農村)、電話或社交網絡平臺(城市)發送邀請信及項目背景介紹,并為志愿參與者預約體檢時間。對所有參加調查的對象,要求攜帶身份證,在指定時間到達現場調查診室(常設立在社區衛生服務中心、居委會、村衛生室和學校等)接受調查。

2 研究對象
“京津冀地區生活社區自然人群慢性病隊列研究”共納入 3.5 萬的生活社區自然人群,其中北京市 1.5 萬人,天津市 1 萬人,河北省 1 萬人(保定市、承德市和石家莊市分別納入 1 500 人、4 000 人和 4 500 人)。研究對象納入標準為:① 年齡 20~80 周歲;② 在當地居住 1 年以上;③ 身體無重大殘疾,無精神疾患;④ 非孕產婦。為保護受試者參與的積極性及依從性,實際調查中還接受了少數年齡略超出預設范圍但自愿參加項目的對象。研究對象性別、年齡結構依據全國第六次人口普查結果分層計算后納入,確保研究人群具有一定的地域代表性。
在調查開始前,本項目已通過首都醫科大學倫理委員會的審查。
3 基線調查
基線調查于 2017 年 7 月首先在河北省啟動,現已完成河北省 1 萬人的基線調查工作; 2017 年 11 月啟動北京市和天津市基線調查,預計在 2018 年結束全部 3.5 萬人基線調查工作。
基線調查統一按照項目組制定的標準化現場操作手冊實施,主要包括問卷調查、體格檢查和實驗室檢查,共涉及 273 項指標(現場調查流程見圖 2)。① 所有調查對象采用統一紙質問卷,問卷調查主要涉及一般情況、吸煙史、飲酒史、體力活動、疾病史、家族史和空氣污染暴露史共 160 項指標。所有調查問卷均通過調查員詢問填寫(禁止自填問卷),并由核查員進行現場核查,保證問卷信息的準確性。所有回收的問卷,通過項目組問卷電子化信息系統進行掃描保存和問卷信息的二次錄入。② 體格檢查主要涉及身體成分、血壓、骨密度、心電圖、握力、血氧飽和度和肺功能共 64 項指標。用于體格檢查的各項儀器均經過專家論證,為國內外認可的標準化器材。所有體檢項目結果均采用計算機軟件進行實時保存,以受試者唯一編號進行連通,整合后存儲于數據庫保存。③ 實驗室檢查涉及肝功能、腎功能、血脂、血糖和心血管疾病相關生物標志物指標。現場采集受試者 4 mL 抗凝血和 5 mL 促凝血,其中促凝血進行當場離心,分離血清用于血生化檢測,剩余血清分離提取保存于–80℃ 冰箱;抗凝血在當日進行離心分離,血漿和血細胞保存于–80℃ 冰箱。所有血液樣本分段、分批次冷鏈運回首都醫科大學生物樣本庫,進行統一保存,見圖 3。


采用項目組開發的專用登記系統實現受試者身份證信息自動錄入和導出,以及采集受試者問卷發放和回收情況。在進行基線調查時,項目組工作人員每天從登記系統導出受試者基本信息清單,按照性別和年齡進行分層統計,并與預先根據人口普查結果算出的人口結構表進行比對,根據比對結果通知當地社區衛生服務中心或鄉鎮衛生所,靈活調整后續受試者的人口結構,使調查整體人群的性別和年齡結構符合當地實際情況,盡量保證各年齡組和性別的均衡性,以確保研究對象的代表性和控制選擇偏倚(圖 4)。

4 隨訪監測
隨訪監測的結局事件主要分為兩部分:① 死亡結局:全死因監測;② 發病結局:重點關注缺血性心臟病(I20-I25)、腦血管病(I60-I69)、糖尿病(E10-E14)、慢性阻塞性肺疾病(J44)和全部惡性腫瘤(C00-C97)的發病情況。隨訪監測的內容主要涉及三方面:① 收集結局事件(死亡和發病)相關影響因素(生活行為方式、空氣污染暴露史和生理指標等)的長期變化趨勢;② 明確研究對象結局事件(死亡和發病)的發生情況和時間;③ 明確研究對象的遷移和失訪狀況。
本隊列研究擬采取綜合的隨訪監測方法,即常規監測、社區定向監測和重復現場調查相結合的方法(參考示范隊列的隨訪監測方法)來控制失訪偏倚。按照研究計劃,項目組將在基線調查后三年內,對基線所有調查對象進行一次隨訪,按照與基線調查類似的程序收集生活行為方式和生理指標等信息,以明確研究對象結局影響因素的動態變化情況并校正回歸稀釋偏倚(regression dilution bias)。對于研究對象死亡和發病結局的實時監測,我們擬采取常規監測和社區定向監測相結合的方式:① 常規監測主要是利用當前運行的死亡發病監測系統或當地衛生部門常規工作中形成的資料或數據庫來獲取研究對象結局的信息,其中涉及的死亡結局的常規監測系統為全國死因監測系統(new mortality surveillance system,NMSS)和居民死亡登記系統;發病結局的常規監測主要為《慢病報告卡》和社區居民健康檔案。② 社區定向監測主要是由項目組產生隨訪名單下發給社區、居委會或鄉鎮、村的相關工作人員,由這些當地的工作人員定期聯系研究對象,以確定結局信息(主要彌補常規監測的漏報情況)和遷移失訪情況。項目組首先從數據庫產生隨訪名單,同時下發給當地疾控中心和項目社區,疾控中心根據隨訪名單以研究對象身份證號為依據,在常規監測系統(死亡證明書、發病報告卡和遷移人口清單)中進行初篩;社區工作人員按照隨訪清單,根據基線調查時記錄的聯系方式,通過入戶、電話或項目組開發的應用軟件進行隨訪。最終將常規監測和定向監測的隨訪結果統一上報項目組核心成員進行比對核實后統一將隨訪信息錄入數據庫保存(圖 5)。
本隊列研究依據國家“精準醫學專項”指南要求,5 年失訪率應控制在 10% 以下。失訪主要通過納入地區常住居民和采取常規監測、社區定向監測和重復現場調查相結合的隨訪監測方法來控制。

5 質量控制
所有調查地區采用項目組統一的研究方案和標準化調查手冊,采用同一套儀器進行檢測,統一采購所有調查用耗材,以控制系統誤差,確保研究結果的可比性。項目實行全程計算機化管理,問卷數據及現場體檢數據的采集均通過項目專用軟件系統進行導出、清洗和規范化管理。所有數據均由項目組指定人員進行雙備份管理(硬盤備份及云端備份)。
每個調查現場均有項目組人員進行全程質控,現場調查開始之前均對所有調查員按照項目組編寫的《京津冀地區生活社區自然人群慢性病隊列研究標準化調查手冊》進行嚴格培訓。
6 結語
本項目將建立京津冀地區生活社區自然人群 3.5 萬人的隊列基線、隨訪信息數據庫和生物樣本庫,統一提交國家精準醫學健康大數據平臺實現數據共享。同時,本項目將闡明京津冀地區重大慢性病的主要危險因素和易感特征,分析空氣污染暴露的健康損害效應,從而建立疾病發病風險預測模型,用于社區慢性病的精準預防和精準干預。旨在實現社區人群慢性病的個體化防治,提高生命質量,降低疾病負擔,為全社會經濟和健康的可持續發展貢獻力量。