常規收集衛生數據是指基于管理和臨床目的且事先沒有特定研究目標而收集的數據,已被越來越多地用于研究。此類數據發展迅速,可及性好,但相關注意事項并未在現有的報告規范中被提及,如加強觀察性流行病學研究報告的聲明(strengthening the reporting of observational studies in epidemiology statement,STROBE)。使用常規收集衛生數據開展觀察性研究的報告規范(the report of studies conducted using observational routinely collected data,RECORD)可填補該空缺。RECORD 規范是 STROBE 規范擴展版,其可用來提出針對使用常規收集衛生數據開展觀察性研究有關報告的條件要求。RECORD 清單擴展了包括題目、摘要、前言、方法、結果、討論和其他內容等需要在此類研究報告中包含的 13 個條目內容。該規范包括了清單、詳盡的解釋性信息以提高清單的使用。該規范還給出每條 RECORD 清單條目良好的報告實例。本文及其官網和留言板(http://www.record-statement.org)可提高 REDORD 規范的應用和理解。通過應用 RECORD,作者、期刊編輯和同行評議者可促進研究報告的質量。
引用本文: 聶曉璐, 彭曉霞, 譯. 使用常規收集衛生數據開展觀察性研究的報告規范-RECORD 規范. 中國循證醫學雜志, 2017, 17(4): 475-487. doi: 10.7507/1672-2531.201702009 復制
1 前言
醫療衛生實踐中產生數據的可用性在日益提高,通過對疾病發病率和結局的監測,改變了研究范疇。常規收集衛生數據的定義為:不是針對開展研究前即確定的研究問題而收集的數據[1]。這些數據來源包括廣泛的研究資源供應(如疾病登記)、臨床管理(如初級保健數據庫)、衛生系統規劃(如衛生管理數據)、臨床護理文件(如電子健康記錄數據倉庫)或流行病學監測(如癌癥登記和公共衛生報告數據)。在多種醫療保健機構和地理位置背景下產生的這些數據為臨床醫學、衛生服務規劃和公共衛生決策提供了創新、高效及成本-效益較高的研究可能[2]。國際范圍內,政府和資助機構優先使用常規收集的健康數據作為改善患者護理、改革健康研究和提高衛生保健效率的工具[3]。
雖然擴展的數據可用性為回答亟需解決的研究問題提供了重要機會,但同時也給研究實施和評價及結果應用帶來挑戰。常規收集衛生數據來源的多樣化及其數據結構的快速擴展給如何確定各個數據源的優勢、局限和偏倚帶來了挑戰。常規收集數據的研究報告存在的不完整或不充分的特點可能會加重這些挑戰。對基于使用常規數據源的研究進行系統分析發現諸多報告問題[4]:暴露和結局編碼的有關信息報告不完整,不同數據源的鏈接率的細節存在報告不足或缺失等。已有系統評價的結果提示對常規數據來源數據進行驗證的研究報告質量不高[5,6],這可能掩蓋偏倚,妨礙開展 Meta 分析,導致錯誤結論。

為改善報告質量,現已針對一系列研究設計和內容制定了許多報告指南[8,9]。加強觀察性流行病學研究報告的聲明(Strengthening the reporting of observational studies in epidemiology statement,STROBE)是為提高觀察性研究報告的透明度而制定的[10,11],并被主流醫學期刊廣泛接受和認可。已有研究發現在文章編輯過程中使用 STROBE 確實提高了研究報告的質量[12,13]。大多數使用常規收集數據開展的研究屬于觀察性研究,因此,STROBE 聲明同樣適用。盡管 STROBE 聲明可應用于所有觀察性研究,但使用常規收集數據開展研究在報告中涉及的特有問題尚未提及。2012 年,關注使用常規收集衛生數據開展研究的國際科學家小組和 STROBE 組織代表在倫敦的初級保健數據庫研討會上會面,對 STROBE 聲明在常規收集衛生數據研究中的應用進行了討論[14,15]。會議認識到 STROBE 聲明具體到使用此類數據開展研究報告時產生的差距,并對 STROBE 聲明進行擴展達成共識。因此,依據該組織國際合作的流程發起倡議,起草使用常規收集衛生數據開展觀察性研究的報告規范(the report of studies conducted using observational routinely collected Data,RECORD)作為 STROBE 的擴展,旨在探索和提出有關使用常規收集衛生數據開展研究的特定報告事項。RECORD 規范涉及了 100 余位國際利益相關者,包括研究人員、期刊編輯和數據使用者,即使用常規數據的研究結果為決策提供信息的利益相關者。制定 RECORD 規范的方法另有詳述[16],即根據報告指南的既定方法而制定[17]。簡言之,對利益相關者進行兩輪調查,確定優先考慮納入 RECORD 規范中的條目。隨后工作委員會人員會面,撰寫了該聲明的文檔。利益相關人員審核聲明并提出反饋意見。最終版的清單及其解釋性文件由指導委員會撰寫,并經工作委員會審查和批準。STROBE 指導委員會的成員均參與了 RECORD 規范的制定。
與 STROBE 方法一致,RECORD 規范并非以推薦開展研究的方法為目的,而是為完善其報告,以確保讀者、同行評審、期刊編輯和其他研究消費者能夠評估研究的內部和外部真實性。通過改善使用日常收集衛生數據的研究報告質量,努力減少不清楚的研究報告并且遵守科學研究過程的原則:創新、透明和可重復[18]。
2 RECORD 清單及其解讀
完整的 RECORD 清單見表 1。由于 RECORD 清單是現有 STORBE 條目的擴展,因此將其補充在相應的 STROBE 條目旁。我們建議作者充分闡明清單中的每個條目,但不需要嚴格按照清單順序進行描述。我們將 RECORD 清單條目的詳細解釋作為正文中的一部分提供。當不需要針對使用常規收集衛生數據的研究在 STROBE之外額外增加清單條目時,需要的解釋參見 STROBE 相應條目。

2.1 題目和摘要
RECORD 1.1:在題目或摘要中明確使用的數據類型。可能的話,應包含所使用數據庫的名稱。RECORD 1.2:如需要,應在題目或摘要中報告研究發生的地理位置和時間窗。RECORD 1.3:如果研究實施了數據庫的鏈接,應在題目或摘要中給予清晰闡述。
實例 ① “2010 年結腸鏡檢查后穿孔和出血:基于法國綜合健康保險數據(SNIIRAM)”[19]。② “荷蘭醫院標準化死亡率(HSMR)方法和心臟外科手術:使用醫院管理數據為基準的國家隊列與臨床數據庫比較”[20]。
解釋 由于缺乏檢索使用常規采集衛生數據這類研究的相關醫學主題詞(Medical Subject Heading,MeSH),所以如何快速檢索此類研究十分重要。然而,考慮到各種各樣的數據類型,簡單地說使用“常規數據”是不夠的。應在題目和/或摘要中明確常規數據的類型。數據類型包括健康管理數據、其他管理數據(如,保險、出生/死亡登記和就業)、疾病登記、初級保健數據庫、電子健康病歷數據以及人口登記。命名所使用的數據庫固然重要,但不能替代在題目或摘要中提供數據源類型的重要性。
STROBE 清單已包括涉及地理區域和時間框架的項目。我們建議使用 RECORD 清單的論文也在題目或摘要部分將其作為必需條目。顯然,區域和時間框架的詳細程度需符合字數限制并考慮保密問題。然而,對研究區域的報告最低要求應使用定義研究人群(如國家、州、省和地區)的最高地理級別的名稱。
此外,應在題目或摘要中報告數據庫之間的鏈接(如果使用到)。例如,可接受的措辭包括“使用多個鏈接的健康管理數據庫”或“將某數據庫(名稱)與另一數據庫(名稱)鏈接”。在題目或摘要中使用“鏈接”一詞可提供足夠的信息,關于鏈接方法的具體細節應在正文的方法學部分加以闡述。
2.2 前言
除 STROBE 中的條目外,不需在 RECORD 規范中添加特定條目。STROBE 聲明建議在“前言”部分說明“具體目標,包括任何預先設定的具體假設”。闡明具體的研究目標對于任何觀察性研究的復制和翻譯都是必要的。對于使用常規收集數據的研究,作者應進一步澄清分析目的是出于數據探索并發現新關系(如數據挖掘或旨在產生假說的研究[21,22])的目的,還是為了驗證一個或更多的假設[23]。作者也應該指出他們的假設是在數據分析之前還是之后形成的。同時,應清楚地說明是否有研究方案,如何獲得,以及是否在可公開獲得的研究注冊中心注冊了該研究。因為使用常規收集數據開展研究的方法學優勢和局限性可能還是有爭議的,所以清楚地描述研究目標是必要的[23,24]。簡單地將研究標記為描述性,而沒有澄清其目的是產生還是檢驗假設是不充分的。
2.3 方法
2.3.1 場景 RECORD沒有額外擴展STROBE關于“描述數據收集的機構,地點和時間范圍,包括征集研究對象、暴露、隨訪和數據收集的時間范圍”的條目要求。應注意,除在題目和/或摘要中已提及的數據庫類型以外,應提供相關信息以便讀者理解數據庫的內容及其真實性和收集數據的原始原因。例如,記錄電子病歷的人可能是專科醫師或初級保健醫師,也可能是急診科醫生或住院醫師,也可能是高年資醫師或醫學生。他們可能接受過專門培訓,以確保數據記錄的完整和可重復性,也可能沒有接受過培訓[25]。為讓讀者判斷是否可以將研究發現應用到源人群中,作者還應該描述數據庫人群與源人群的關系,包括選擇標準。
2.3.2 研究對象 RECORD 6.1:應詳細列出研究人群選擇方法(如用于識別研究對象的編碼或算法)。如不可行,應給予解釋。RECORD 6.2:任何針對選擇研究人群編碼或算法進行的驗證研究均應標引參考文獻。如果為本研究實施的驗證沒有在其他地方發表,需要提供驗證方法的細節和結果。RECORD 6.3:如果研究涉及數據庫鏈接,考慮使用流程圖或其他圖表展示以說明數據鏈接過程,包括每一步驟中能實現數據鏈接的個體人數。
實例 RECORD 6.1:這部分報告較好的文章內容如下:OCCC(Ontario Crohn's 和 Colitis Cohort)使用驗證的算法基于年齡組來識別的 IBD 患者。這里的每個算法在安大略省應用于特定年齡組,多個隊列,醫療實踐類型和區域并已驗證。對于 18 歲以下的兒童,根據他們是否進行結腸鏡檢查或乙狀結腸鏡檢查來定義。如果他們進行了內鏡檢查,定義為在 3 年內需要 4 個門診醫師聯系或 2 次因 IBD 住院。如他們未經內鏡檢查,則需要 7 個門診醫生聯系或在 3 年內 3 次因 IBD 住院……該算法正確識別 IBD 兒童所具有靈敏度為……[26]。本文參考了兩個先前的算法驗證研究來識別不同年齡的炎性腸病患者,包括診斷準確性的測量。
RECORD 6.2:① Ducharme 和他的同事詳細描述了識別兒童腸套疊的編碼驗證過程,然后使用已驗證的編碼描述流行病學。驗證研究中涉及的列于文章的圖 2[27]。② Benchimol 和同事沒有進行驗證工作,然而,參考了先前進行的驗證工作,詳細描述了識別編碼算法的診斷準確度信息[26]。
RECORD 6.3:RECORD 網站上的示例圖 2、圖 3 和圖 4 展示了一些可能的方式以說明鏈接過程:圖 2 說明鏈接過程的韋恩圖(在 Herrett 等人的許可下復制[28],見網站:)。圖 3 混合流程圖和韋恩圖說明鏈接過程(轉載得到 van Herk-Sukel 等人的許可[29],見網站:)。圖 4 與參與者流程圖結合的鏈接圖(在 Fosb?l 等人許可下[30],見網站:)。
解釋 RECORD 6.1 和 6.2:報告用于獲得研究人群的識別編碼/算法的真實性對于使用常規收集衛生數據開展的觀察性研究報告的透明性是必要的。此外,報告編碼/算法可讓其他研究者實施外部或內部驗證。
應明確和清晰地闡述用于識別研究對象的方法,包括是否基于唯一編碼,算法(記錄或編碼的組合),數據庫之間的鏈接,或自由文本字段。
正如許多其他流行病學研究一樣,在使用常規衛生數據開展的研究中,錯分偏倚的風險可能威脅研究結果的真實性[31]。雖然在使用大樣本人群數據庫的研究中存在放大錯分的風險,但這些研究提供了研究罕見疾病或非常見疾病的機會[32]。作為使用常規收集衛生數據研究的必要部分,識別方法的驗證日益受到重視,尤其是在使用以計費為目的收集的管理數據開展研究時使用的疾病編碼[33]。外部驗證研究通常需要將用于識別研究人群的編碼或算法與參考標準進行比較。最常用的參考標準是醫療記錄,患者或醫生的調查,以及臨床登記[5,34]。此外,數據庫的內部驗證可以通過比較單個數據庫內交叉出現的數據源[35]。準確性的測量類似于診斷試驗研究的報告,包括靈敏度、特異度、陽性和陰性預測值,或 kappa 系數[5,34]。
因此,對于使用常規收集衛生數據開展的觀察性研究,我們建議在正文方法部分中提供詳細的識別編碼/算法的外部或內部驗證信息。如果之前已開展過一項或多項驗證研究,應標引參考文獻。如未進行驗證研究,則應明確說明。此外,應就識別方法的準確性(使用常見的診斷準確性術語)及它們在亞組人群中應用的功能進行簡要討論。如果作為觀察性研究的一部分而開展的驗證研究,我們建議作者使用已發表的驗證研究的報告指南[5]。重要的是要說明驗證是否基于不同于本研究選擇的數據來源或數據庫人群開展的,因為編碼可能在不同的人群或數據庫中發揮不同的作用[36]。另外,如果用于比較的參考標準存在已知問題,例如不完整或不準確,則應當報告這些問題并討論其局限性。作者應討論用于識別研究人群和結果所使用的選擇編碼/算法的含義、錯分風險,及其對研究結果的潛在影響。對使用不同于當前研究人群的其他人群進行驗證的意義進行討論則更為重要。
RECORD 6.3:流程圖或其他圖形展示可表達鏈接過程的相關信息,并可以簡化冗長的描述。這樣的圖示可提供關鍵數據,如實現鏈接和未鏈接的個體所占比例和特征信息。讀者據此可確定獲得成功鏈接的數據庫人群所占比例及研究人群的代表性。鏈接流程圖可是獨立的圖(如,韋恩圖或流程圖),也可結合 STROBE 建議參與者流程圖。圖表展示可以有多種形式,我們不再給特定推薦。
2.3.3 變量 RECORD 7.1:提供將暴露、結局、混雜因素和效應修飾因子進行分類的編碼和算法的完整列表。如不能報告這些內容,需給予解釋。
實例 ① Hardelid 和同事在他們的補充數據 2 的 S1 表中提供了所有編碼[37]。② Murray 及其同事在其附錄 S1 中提供了有風險組的所有編碼[38]。
解釋 正如用于識別研究群體的編碼/算法一樣,用于劃分暴露、結局、混雜因子和效應修飾因子的編碼/算法也會為研究帶來潛在錯分偏倚。為允許重復研究,對其進行評價并與其他研究進行比較,我們建議在正文、在線附錄和/或外部網站上提供用于研究實施的所有診斷、程序、藥物或其他編碼的列表。對于通過調查方式收集的常規數據,針對研究對象的調查問題的措辭要清晰明確。考慮到所有研究(包括使用常規衛生數據開展的研究)均存在錯分偏倚風險[31],作者應提供足夠的細節,使研究具有可重復性,并使偏倚風險易于識別。如可在文章正文中描述驗證研究,或提供其他已出版或在線材料的參考文獻。如上所述,作者應說明驗證研究所使用的人群是否不同于當前研究所使用的人群來源或數據庫。
我們認識到,在某些情況下,研究人員可能會避免在發表刊物中提供所使用的編碼列表和算法,因該信息被視為專利或受版權、知識產權或其他法律的保護。例如,一些共病調整指數是由營利性公司創建,并銷售給學術研究領域的研究者使用[39,40]。在這些情況下,作者可能依賴數據提供者或受信任的第三方來收集、清洗和/或鏈接數據。作者應針對他們無法提供編碼列表或其他用于識別研究個體或疾病信息的情況加以詳細說明,并盡量提供這些列表所有權機構的聯系信息。此外,作者應該闡明無法提供這些信息會如何影響其他研究者對研究的重復和評估。理想情況是,第三方應提供詳細信息說明如何收集、清洗或鏈接數據。數據提供者和使用者之間的良好溝通可使雙方獲益。
一些學者認為編碼列表代表了研究人員的知識產權。公開發表這些列表并允許其他研究人員將其應用到自己的研究中,可能會影響作者創建編碼列表的知識產權和信用。我們認為這種觀點不符合透明的科學標準,即允許研究的可重復。因此,除受法律或合同保護的編碼列表,我們建議公開全部編碼列表。
考慮到許多期刊的字數和頁數限制以及編碼列表/算法的長度,采用紙質期刊發表編碼列表可行性較低。因而,可使用文本、表格、雜志網頁版將詳細信息作為附錄給予報告,也可由作者或其他個人永久在線存儲,或者存放在第三方數據存儲庫(如,Dryad 或 Figshare)中。文章的正文和參考文獻部分應提高如何獲得編碼列表的詳細信息。如 ClinicalCodes.org 的編碼倉庫承諾公開基于健康數據開展研究中所使用的編碼文檔并透明化[41]。如果將編碼列表作為在線補充發表在期刊網站或作者提供的外部網站上,則應在期刊文章中公開鏈接。在雜志網站或 PubMed Central()上發表編碼列表,會增加獲得補充資料的可能性(只要雜志在發行)。如果在外部私人或機構網站上發表是唯一選擇,建議至少在雜志文章發表后 10 年內,均可持續獲得這些編碼列表。如果更改了 URL 地址,則需要從原有網址自動的重新定位。這些措施將有助于未來的文章讀者能夠獲得完整編碼列表。
在文章中(或以在線附件形式)除提供編碼列表,作者還應提供分析指出研究所使用的編碼/算法是否會引入偏倚。此類偏倚可能包括錯分偏倚、確認偏倚以及缺失數據所致的偏倚。如果基于不同代碼/算法集實施敏感性分析,則應對其進行描述和評估。潛在偏倚的討論可結合 RECORD 和 STROBE 清單的其他部分,如研究對象選擇和編碼驗證。
2.3.4 統計學方法 數據獲得和清洗:RECORD 12.1:作者應描述研究者從數據庫人群中獲取了多少來建立研究人群。RECORD 12.2:作者應提供研究所使用的數據清洗方法的有關信息。RECORD 12.3:說明研究是否在兩個及以上數據庫之間,使用了包含個體水平、機構水平或其他數據進行數據鏈接。應提供鏈接的方法以及對其進行質量評價的方法。
實例 RECORD 12.1:以下文章描述對英國通用實踐研究數據庫(GPRD)子集的獲取:① “通過醫學研究委員會許可協議,GPRD 將其數據集限制為通過其資助的項目的 100 000 名個體。該限制規定了使用病例對照而不是隊列設計,以確保我們為每個特定癥狀確定足夠的癌癥病例……”[42]。② “來自通用實踐研究數據庫的隨機樣本……經醫學研究委員會學術機構許可獲取[43]”。
RECORD 12.2:以下內容是數據清洗方法的描述示例[44]:用于鏈接的公共標識符的完整性在數據集和不同時間是不同的(近年來標識符更完整)。對于 LabBase2,標識符的完整性有所不同(圖 2)。對于 PICANet(兒科重癥監護網),出生日期和醫院數量 100% 完整,大多數其他標識符>98% 完整,除了 NHS(國家衛生服務)號(85% 完整)。對于這兩個數據集,進行數據清洗和數據準備:NHS 或醫院編號例如“未知”或“9999999999”設置為空;通用名稱(例如,“寶貝”、“雙胞胎 1”、“嬰兒”)設置為空;為多個姓創建了多個變量和名字;開始“ZZ”(表示沒有英國郵政編碼)的郵政編碼設置為空。
RECORD 12.3:下面從文章摘錄的是有關數據鏈接的級別,所使用的鏈接技術和方法,以及用于評估鏈接質量的方法的良好報告示例:① “我們將活產和胎兒死亡證明鏈接到事件的時間鏈中,排除人工流產和異位妊娠,構成了個體女性的生殖經歷”[45]。② 兩篇文章包含了對研究特定鏈接的詳細描述報告[44,45]。在 Harron 及其同事[44]的文章中,有詳細的解釋提供了匹配過程的圖形演示。另外,計算鏈接概率的方法描述如下:“計算匹配概率 P(M|協議模式)以估計聯合標識符集匹配的概率。這避免了標識符之間的獨立性的假設。概率被導出為鏈接數除以每個協議模式對的總數(基于在訓練數據集中識別的可能鏈路)。例如,如果有 378 個比較對出生日期和 Soundex 一致,但性別不一致,其中 312 個是可能的鏈接,協議模式的匹配概率[1,1,0]為 312/378=0.825”[44]。Adams 和同事的文章也提供了解釋鏈接的詳細過程:“確定性鏈接包括 I 期,其需要六個處理步驟,在這六個處理步驟期間形成鏈并將單獨的(先前未鏈接的)記錄添加到鏈中。接下來是階段 n,其需要多次通過文件以組合屬于同一母親的鏈”[45]。③ 相比之下,如果一項研究涉及以前的鏈接數據,則參考以前的文章即可,如:“兩個數據庫的記錄基于出生日期都與市政登記處聯系在一起,性別和郵政編碼,并隨后相互鏈接。鏈接由荷蘭統計局執行,并在以前的出版物中描述”[20]。④ 以下是良好報告鏈接和未鏈接個人特征的例子:“根據本文的目的,不匹配的 ISC(住院統計數據收集)記錄將被稱為 ISC 殘差,不匹配的 MDC(助產師數據收集)記錄作為 MDC 殘差和鏈接對作為匹配記錄……選擇變量可用于兩個數據集,在三組間比較-ISC 殘差、MDC 殘差和匹配記錄”[46]。
解釋 RECORD 12.1 和 12.2:如果數據分析人員不熟悉隊列建立的微小差別或建立研究隊列的目標,可能發生錯誤。因此,應當報告作者獲得數據庫的范圍。描述研究不同階段的數據清理方法應包括用于篩選錯誤和缺失數據的方法,包括范圍檢查,重復記錄檢查和重復測量的處理[47,48]。要報告的其他方法包括數據分布頻率的評價、數據交叉表、圖形探索或異常值檢測所使用的統計方法[49]。可提供關于錯誤診斷的其它細節,包括合理性的定義和分析中的錯誤處理。清晰透明地描述數據清洗方法至關重要,因為方法的選擇可影響研究結果,研究的可重復性和研究結果的再現[50]。
RECORD 12.3:對于鏈接研究,我們建議報告成功鏈接的估計率,確定性或概率性鏈接的使用,用于鏈接的變量質量和類型,以及所有鏈接驗證的結果。如果數據庫之間的記錄鏈接是針對特定研究的,則應報告鏈接方法及其質量評價,包括由誰實施鏈接操作的信息。如果適用,應提供以下細節:區組變量、鏈接變量的完整性、關聯規則、閾值和人工核查等[44]。如在研究開始前已實施鏈接(如,前期研究或通用的鏈接),或者由外部提供者(如,數據鏈接中心)實施數據鏈接,那么就需要通過參考文獻描述數據資源和鏈接方法。
描述數據鏈接方法并評估其成功率是至關重要的,可允許讀者評估任何鏈接錯誤和有關偏倚產生的影響[51]。具體地講,讀者應知道使用的鏈接類型是確定性的還是概率性的,以便確定鏈接是否可能受到錯誤匹配或缺失匹配的影響。當不同數據源之間存在唯一標識時,可使用確定性鏈接。無法獲得這種標識時,描述應用的記錄鏈接規則(或統計鏈接主鍵)便十分重要。相對而言,概率鏈接會使用多個標識,有時這些標識具有不同的權重,并匹配高于特定閾值。可能也會用到混合方法。例如,一些記錄使用確定性鏈接,當無法獲得唯一標識時則可應用概率鏈接。當鏈接錯誤的概率(如,錯誤匹配和缺失匹配)與結局變量存在關聯時,會發生鏈接偏倚。例如,鏈接率會因患者特征,如年齡、性別和健康狀況而變化。即使鏈接過程中很小的錯誤也可能引入偏倚,從而導致研究關聯被高估或低估[52]。作者應使用標準方法報告鏈接錯誤,包括與金標準或參考數據集進行比較,靈敏度分析,以及鏈接和未鏈接數據特性的比較[53]。報告鏈接錯誤允許讀者確定鏈接的質量以及與鏈接錯誤有關的偏倚可能性。
2.4 結果(研究對象)
RECORD 13.1:詳細描述研究納入的個體選擇方法(如,研究人群選擇),包括基于數據質量,數據可及性和鏈接等方面的篩選。可使用文本描述或研究流程圖描述納入個體選擇方法。
實例 以下所給出良好報告示例:1998 年到 2007 年間,我們在 SEER(監測,流行病學和最終結果)中根據診斷一處或多處肺癌和支氣管癌病例,識別出 161 401 個醫療保險受益人。在這些患者中,我們總共識別出 163 379 例單獨診斷事件性肺癌。(一些患者在研究期間間隔超過一年有兩處原發性肺癌)。圖 1 顯示為最終隊列 46 544 例患者共 46 935 例 NSCLC(非小細胞肺癌)[54]的來源。(關于示例流程圖,請參見圖 5,可從)獲取。
解釋 作者應詳細描述由常規收集的衛生數據的原始數據獲得研究人群過程,因為記錄研究人群和數據庫人群之間的差異可使研究結果得到更好的應用(參見 RECORD 6.1)。使用常規數據源的研究者經常基于可用數據的質量等因素來限制其研究人群。如,研究者可將研究周期限制到已知數據質量可接受的時間范圍內,從而排除潛在參與者。研究可能會排除醫療實踐與電子病歷記錄不符的記錄,或者等到醫療實踐與病歷一致時再加入[38,55]。研究人群也會由于數據可獲得性而受到限制。如,在利用美國醫療保險數據庫的研究中,近期在健康組織注冊的受益人通常會因為記錄缺少臨床事件而被排除[54,56]。當使用適用性隨時間波動的數據源(如,保險數據庫)時,研究人員需要明確說明如何定義適用性,以及如何在其研究中管理適用性的更改。如果研究使用的是存在鏈接的常規數據,研究人群通常會減少或限制在那些可進行鏈接的個體中進行[57]。特別嚴格的隊列同樣會因為方法學的原因減少一些混雜來源。
因此,獲得最終研究人群的步驟、納入排除標準和隊列建立和分析過程中,不同階段研究參與者的納入和排除標準都應在正文中明確定義,可采用文字或使用合適的流程圖。研究人群可使用不同的編碼和/或算法(參見 RECORD 6.1)得到,并且隨著時間變化使用不同的編碼可能影響研究人群[58,59]。一些研究也使用幾種敏感/特異性的病例定義,這可能對隨后的分析產生影響。這些步驟的描述在評估研究結果的外部有效性及在某些情況下評估可能的選擇偏倚時至關重要。可報告敏感性分析以評估數據缺失和研究人群的代表性的潛在影響。提供關于從初始數據庫選擇研究人群的信息以便于研究的可重復。可對不同的研究人群進行輔助分析,并通過在線附錄進行報告。
2.5 討論(局限性)
RECORD 19.1:討論將不是為了回答特定問題而創建或收集的數據用于研究時的影響。包括對錯分偏倚、未測量混雜、缺失數據以及隨時間變化的適用性的討論,因這些影響是此類研究所固有的。
實例 以下文章描述使用管理數據庫有關的局限性:① “第三,這項研究是一個回顧性,基于索賠的分析。只有 PET(正電子發射斷層掃描)掃描支付的醫療保險可以在分析中檢測到。為最小化錯誤的索賠比例,所有分析僅限于兩者的醫療保險受益人醫療保險 A 部分和 B 部分覆蓋,不納入診斷前后 12 個月的注冊管理醫療或醫療保險 C。第四,SEER 登記的患者更可能是非白人,生活在相對不貧困的地區,住在城市地區,這可能限制了研究發現的外推性。第五,在研究期間,疾病階段是基于 SEER 數據在 4 個月內或直到第一次手術獲得。2004 年,數據 SEER 的收集更改為協作分期系統。我們不清楚結果與更新后的方法有何差異”[54]。② “盡管 SEER-Medicare 數據有一些優勢,包括一個比較大的樣本量,對美國人口的普及性,及詳細的處方信息。我們的研究受限于缺乏關于膽固醇,甘油三酯和葡萄糖水平等提示人體的代謝紊亂程度的實驗室數據……因此基于實驗室的數據可以通過代謝疾病嚴重程度減少殘留混雜。我們還缺乏更多關于癌癥進展的粒度數據,這可能會影響他汀類藥物使用和死亡之間的關聯,因為他汀類藥物治療在預期生存時間較短的患者停止使用”[60]。
解釋 常規衛生數據通常不是針對特定的事先設計的研究問題而收集的,其數據收集的原因可能不同。許多潛在的偏倚,不但包括觀察性研究有關的常見的偏倚來源,也包括很多使用常規收集數據的觀察性研究特有的偏倚,這些都會影響研究結論。作者應將以下內容作為潛在的偏倚來源進行討論:① 識別研究人群、結局、混雜因素或效應修飾因子的編碼或算法(錯分偏倚);② 缺失變量(未測量的混雜);③ 缺失數據;④ 隨時間變化的適用性。
常規數據收集的原則可能影響研究問題所使用數據的質量和適用性。例如,用于回顧性分析的注冊管理機構可能比收集其他類型的常規數據的組織實施更好的質量控制。同樣,一些行政數據受到嚴格的質量控制,而其他數據則不然。管理數據尤其會出現不實或機會性編碼的錯誤。例如,當醫院報銷基于病例組成的復雜性時,醫院可能會通過自由地向患者記錄中添加復雜疾病編碼從而最大限度地報銷償付[61]。此外,編碼策略的變化可能影響數據的有效性或一致性。例如,提供商計費激勵碼的引入可以改變隨時間使用代碼的可能性[62,63]。由于患者的污名或提供者的懲罰,可避免其他代碼[64]。此外,代碼分類系統(如,從國際疾病分類 ICD-9 到 ICD-10)的版本的變化可能改變使用編碼數據確認的有效性[65,66]。醫院和人群間臨床實踐的差異可能會導致實驗室檢查在特定的地點進行,這可能會影響診斷算法。如果存在任何這些潛在錯分偏倚來源,則應將其作為研究局限性進行討論。
未測量的混雜被定義為在研究中未包含的與混雜相關的變量,導致殘余混雜偏倚[67]。雖然它是所有觀察性研究中偏倚的潛在來源,但在使用常規收集的數據的研究中尤為突出。分析可能需要在設計數據庫或收集數據時未考慮的變量。現已提出多種方法來解決這種潛在的偏倚來源[68-71],包括傾向得分。然而,傾向評分分析,類似標準回歸分析和匹配,只能保證研究參與者對數據中獲得的變量上平衡。特定類型的未測量混雜為指示混雜,這通常是在使用常規收集數據進行(藥物)治療有效性和安全性評價時遇到。那些接受這種(藥物)治療的患者相比不使用治療的患者,預后更好或更差,但有關預后或疾病嚴重程度的信息無法從數據中獲得[72]。作者應討論這類問題,如果存在,應報告處理這類問題所采用的方法。
缺失數據是所有觀察性研究都會遇到的問題,并已在 STROBE 解釋性文章[10]的框 6 中提到。缺失數據是常規收集數據的一個特殊問題,因為研究人員無法控制數據收集[73]。如果在定義研究隊列需要用到的變量上有缺失數據或用于鏈接識別變量有缺失從而使記錄無法鏈接,特別是非隨機缺失。作者應描述可能會造成未測量混雜的缺失變量,變量缺失的原因,對研究結果的影響,以及調整缺失變量所用方法。如,吸煙狀態對克羅恩病的嚴重程度具有強烈影響,并且與該疾病的結局相關。然而,衛生管理數據中很少包含吸煙狀況的數據。在評估社會經濟地位與克羅恩病結局之間關系的研究中,吸煙狀態被討論為潛在的未測量的混雜因素[74]。通常,僅在使用常規衛生數據開始研究之后才發現缺失的數據/缺失的變量,使得研究者有必要偏離其原始研究方案。不管何種原因造成偏離,都應報告偏離方案的細節。應討論偏離的原因及其對研究和結論的影響。
另一個重要的潛在局限性是由于數據庫人群、研究人群或兩者的組成隨時間的變化而導致的編碼實踐或合格標準的變化。數據庫人群的定義可在多種情況下改變,例如,如果注冊實踐停止與數據庫的協作,改變計算機軟件或在數據庫變化時改變注冊的標準,如注冊表。如果由于就業,住所或醫療服務提供者的變化,個體的適用性會隨時間變化,行政數據來源(例如保險數據庫)的研究人群可能會改變。記錄編碼的改變(不實或如前所述的編碼系統改變)可能會改變研究人群[63,75,76]。當討論局限性時,作者應該解釋如何在分析中處理變更的適用性,以便讀者可評估偏倚的可能性。正如 STROBE 聲明提到的,討論需要報告所有潛在偏倚的方向和大小以及處理方法。
2.6 其他信息
RECORD 22.1:作者需提供如何獲得所有補充信息,如研究方案、原始數據或程序編碼的方法。
實例 ① Taljaard 及其同事[77]的文章代表了使用加拿大社區健康調查研究完整的研究方案。② 在他們的文章中,Guttmann 和同事根據研究方案的要求:“數據共享:技術附錄,數據集創建計劃/方案和統計編碼可從相應的作者(電子郵件地址)獲取”[78]。
解釋 我們強烈推薦提供詳細的研究方法和結果的信息。如果可能,我們建議提前或同時發表研究方案,原始數據結果和程序代碼(如允許)。此信息對同行評審者和讀者評估研究結果的有效性十分有用。研究者有很多可用的途徑公開發表這些數據。這些途徑包括在線期刊補充材料、個人網站、機構網站、基于科學的社交媒體網站(如,ResearchGate.net 和 Academia.edu)、數據存儲庫(如,Dryad 或 Figshare)或政府開放數據網站[79]。我們發現,一些研究組織、公司、教育機構或法律可能禁止或限制此類信息的免費提供。雖然對此知識產權的所有權和使用的討論超出了 RECORD 指南的范圍,這些數據的發布通常要符合研究者研究機構法律和倫理指南以及期刊編輯的指南。該信息對于可能希望訪問這些數據以復制,再現或擴展正文描述的研究的其他研究人員也是有用的。無論這些可用的補充信息的格式或程度如何,我們建議在正文中明確說明這些信息的位置。
3 討論
RECORD 規范針對于使用常規收集的衛生數據進行的觀察性研究,是 STROBE 聲明的補充而非替代。RECORD 規范為作者、期刊編輯、同行評議者和其他利益相關者制定,旨在加強使用常規收集的衛生數據進行研究的報告的透明度和完整性。該清單可供使用此類數據的任何研究人員使用,我們鼓勵向所有相關方廣泛傳播。我們期望期刊對 RECORD 規范的認可和應用,以改善使用常規收集衛生數據實施的研究報告的透明性。
3.1 局限性
STROBE 聲明和 RECORD 規范僅用于觀察性研究。然而,常規收集的衛生數據有時也用于其他研究設計的研究,例如用于衛生系統評價的群組隨機試驗。另外,隨機試驗來源的數據鏈接與管理數據可用于結局的長期隨訪,以及關聯研究并不屬于觀察性研究。隨著領域的發展,我們期望使用類似的方法將 RECORD 規范擴展到其他研究設計。
盡管 RECORD 規范代表反映利益相關者的興趣和優先事項,但使用常規收集的衛生數據進行研究的方法正在迅速變化,并且此類研究的數據類型的可用性正在擴大。例如,移動健康應用程序(mHealth 應用程序)正廣泛用于智能手機和可穿戴技術。雖然目前僅有有限的研究使用這類數據資源,但我們預計在不久的將來這些數據的使用將快速增長,并將創建管理這種資源的新方法。此外,工作委員會關注于衛生數據,而非健康相關研究所使用到的所有數據資源(如,環境數據和經濟數據等)。因此,RECORD 規范可能不能很好反映將來可能會變為重要的內容,并且在某些方面可能需要修訂。
在這些規范制定的過程中已認真考慮利益相關者的廣泛代表性。我們通過開放電話和使用各種渠道有針對性地邀請招募利益相關者[16]。然而,利益相關方代表主要來自使用常規收集的衛生數據進行研究的地區,只有幾名代表來自發展中國家和非英語國家。我們認為利益相關方代表了目前該領域的研究者和使用者的普遍認識。雖然通過調查和利益相關者團體獲得大量反饋,但鑒于可行性考慮,該聲明是由 19 名成員組成的較小的工作委員會制定的,正如已有研究[17]中建議的那樣。在未來,技術和社交媒體可能允許更大的團體更積極地參與工作委員會會議。
3.2 未來方向和社區參與
隨著常規收集的健康數據的可用性擴大,我們希望來自當前無法獲得這些數據的地區的研究人員能更多地參與其中。通過 recordstatement.org 網站和留言板,我們期望持續對 RECORD 規范相關方面進行評論和討論,這可能促成未來的正式修訂。通過這個在線社區,RECORD 將成為一個靈活的文檔,以適應不同領域的變化。
公開發表和通過期刊推薦對改善研究報告質量來說還不足夠[80]。研究者、期刊和同行評審員實施 RECORD 規范的方式是其重要的可測量影響[81]。因此,在線留言板包含對其應用的討論論壇。我們還鼓勵評價 RECORD 對該領域報告質量影響的評價,從而可使該規范提供可衡量的益處。
4 結論
RECORD 規范是 STROBE 聲明在使用常規收集數據實施的觀察性研究中的擴展。根據研究和發表的意見,我們以清單的形式編寫了規范以及配套的解釋性文件。已有研究證明報告指南改進了研究報告質量,從而使讀者能夠了解結論的優勢、局限性和準確性[12,82-84]。同時,我們期望 RECORD 規范將隨著該領域研究方法的發展而改變,該指南將在未來幾年內有助于促進對研究進行充分報告。隨著作者、期刊編輯和同行評議人員的使用,我們期望 RECORD 規范可切實改善使用常規收集衛生數據實施的研究的報告的透明性、可重復性和完整性。
支持信息 參與本調查的利益相關者名單(見原文表 S1)。
RECORD 規范的制定得到加拿大衛生研究所(基金編號:130512)、瑞典國家科學基金會(基金編號:IZ32Z0_147388/1)和奧胡斯大學臨床流行病學系的資助。資助者并未參與研究設計、數據收集和分析、撰寫和發表過程。該工作由東安大略兒童醫院研究倫理委員會批準。RECORD 規范的全體作者感謝在有關所需納入清單內容調查過程中所有參與的利益相關者(見原文表 S1)。同時也十分感謝 STROBE 聲明發起組織成員在 RECORD 制定過程中給予的幫助。感謝 Pauline Quach 和 Danielle Birman 所作的協調工作,以及 record-statement.org 網站設計和管理者 Andrew Perlmutar。感謝所有參與推動 RECORD 規范發展的利益相關者。
RECORD 工作委員會成員名單 Douglas Altman(Centre for Statistics in Medicine,Oxford University),Nicholas de Klerk(University of Western Australia),Lars G. Hemkens(University Hospital Basel),David Henry(University of Toronto and Institute for Clinical Evaluative Sciences,Toronto),Jean-Marie Januel(University of Lausanne),Marie-Annick Le Pogam(Institute of Social and Preventive Medicine,University Hospital of Lausanne),Douglas Manuel(Ottawa Hospital Research Institute,University of Ottawa),Kirsten Patrick(editor,Canadian Medical Association Journal[CMAJ]),Pablo Perel(London School of Hygiene and Tropical Medicine),Patrick S. Romano(University of California,Davis,co-editor-in-chief,Health Services Research),Peter Tugwell(University of Ottawa,editor-in-chief,Journal of Clinical Epidemiology),Joan Warren(National Institutes of Health/National Cancer Institute),Wim Weber(European editor,BMJ),Margaret Winker(formerly senior research editor,PLOS Medicine; current secretary,World Association of Medical Editors)
1 前言
醫療衛生實踐中產生數據的可用性在日益提高,通過對疾病發病率和結局的監測,改變了研究范疇。常規收集衛生數據的定義為:不是針對開展研究前即確定的研究問題而收集的數據[1]。這些數據來源包括廣泛的研究資源供應(如疾病登記)、臨床管理(如初級保健數據庫)、衛生系統規劃(如衛生管理數據)、臨床護理文件(如電子健康記錄數據倉庫)或流行病學監測(如癌癥登記和公共衛生報告數據)。在多種醫療保健機構和地理位置背景下產生的這些數據為臨床醫學、衛生服務規劃和公共衛生決策提供了創新、高效及成本-效益較高的研究可能[2]。國際范圍內,政府和資助機構優先使用常規收集的健康數據作為改善患者護理、改革健康研究和提高衛生保健效率的工具[3]。
雖然擴展的數據可用性為回答亟需解決的研究問題提供了重要機會,但同時也給研究實施和評價及結果應用帶來挑戰。常規收集衛生數據來源的多樣化及其數據結構的快速擴展給如何確定各個數據源的優勢、局限和偏倚帶來了挑戰。常規收集數據的研究報告存在的不完整或不充分的特點可能會加重這些挑戰。對基于使用常規數據源的研究進行系統分析發現諸多報告問題[4]:暴露和結局編碼的有關信息報告不完整,不同數據源的鏈接率的細節存在報告不足或缺失等。已有系統評價的結果提示對常規數據來源數據進行驗證的研究報告質量不高[5,6],這可能掩蓋偏倚,妨礙開展 Meta 分析,導致錯誤結論。

為改善報告質量,現已針對一系列研究設計和內容制定了許多報告指南[8,9]。加強觀察性流行病學研究報告的聲明(Strengthening the reporting of observational studies in epidemiology statement,STROBE)是為提高觀察性研究報告的透明度而制定的[10,11],并被主流醫學期刊廣泛接受和認可。已有研究發現在文章編輯過程中使用 STROBE 確實提高了研究報告的質量[12,13]。大多數使用常規收集數據開展的研究屬于觀察性研究,因此,STROBE 聲明同樣適用。盡管 STROBE 聲明可應用于所有觀察性研究,但使用常規收集數據開展研究在報告中涉及的特有問題尚未提及。2012 年,關注使用常規收集衛生數據開展研究的國際科學家小組和 STROBE 組織代表在倫敦的初級保健數據庫研討會上會面,對 STROBE 聲明在常規收集衛生數據研究中的應用進行了討論[14,15]。會議認識到 STROBE 聲明具體到使用此類數據開展研究報告時產生的差距,并對 STROBE 聲明進行擴展達成共識。因此,依據該組織國際合作的流程發起倡議,起草使用常規收集衛生數據開展觀察性研究的報告規范(the report of studies conducted using observational routinely collected Data,RECORD)作為 STROBE 的擴展,旨在探索和提出有關使用常規收集衛生數據開展研究的特定報告事項。RECORD 規范涉及了 100 余位國際利益相關者,包括研究人員、期刊編輯和數據使用者,即使用常規數據的研究結果為決策提供信息的利益相關者。制定 RECORD 規范的方法另有詳述[16],即根據報告指南的既定方法而制定[17]。簡言之,對利益相關者進行兩輪調查,確定優先考慮納入 RECORD 規范中的條目。隨后工作委員會人員會面,撰寫了該聲明的文檔。利益相關人員審核聲明并提出反饋意見。最終版的清單及其解釋性文件由指導委員會撰寫,并經工作委員會審查和批準。STROBE 指導委員會的成員均參與了 RECORD 規范的制定。
與 STROBE 方法一致,RECORD 規范并非以推薦開展研究的方法為目的,而是為完善其報告,以確保讀者、同行評審、期刊編輯和其他研究消費者能夠評估研究的內部和外部真實性。通過改善使用日常收集衛生數據的研究報告質量,努力減少不清楚的研究報告并且遵守科學研究過程的原則:創新、透明和可重復[18]。
2 RECORD 清單及其解讀
完整的 RECORD 清單見表 1。由于 RECORD 清單是現有 STORBE 條目的擴展,因此將其補充在相應的 STROBE 條目旁。我們建議作者充分闡明清單中的每個條目,但不需要嚴格按照清單順序進行描述。我們將 RECORD 清單條目的詳細解釋作為正文中的一部分提供。當不需要針對使用常規收集衛生數據的研究在 STROBE之外額外增加清單條目時,需要的解釋參見 STROBE 相應條目。

2.1 題目和摘要
RECORD 1.1:在題目或摘要中明確使用的數據類型。可能的話,應包含所使用數據庫的名稱。RECORD 1.2:如需要,應在題目或摘要中報告研究發生的地理位置和時間窗。RECORD 1.3:如果研究實施了數據庫的鏈接,應在題目或摘要中給予清晰闡述。
實例 ① “2010 年結腸鏡檢查后穿孔和出血:基于法國綜合健康保險數據(SNIIRAM)”[19]。② “荷蘭醫院標準化死亡率(HSMR)方法和心臟外科手術:使用醫院管理數據為基準的國家隊列與臨床數據庫比較”[20]。
解釋 由于缺乏檢索使用常規采集衛生數據這類研究的相關醫學主題詞(Medical Subject Heading,MeSH),所以如何快速檢索此類研究十分重要。然而,考慮到各種各樣的數據類型,簡單地說使用“常規數據”是不夠的。應在題目和/或摘要中明確常規數據的類型。數據類型包括健康管理數據、其他管理數據(如,保險、出生/死亡登記和就業)、疾病登記、初級保健數據庫、電子健康病歷數據以及人口登記。命名所使用的數據庫固然重要,但不能替代在題目或摘要中提供數據源類型的重要性。
STROBE 清單已包括涉及地理區域和時間框架的項目。我們建議使用 RECORD 清單的論文也在題目或摘要部分將其作為必需條目。顯然,區域和時間框架的詳細程度需符合字數限制并考慮保密問題。然而,對研究區域的報告最低要求應使用定義研究人群(如國家、州、省和地區)的最高地理級別的名稱。
此外,應在題目或摘要中報告數據庫之間的鏈接(如果使用到)。例如,可接受的措辭包括“使用多個鏈接的健康管理數據庫”或“將某數據庫(名稱)與另一數據庫(名稱)鏈接”。在題目或摘要中使用“鏈接”一詞可提供足夠的信息,關于鏈接方法的具體細節應在正文的方法學部分加以闡述。
2.2 前言
除 STROBE 中的條目外,不需在 RECORD 規范中添加特定條目。STROBE 聲明建議在“前言”部分說明“具體目標,包括任何預先設定的具體假設”。闡明具體的研究目標對于任何觀察性研究的復制和翻譯都是必要的。對于使用常規收集數據的研究,作者應進一步澄清分析目的是出于數據探索并發現新關系(如數據挖掘或旨在產生假說的研究[21,22])的目的,還是為了驗證一個或更多的假設[23]。作者也應該指出他們的假設是在數據分析之前還是之后形成的。同時,應清楚地說明是否有研究方案,如何獲得,以及是否在可公開獲得的研究注冊中心注冊了該研究。因為使用常規收集數據開展研究的方法學優勢和局限性可能還是有爭議的,所以清楚地描述研究目標是必要的[23,24]。簡單地將研究標記為描述性,而沒有澄清其目的是產生還是檢驗假設是不充分的。
2.3 方法
2.3.1 場景 RECORD沒有額外擴展STROBE關于“描述數據收集的機構,地點和時間范圍,包括征集研究對象、暴露、隨訪和數據收集的時間范圍”的條目要求。應注意,除在題目和/或摘要中已提及的數據庫類型以外,應提供相關信息以便讀者理解數據庫的內容及其真實性和收集數據的原始原因。例如,記錄電子病歷的人可能是專科醫師或初級保健醫師,也可能是急診科醫生或住院醫師,也可能是高年資醫師或醫學生。他們可能接受過專門培訓,以確保數據記錄的完整和可重復性,也可能沒有接受過培訓[25]。為讓讀者判斷是否可以將研究發現應用到源人群中,作者還應該描述數據庫人群與源人群的關系,包括選擇標準。
2.3.2 研究對象 RECORD 6.1:應詳細列出研究人群選擇方法(如用于識別研究對象的編碼或算法)。如不可行,應給予解釋。RECORD 6.2:任何針對選擇研究人群編碼或算法進行的驗證研究均應標引參考文獻。如果為本研究實施的驗證沒有在其他地方發表,需要提供驗證方法的細節和結果。RECORD 6.3:如果研究涉及數據庫鏈接,考慮使用流程圖或其他圖表展示以說明數據鏈接過程,包括每一步驟中能實現數據鏈接的個體人數。
實例 RECORD 6.1:這部分報告較好的文章內容如下:OCCC(Ontario Crohn's 和 Colitis Cohort)使用驗證的算法基于年齡組來識別的 IBD 患者。這里的每個算法在安大略省應用于特定年齡組,多個隊列,醫療實踐類型和區域并已驗證。對于 18 歲以下的兒童,根據他們是否進行結腸鏡檢查或乙狀結腸鏡檢查來定義。如果他們進行了內鏡檢查,定義為在 3 年內需要 4 個門診醫師聯系或 2 次因 IBD 住院。如他們未經內鏡檢查,則需要 7 個門診醫生聯系或在 3 年內 3 次因 IBD 住院……該算法正確識別 IBD 兒童所具有靈敏度為……[26]。本文參考了兩個先前的算法驗證研究來識別不同年齡的炎性腸病患者,包括診斷準確性的測量。
RECORD 6.2:① Ducharme 和他的同事詳細描述了識別兒童腸套疊的編碼驗證過程,然后使用已驗證的編碼描述流行病學。驗證研究中涉及的列于文章的圖 2[27]。② Benchimol 和同事沒有進行驗證工作,然而,參考了先前進行的驗證工作,詳細描述了識別編碼算法的診斷準確度信息[26]。
RECORD 6.3:RECORD 網站上的示例圖 2、圖 3 和圖 4 展示了一些可能的方式以說明鏈接過程:圖 2 說明鏈接過程的韋恩圖(在 Herrett 等人的許可下復制[28],見網站:)。圖 3 混合流程圖和韋恩圖說明鏈接過程(轉載得到 van Herk-Sukel 等人的許可[29],見網站:)。圖 4 與參與者流程圖結合的鏈接圖(在 Fosb?l 等人許可下[30],見網站:)。
解釋 RECORD 6.1 和 6.2:報告用于獲得研究人群的識別編碼/算法的真實性對于使用常規收集衛生數據開展的觀察性研究報告的透明性是必要的。此外,報告編碼/算法可讓其他研究者實施外部或內部驗證。
應明確和清晰地闡述用于識別研究對象的方法,包括是否基于唯一編碼,算法(記錄或編碼的組合),數據庫之間的鏈接,或自由文本字段。
正如許多其他流行病學研究一樣,在使用常規衛生數據開展的研究中,錯分偏倚的風險可能威脅研究結果的真實性[31]。雖然在使用大樣本人群數據庫的研究中存在放大錯分的風險,但這些研究提供了研究罕見疾病或非常見疾病的機會[32]。作為使用常規收集衛生數據研究的必要部分,識別方法的驗證日益受到重視,尤其是在使用以計費為目的收集的管理數據開展研究時使用的疾病編碼[33]。外部驗證研究通常需要將用于識別研究人群的編碼或算法與參考標準進行比較。最常用的參考標準是醫療記錄,患者或醫生的調查,以及臨床登記[5,34]。此外,數據庫的內部驗證可以通過比較單個數據庫內交叉出現的數據源[35]。準確性的測量類似于診斷試驗研究的報告,包括靈敏度、特異度、陽性和陰性預測值,或 kappa 系數[5,34]。
因此,對于使用常規收集衛生數據開展的觀察性研究,我們建議在正文方法部分中提供詳細的識別編碼/算法的外部或內部驗證信息。如果之前已開展過一項或多項驗證研究,應標引參考文獻。如未進行驗證研究,則應明確說明。此外,應就識別方法的準確性(使用常見的診斷準確性術語)及它們在亞組人群中應用的功能進行簡要討論。如果作為觀察性研究的一部分而開展的驗證研究,我們建議作者使用已發表的驗證研究的報告指南[5]。重要的是要說明驗證是否基于不同于本研究選擇的數據來源或數據庫人群開展的,因為編碼可能在不同的人群或數據庫中發揮不同的作用[36]。另外,如果用于比較的參考標準存在已知問題,例如不完整或不準確,則應當報告這些問題并討論其局限性。作者應討論用于識別研究人群和結果所使用的選擇編碼/算法的含義、錯分風險,及其對研究結果的潛在影響。對使用不同于當前研究人群的其他人群進行驗證的意義進行討論則更為重要。
RECORD 6.3:流程圖或其他圖形展示可表達鏈接過程的相關信息,并可以簡化冗長的描述。這樣的圖示可提供關鍵數據,如實現鏈接和未鏈接的個體所占比例和特征信息。讀者據此可確定獲得成功鏈接的數據庫人群所占比例及研究人群的代表性。鏈接流程圖可是獨立的圖(如,韋恩圖或流程圖),也可結合 STROBE 建議參與者流程圖。圖表展示可以有多種形式,我們不再給特定推薦。
2.3.3 變量 RECORD 7.1:提供將暴露、結局、混雜因素和效應修飾因子進行分類的編碼和算法的完整列表。如不能報告這些內容,需給予解釋。
實例 ① Hardelid 和同事在他們的補充數據 2 的 S1 表中提供了所有編碼[37]。② Murray 及其同事在其附錄 S1 中提供了有風險組的所有編碼[38]。
解釋 正如用于識別研究群體的編碼/算法一樣,用于劃分暴露、結局、混雜因子和效應修飾因子的編碼/算法也會為研究帶來潛在錯分偏倚。為允許重復研究,對其進行評價并與其他研究進行比較,我們建議在正文、在線附錄和/或外部網站上提供用于研究實施的所有診斷、程序、藥物或其他編碼的列表。對于通過調查方式收集的常規數據,針對研究對象的調查問題的措辭要清晰明確。考慮到所有研究(包括使用常規衛生數據開展的研究)均存在錯分偏倚風險[31],作者應提供足夠的細節,使研究具有可重復性,并使偏倚風險易于識別。如可在文章正文中描述驗證研究,或提供其他已出版或在線材料的參考文獻。如上所述,作者應說明驗證研究所使用的人群是否不同于當前研究所使用的人群來源或數據庫。
我們認識到,在某些情況下,研究人員可能會避免在發表刊物中提供所使用的編碼列表和算法,因該信息被視為專利或受版權、知識產權或其他法律的保護。例如,一些共病調整指數是由營利性公司創建,并銷售給學術研究領域的研究者使用[39,40]。在這些情況下,作者可能依賴數據提供者或受信任的第三方來收集、清洗和/或鏈接數據。作者應針對他們無法提供編碼列表或其他用于識別研究個體或疾病信息的情況加以詳細說明,并盡量提供這些列表所有權機構的聯系信息。此外,作者應該闡明無法提供這些信息會如何影響其他研究者對研究的重復和評估。理想情況是,第三方應提供詳細信息說明如何收集、清洗或鏈接數據。數據提供者和使用者之間的良好溝通可使雙方獲益。
一些學者認為編碼列表代表了研究人員的知識產權。公開發表這些列表并允許其他研究人員將其應用到自己的研究中,可能會影響作者創建編碼列表的知識產權和信用。我們認為這種觀點不符合透明的科學標準,即允許研究的可重復。因此,除受法律或合同保護的編碼列表,我們建議公開全部編碼列表。
考慮到許多期刊的字數和頁數限制以及編碼列表/算法的長度,采用紙質期刊發表編碼列表可行性較低。因而,可使用文本、表格、雜志網頁版將詳細信息作為附錄給予報告,也可由作者或其他個人永久在線存儲,或者存放在第三方數據存儲庫(如,Dryad 或 Figshare)中。文章的正文和參考文獻部分應提高如何獲得編碼列表的詳細信息。如 ClinicalCodes.org 的編碼倉庫承諾公開基于健康數據開展研究中所使用的編碼文檔并透明化[41]。如果將編碼列表作為在線補充發表在期刊網站或作者提供的外部網站上,則應在期刊文章中公開鏈接。在雜志網站或 PubMed Central()上發表編碼列表,會增加獲得補充資料的可能性(只要雜志在發行)。如果在外部私人或機構網站上發表是唯一選擇,建議至少在雜志文章發表后 10 年內,均可持續獲得這些編碼列表。如果更改了 URL 地址,則需要從原有網址自動的重新定位。這些措施將有助于未來的文章讀者能夠獲得完整編碼列表。
在文章中(或以在線附件形式)除提供編碼列表,作者還應提供分析指出研究所使用的編碼/算法是否會引入偏倚。此類偏倚可能包括錯分偏倚、確認偏倚以及缺失數據所致的偏倚。如果基于不同代碼/算法集實施敏感性分析,則應對其進行描述和評估。潛在偏倚的討論可結合 RECORD 和 STROBE 清單的其他部分,如研究對象選擇和編碼驗證。
2.3.4 統計學方法 數據獲得和清洗:RECORD 12.1:作者應描述研究者從數據庫人群中獲取了多少來建立研究人群。RECORD 12.2:作者應提供研究所使用的數據清洗方法的有關信息。RECORD 12.3:說明研究是否在兩個及以上數據庫之間,使用了包含個體水平、機構水平或其他數據進行數據鏈接。應提供鏈接的方法以及對其進行質量評價的方法。
實例 RECORD 12.1:以下文章描述對英國通用實踐研究數據庫(GPRD)子集的獲取:① “通過醫學研究委員會許可協議,GPRD 將其數據集限制為通過其資助的項目的 100 000 名個體。該限制規定了使用病例對照而不是隊列設計,以確保我們為每個特定癥狀確定足夠的癌癥病例……”[42]。② “來自通用實踐研究數據庫的隨機樣本……經醫學研究委員會學術機構許可獲取[43]”。
RECORD 12.2:以下內容是數據清洗方法的描述示例[44]:用于鏈接的公共標識符的完整性在數據集和不同時間是不同的(近年來標識符更完整)。對于 LabBase2,標識符的完整性有所不同(圖 2)。對于 PICANet(兒科重癥監護網),出生日期和醫院數量 100% 完整,大多數其他標識符>98% 完整,除了 NHS(國家衛生服務)號(85% 完整)。對于這兩個數據集,進行數據清洗和數據準備:NHS 或醫院編號例如“未知”或“9999999999”設置為空;通用名稱(例如,“寶貝”、“雙胞胎 1”、“嬰兒”)設置為空;為多個姓創建了多個變量和名字;開始“ZZ”(表示沒有英國郵政編碼)的郵政編碼設置為空。
RECORD 12.3:下面從文章摘錄的是有關數據鏈接的級別,所使用的鏈接技術和方法,以及用于評估鏈接質量的方法的良好報告示例:① “我們將活產和胎兒死亡證明鏈接到事件的時間鏈中,排除人工流產和異位妊娠,構成了個體女性的生殖經歷”[45]。② 兩篇文章包含了對研究特定鏈接的詳細描述報告[44,45]。在 Harron 及其同事[44]的文章中,有詳細的解釋提供了匹配過程的圖形演示。另外,計算鏈接概率的方法描述如下:“計算匹配概率 P(M|協議模式)以估計聯合標識符集匹配的概率。這避免了標識符之間的獨立性的假設。概率被導出為鏈接數除以每個協議模式對的總數(基于在訓練數據集中識別的可能鏈路)。例如,如果有 378 個比較對出生日期和 Soundex 一致,但性別不一致,其中 312 個是可能的鏈接,協議模式的匹配概率[1,1,0]為 312/378=0.825”[44]。Adams 和同事的文章也提供了解釋鏈接的詳細過程:“確定性鏈接包括 I 期,其需要六個處理步驟,在這六個處理步驟期間形成鏈并將單獨的(先前未鏈接的)記錄添加到鏈中。接下來是階段 n,其需要多次通過文件以組合屬于同一母親的鏈”[45]。③ 相比之下,如果一項研究涉及以前的鏈接數據,則參考以前的文章即可,如:“兩個數據庫的記錄基于出生日期都與市政登記處聯系在一起,性別和郵政編碼,并隨后相互鏈接。鏈接由荷蘭統計局執行,并在以前的出版物中描述”[20]。④ 以下是良好報告鏈接和未鏈接個人特征的例子:“根據本文的目的,不匹配的 ISC(住院統計數據收集)記錄將被稱為 ISC 殘差,不匹配的 MDC(助產師數據收集)記錄作為 MDC 殘差和鏈接對作為匹配記錄……選擇變量可用于兩個數據集,在三組間比較-ISC 殘差、MDC 殘差和匹配記錄”[46]。
解釋 RECORD 12.1 和 12.2:如果數據分析人員不熟悉隊列建立的微小差別或建立研究隊列的目標,可能發生錯誤。因此,應當報告作者獲得數據庫的范圍。描述研究不同階段的數據清理方法應包括用于篩選錯誤和缺失數據的方法,包括范圍檢查,重復記錄檢查和重復測量的處理[47,48]。要報告的其他方法包括數據分布頻率的評價、數據交叉表、圖形探索或異常值檢測所使用的統計方法[49]。可提供關于錯誤診斷的其它細節,包括合理性的定義和分析中的錯誤處理。清晰透明地描述數據清洗方法至關重要,因為方法的選擇可影響研究結果,研究的可重復性和研究結果的再現[50]。
RECORD 12.3:對于鏈接研究,我們建議報告成功鏈接的估計率,確定性或概率性鏈接的使用,用于鏈接的變量質量和類型,以及所有鏈接驗證的結果。如果數據庫之間的記錄鏈接是針對特定研究的,則應報告鏈接方法及其質量評價,包括由誰實施鏈接操作的信息。如果適用,應提供以下細節:區組變量、鏈接變量的完整性、關聯規則、閾值和人工核查等[44]。如在研究開始前已實施鏈接(如,前期研究或通用的鏈接),或者由外部提供者(如,數據鏈接中心)實施數據鏈接,那么就需要通過參考文獻描述數據資源和鏈接方法。
描述數據鏈接方法并評估其成功率是至關重要的,可允許讀者評估任何鏈接錯誤和有關偏倚產生的影響[51]。具體地講,讀者應知道使用的鏈接類型是確定性的還是概率性的,以便確定鏈接是否可能受到錯誤匹配或缺失匹配的影響。當不同數據源之間存在唯一標識時,可使用確定性鏈接。無法獲得這種標識時,描述應用的記錄鏈接規則(或統計鏈接主鍵)便十分重要。相對而言,概率鏈接會使用多個標識,有時這些標識具有不同的權重,并匹配高于特定閾值。可能也會用到混合方法。例如,一些記錄使用確定性鏈接,當無法獲得唯一標識時則可應用概率鏈接。當鏈接錯誤的概率(如,錯誤匹配和缺失匹配)與結局變量存在關聯時,會發生鏈接偏倚。例如,鏈接率會因患者特征,如年齡、性別和健康狀況而變化。即使鏈接過程中很小的錯誤也可能引入偏倚,從而導致研究關聯被高估或低估[52]。作者應使用標準方法報告鏈接錯誤,包括與金標準或參考數據集進行比較,靈敏度分析,以及鏈接和未鏈接數據特性的比較[53]。報告鏈接錯誤允許讀者確定鏈接的質量以及與鏈接錯誤有關的偏倚可能性。
2.4 結果(研究對象)
RECORD 13.1:詳細描述研究納入的個體選擇方法(如,研究人群選擇),包括基于數據質量,數據可及性和鏈接等方面的篩選。可使用文本描述或研究流程圖描述納入個體選擇方法。
實例 以下所給出良好報告示例:1998 年到 2007 年間,我們在 SEER(監測,流行病學和最終結果)中根據診斷一處或多處肺癌和支氣管癌病例,識別出 161 401 個醫療保險受益人。在這些患者中,我們總共識別出 163 379 例單獨診斷事件性肺癌。(一些患者在研究期間間隔超過一年有兩處原發性肺癌)。圖 1 顯示為最終隊列 46 544 例患者共 46 935 例 NSCLC(非小細胞肺癌)[54]的來源。(關于示例流程圖,請參見圖 5,可從)獲取。
解釋 作者應詳細描述由常規收集的衛生數據的原始數據獲得研究人群過程,因為記錄研究人群和數據庫人群之間的差異可使研究結果得到更好的應用(參見 RECORD 6.1)。使用常規數據源的研究者經常基于可用數據的質量等因素來限制其研究人群。如,研究者可將研究周期限制到已知數據質量可接受的時間范圍內,從而排除潛在參與者。研究可能會排除醫療實踐與電子病歷記錄不符的記錄,或者等到醫療實踐與病歷一致時再加入[38,55]。研究人群也會由于數據可獲得性而受到限制。如,在利用美國醫療保險數據庫的研究中,近期在健康組織注冊的受益人通常會因為記錄缺少臨床事件而被排除[54,56]。當使用適用性隨時間波動的數據源(如,保險數據庫)時,研究人員需要明確說明如何定義適用性,以及如何在其研究中管理適用性的更改。如果研究使用的是存在鏈接的常規數據,研究人群通常會減少或限制在那些可進行鏈接的個體中進行[57]。特別嚴格的隊列同樣會因為方法學的原因減少一些混雜來源。
因此,獲得最終研究人群的步驟、納入排除標準和隊列建立和分析過程中,不同階段研究參與者的納入和排除標準都應在正文中明確定義,可采用文字或使用合適的流程圖。研究人群可使用不同的編碼和/或算法(參見 RECORD 6.1)得到,并且隨著時間變化使用不同的編碼可能影響研究人群[58,59]。一些研究也使用幾種敏感/特異性的病例定義,這可能對隨后的分析產生影響。這些步驟的描述在評估研究結果的外部有效性及在某些情況下評估可能的選擇偏倚時至關重要。可報告敏感性分析以評估數據缺失和研究人群的代表性的潛在影響。提供關于從初始數據庫選擇研究人群的信息以便于研究的可重復。可對不同的研究人群進行輔助分析,并通過在線附錄進行報告。
2.5 討論(局限性)
RECORD 19.1:討論將不是為了回答特定問題而創建或收集的數據用于研究時的影響。包括對錯分偏倚、未測量混雜、缺失數據以及隨時間變化的適用性的討論,因這些影響是此類研究所固有的。
實例 以下文章描述使用管理數據庫有關的局限性:① “第三,這項研究是一個回顧性,基于索賠的分析。只有 PET(正電子發射斷層掃描)掃描支付的醫療保險可以在分析中檢測到。為最小化錯誤的索賠比例,所有分析僅限于兩者的醫療保險受益人醫療保險 A 部分和 B 部分覆蓋,不納入診斷前后 12 個月的注冊管理醫療或醫療保險 C。第四,SEER 登記的患者更可能是非白人,生活在相對不貧困的地區,住在城市地區,這可能限制了研究發現的外推性。第五,在研究期間,疾病階段是基于 SEER 數據在 4 個月內或直到第一次手術獲得。2004 年,數據 SEER 的收集更改為協作分期系統。我們不清楚結果與更新后的方法有何差異”[54]。② “盡管 SEER-Medicare 數據有一些優勢,包括一個比較大的樣本量,對美國人口的普及性,及詳細的處方信息。我們的研究受限于缺乏關于膽固醇,甘油三酯和葡萄糖水平等提示人體的代謝紊亂程度的實驗室數據……因此基于實驗室的數據可以通過代謝疾病嚴重程度減少殘留混雜。我們還缺乏更多關于癌癥進展的粒度數據,這可能會影響他汀類藥物使用和死亡之間的關聯,因為他汀類藥物治療在預期生存時間較短的患者停止使用”[60]。
解釋 常規衛生數據通常不是針對特定的事先設計的研究問題而收集的,其數據收集的原因可能不同。許多潛在的偏倚,不但包括觀察性研究有關的常見的偏倚來源,也包括很多使用常規收集數據的觀察性研究特有的偏倚,這些都會影響研究結論。作者應將以下內容作為潛在的偏倚來源進行討論:① 識別研究人群、結局、混雜因素或效應修飾因子的編碼或算法(錯分偏倚);② 缺失變量(未測量的混雜);③ 缺失數據;④ 隨時間變化的適用性。
常規數據收集的原則可能影響研究問題所使用數據的質量和適用性。例如,用于回顧性分析的注冊管理機構可能比收集其他類型的常規數據的組織實施更好的質量控制。同樣,一些行政數據受到嚴格的質量控制,而其他數據則不然。管理數據尤其會出現不實或機會性編碼的錯誤。例如,當醫院報銷基于病例組成的復雜性時,醫院可能會通過自由地向患者記錄中添加復雜疾病編碼從而最大限度地報銷償付[61]。此外,編碼策略的變化可能影響數據的有效性或一致性。例如,提供商計費激勵碼的引入可以改變隨時間使用代碼的可能性[62,63]。由于患者的污名或提供者的懲罰,可避免其他代碼[64]。此外,代碼分類系統(如,從國際疾病分類 ICD-9 到 ICD-10)的版本的變化可能改變使用編碼數據確認的有效性[65,66]。醫院和人群間臨床實踐的差異可能會導致實驗室檢查在特定的地點進行,這可能會影響診斷算法。如果存在任何這些潛在錯分偏倚來源,則應將其作為研究局限性進行討論。
未測量的混雜被定義為在研究中未包含的與混雜相關的變量,導致殘余混雜偏倚[67]。雖然它是所有觀察性研究中偏倚的潛在來源,但在使用常規收集的數據的研究中尤為突出。分析可能需要在設計數據庫或收集數據時未考慮的變量。現已提出多種方法來解決這種潛在的偏倚來源[68-71],包括傾向得分。然而,傾向評分分析,類似標準回歸分析和匹配,只能保證研究參與者對數據中獲得的變量上平衡。特定類型的未測量混雜為指示混雜,這通常是在使用常規收集數據進行(藥物)治療有效性和安全性評價時遇到。那些接受這種(藥物)治療的患者相比不使用治療的患者,預后更好或更差,但有關預后或疾病嚴重程度的信息無法從數據中獲得[72]。作者應討論這類問題,如果存在,應報告處理這類問題所采用的方法。
缺失數據是所有觀察性研究都會遇到的問題,并已在 STROBE 解釋性文章[10]的框 6 中提到。缺失數據是常規收集數據的一個特殊問題,因為研究人員無法控制數據收集[73]。如果在定義研究隊列需要用到的變量上有缺失數據或用于鏈接識別變量有缺失從而使記錄無法鏈接,特別是非隨機缺失。作者應描述可能會造成未測量混雜的缺失變量,變量缺失的原因,對研究結果的影響,以及調整缺失變量所用方法。如,吸煙狀態對克羅恩病的嚴重程度具有強烈影響,并且與該疾病的結局相關。然而,衛生管理數據中很少包含吸煙狀況的數據。在評估社會經濟地位與克羅恩病結局之間關系的研究中,吸煙狀態被討論為潛在的未測量的混雜因素[74]。通常,僅在使用常規衛生數據開始研究之后才發現缺失的數據/缺失的變量,使得研究者有必要偏離其原始研究方案。不管何種原因造成偏離,都應報告偏離方案的細節。應討論偏離的原因及其對研究和結論的影響。
另一個重要的潛在局限性是由于數據庫人群、研究人群或兩者的組成隨時間的變化而導致的編碼實踐或合格標準的變化。數據庫人群的定義可在多種情況下改變,例如,如果注冊實踐停止與數據庫的協作,改變計算機軟件或在數據庫變化時改變注冊的標準,如注冊表。如果由于就業,住所或醫療服務提供者的變化,個體的適用性會隨時間變化,行政數據來源(例如保險數據庫)的研究人群可能會改變。記錄編碼的改變(不實或如前所述的編碼系統改變)可能會改變研究人群[63,75,76]。當討論局限性時,作者應該解釋如何在分析中處理變更的適用性,以便讀者可評估偏倚的可能性。正如 STROBE 聲明提到的,討論需要報告所有潛在偏倚的方向和大小以及處理方法。
2.6 其他信息
RECORD 22.1:作者需提供如何獲得所有補充信息,如研究方案、原始數據或程序編碼的方法。
實例 ① Taljaard 及其同事[77]的文章代表了使用加拿大社區健康調查研究完整的研究方案。② 在他們的文章中,Guttmann 和同事根據研究方案的要求:“數據共享:技術附錄,數據集創建計劃/方案和統計編碼可從相應的作者(電子郵件地址)獲取”[78]。
解釋 我們強烈推薦提供詳細的研究方法和結果的信息。如果可能,我們建議提前或同時發表研究方案,原始數據結果和程序代碼(如允許)。此信息對同行評審者和讀者評估研究結果的有效性十分有用。研究者有很多可用的途徑公開發表這些數據。這些途徑包括在線期刊補充材料、個人網站、機構網站、基于科學的社交媒體網站(如,ResearchGate.net 和 Academia.edu)、數據存儲庫(如,Dryad 或 Figshare)或政府開放數據網站[79]。我們發現,一些研究組織、公司、教育機構或法律可能禁止或限制此類信息的免費提供。雖然對此知識產權的所有權和使用的討論超出了 RECORD 指南的范圍,這些數據的發布通常要符合研究者研究機構法律和倫理指南以及期刊編輯的指南。該信息對于可能希望訪問這些數據以復制,再現或擴展正文描述的研究的其他研究人員也是有用的。無論這些可用的補充信息的格式或程度如何,我們建議在正文中明確說明這些信息的位置。
3 討論
RECORD 規范針對于使用常規收集的衛生數據進行的觀察性研究,是 STROBE 聲明的補充而非替代。RECORD 規范為作者、期刊編輯、同行評議者和其他利益相關者制定,旨在加強使用常規收集的衛生數據進行研究的報告的透明度和完整性。該清單可供使用此類數據的任何研究人員使用,我們鼓勵向所有相關方廣泛傳播。我們期望期刊對 RECORD 規范的認可和應用,以改善使用常規收集衛生數據實施的研究報告的透明性。
3.1 局限性
STROBE 聲明和 RECORD 規范僅用于觀察性研究。然而,常規收集的衛生數據有時也用于其他研究設計的研究,例如用于衛生系統評價的群組隨機試驗。另外,隨機試驗來源的數據鏈接與管理數據可用于結局的長期隨訪,以及關聯研究并不屬于觀察性研究。隨著領域的發展,我們期望使用類似的方法將 RECORD 規范擴展到其他研究設計。
盡管 RECORD 規范代表反映利益相關者的興趣和優先事項,但使用常規收集的衛生數據進行研究的方法正在迅速變化,并且此類研究的數據類型的可用性正在擴大。例如,移動健康應用程序(mHealth 應用程序)正廣泛用于智能手機和可穿戴技術。雖然目前僅有有限的研究使用這類數據資源,但我們預計在不久的將來這些數據的使用將快速增長,并將創建管理這種資源的新方法。此外,工作委員會關注于衛生數據,而非健康相關研究所使用到的所有數據資源(如,環境數據和經濟數據等)。因此,RECORD 規范可能不能很好反映將來可能會變為重要的內容,并且在某些方面可能需要修訂。
在這些規范制定的過程中已認真考慮利益相關者的廣泛代表性。我們通過開放電話和使用各種渠道有針對性地邀請招募利益相關者[16]。然而,利益相關方代表主要來自使用常規收集的衛生數據進行研究的地區,只有幾名代表來自發展中國家和非英語國家。我們認為利益相關方代表了目前該領域的研究者和使用者的普遍認識。雖然通過調查和利益相關者團體獲得大量反饋,但鑒于可行性考慮,該聲明是由 19 名成員組成的較小的工作委員會制定的,正如已有研究[17]中建議的那樣。在未來,技術和社交媒體可能允許更大的團體更積極地參與工作委員會會議。
3.2 未來方向和社區參與
隨著常規收集的健康數據的可用性擴大,我們希望來自當前無法獲得這些數據的地區的研究人員能更多地參與其中。通過 recordstatement.org 網站和留言板,我們期望持續對 RECORD 規范相關方面進行評論和討論,這可能促成未來的正式修訂。通過這個在線社區,RECORD 將成為一個靈活的文檔,以適應不同領域的變化。
公開發表和通過期刊推薦對改善研究報告質量來說還不足夠[80]。研究者、期刊和同行評審員實施 RECORD 規范的方式是其重要的可測量影響[81]。因此,在線留言板包含對其應用的討論論壇。我們還鼓勵評價 RECORD 對該領域報告質量影響的評價,從而可使該規范提供可衡量的益處。
4 結論
RECORD 規范是 STROBE 聲明在使用常規收集數據實施的觀察性研究中的擴展。根據研究和發表的意見,我們以清單的形式編寫了規范以及配套的解釋性文件。已有研究證明報告指南改進了研究報告質量,從而使讀者能夠了解結論的優勢、局限性和準確性[12,82-84]。同時,我們期望 RECORD 規范將隨著該領域研究方法的發展而改變,該指南將在未來幾年內有助于促進對研究進行充分報告。隨著作者、期刊編輯和同行評議人員的使用,我們期望 RECORD 規范可切實改善使用常規收集衛生數據實施的研究的報告的透明性、可重復性和完整性。
支持信息 參與本調查的利益相關者名單(見原文表 S1)。
RECORD 規范的制定得到加拿大衛生研究所(基金編號:130512)、瑞典國家科學基金會(基金編號:IZ32Z0_147388/1)和奧胡斯大學臨床流行病學系的資助。資助者并未參與研究設計、數據收集和分析、撰寫和發表過程。該工作由東安大略兒童醫院研究倫理委員會批準。RECORD 規范的全體作者感謝在有關所需納入清單內容調查過程中所有參與的利益相關者(見原文表 S1)。同時也十分感謝 STROBE 聲明發起組織成員在 RECORD 制定過程中給予的幫助。感謝 Pauline Quach 和 Danielle Birman 所作的協調工作,以及 record-statement.org 網站設計和管理者 Andrew Perlmutar。感謝所有參與推動 RECORD 規范發展的利益相關者。
RECORD 工作委員會成員名單 Douglas Altman(Centre for Statistics in Medicine,Oxford University),Nicholas de Klerk(University of Western Australia),Lars G. Hemkens(University Hospital Basel),David Henry(University of Toronto and Institute for Clinical Evaluative Sciences,Toronto),Jean-Marie Januel(University of Lausanne),Marie-Annick Le Pogam(Institute of Social and Preventive Medicine,University Hospital of Lausanne),Douglas Manuel(Ottawa Hospital Research Institute,University of Ottawa),Kirsten Patrick(editor,Canadian Medical Association Journal[CMAJ]),Pablo Perel(London School of Hygiene and Tropical Medicine),Patrick S. Romano(University of California,Davis,co-editor-in-chief,Health Services Research),Peter Tugwell(University of Ottawa,editor-in-chief,Journal of Clinical Epidemiology),Joan Warren(National Institutes of Health/National Cancer Institute),Wim Weber(European editor,BMJ),Margaret Winker(formerly senior research editor,PLOS Medicine; current secretary,World Association of Medical Editors)