在进行临床试验数据管理之前,必须由数据管理部门根据项目实际情况制定数据管理计划(Data Management Plan,DMP)。明确数据管理应包括以下内容和一些时间点并明确相关人员职责。
1.CRF的设计与填写
1.1.CRF的设计
临床试验主要依赖于CRF来收集试验过程中产生的各种临床试验数据。CRF的设计必须保证收集试验方案里要求的所有临床数据(外部数据除外)。CRF的设计、制作、批准和版本控制过程必须进行完整记录。
CRF的设计、修改及最后确认会涉及多方人员的参与,可以包括申办者、申办者委托的CRO、研究者、数据管理和统计人员等。一般而言,CRF初稿由申办者或CRO完成,但其修改与完善由上述各方共同参与,最终必须由申办者批准。
1.2.CRF填写指南
CRF填写指南是根据研究方案对于病例报告表的每页表格及各数据点进行具体的填写说明。
CRF填写指南可以有不同的形式,并可以应用于不同类型的CRF或其他数据收集工具和方式。对于纸质CRF而言,CRF填写指南应作为CRF的一部分或一个单独的文档打印出来。对EDC(Electronic Data Capture)系统而言,填写指南也可能是针对表单的说明、在线帮助、系统提示以及针对录入数据产生的对话框。
保证临床试验中心在入选受试者之前获得CRF及其填写指南,并对临床试验中心相关工作人员进行方案、CRF填写和数据提交流程的培训,该过程需存档记录。
1.3.注释CRF
注释CRF是对空白CRF的标注,记录CRF各数据项的位置及其在相对应的数据库中的变量名和编码。每一个CRF中的所有数据项都需要标注,不录入数据库的数据项则应标注为“不录入数据库”。注释CRF作为数据库与CRF之间的联系纽带,帮助数据管理员、统计人员、程序员和药物评审机构了解数据库。注释CRF可采用手工标注,也可采用电子化技术自动标注。
1.4.CRF的填写
临床研究者必须根据原始资料信息准确、及时、完整、规范地填写CRF。CRF数据的修改必须遵照SOP,保留修改痕迹。
2.数据库的设计
临床试验方案设计具有多样性,每个研究项目的数据收集依赖于临床试验方案。临床试验数据库应保证完整性,并尽量依从标准数据库的结构与设置,包括变量的名称与定义。就特定的研究项目来说,数据库的建立应当以该项目的CRF为依据,数据集名称、变量名称、变量类型和变量规则等都应反映在注释CRF上。
数据库建立完成后,应进行数据库测试,并由数据管理负责人签署确认。
3.数据接收与录入
数据可以通过多种方式进行接收,如传真、邮寄、可追踪有保密措施的快递、监查员亲手传递、网络录入或其他电子方式。数据接收过程应有相应文件记录,以确认数据来源和是否接收。提交数据中心时应有程序保证受试者识别信息的保密。
数据录入流程必须明确该试验的数据录入要求。一般使用的数据录入流程包括:双人双份录入, 带手工复查的单人录入,和直接采用EDC方式。
4.数据核查
数据核查的目的是确保数据的完整性、有效性和正确性。在进行数据核查之前,应列出详细的数据核查计划,数据核查包括但不局限于以下内容:
确定原始数据被正确、完整地录入到数据库中:检查缺失数据,查找并删除重复录入的数据,核对某些特定值的唯一性(如受试者ID);
随机化核查:在随机对照试验中,检查入组随机化实施情况;
违背方案核查:根据临床试验方案检查受试者入选/排除标准、试验用药计划及合并用药(或治疗)的规定等;
时间窗核查:核查入组、随访日期之间的顺序判断依从性情况;
逻辑核查:相应的事件之间的逻辑关联来识别可能存在的数据错误;
范围核查:识别在生理上不可能出现或者在研究人群的正常变化范围外的极端数值;
一致性核查:如严重不良事件安全数据库与临床数据库之间的一致性核查,外部数据与CRF收集的数据一致性核查,医学核查等。
数据管理人员应对方案中规定的主要和次要有效性指标、关键的安全性指标进行充分的核查以确保这些数据的正确性和完整性。
数据核查应该是在未知试验分组情况下进行,数据质疑表内容应避免有偏差或诱导性的提问,诱导性的提问或强迫的回答会使试验的结果存有偏差。
数据核查可通过手动检查和电脑程序核查来实现。数据核查程序应当是多元的,每个临床研究人员有责任采用不同的工具从不同的角度参与数据库的疑问清理工作。
有时,对于事先定义的逻辑简单且能明确判断的错误,在得到研究者同意后数据管理员可对数据按照事先的规定进行修订,并记录在稽查轨迹里。
5.数据质疑的管理
数据核查后产生的质疑以电子或纸质文档的形式发送给临床监查员或研究者。研究者对质疑做出回答后,数据管理员根据返回质疑答复对数据进行修改。如质疑未被解决则将以新的质疑再次发出,直至数据疑问被清理干净。
6.数据更改的记录
错误的数据在数据清理过程中会被纠正,但必须通过质疑/答复的方式完成,即使在电话会议中认可的数据更改。
数据管理过程中应保存质疑过程的完整记录。
7.医学编码
临床试验中收集的病史、不良事件、伴随药物治疗建议使用标准的字典进行编码。编码的过程就是把从CRF上收集的描述与标准字典中的词目进行匹配的过程。医学编码员须具备临床医学知识及对标准字典的理解。当出现的词目不能够直接与字典相匹配时可以进行人工编码,对于医学编码员也无法确认的词目,应当通过数据质疑与研究者沟通以获得更详细的信息来进行更确切的编码工作。医学编码应在锁库前完成。
广泛使用的标准字典有MedDRA、WHO Drug、WHOART。数据管理部门应制定SOP,适时更新字典并保证医学和药物编码在不同版本字典之间的一致性。临床研究使用的字典名称及版本信息应在数据管理计划中描述说明。
8.试验方案修改时的CRF变更
药物临床试验中有时会发生试验方案修改的情况,但不是所有的试验方案修改都需要变更CRF,需要制定相应的流程处理此种情况。须注意CRF的重要变更应在方案的修订获得机构/伦理审查委员会(IRB/IEC)批准后才生效。
9.实验室及其他外部数据
在临床试验的组织实施过程中,有一些临床试验方案中规定采集,但是在研究者的研究基地以外获得的,由其他供应商(如中心实验室)提供的外部数据。外部数据类型比如:生物样本分析数据:实验室数据、药代动力学/药效学数据、生物标记物的检测数据等;外部仪器检测数据(如血生化、心电图、血流仪、生命体征监测、影像学检查等);受试者的记录。
下列这些方面可能会影响外部数据的完整性,在建立数据库期间应注意:关键变量的定义和必需内容;数据编辑和核查程序;记录格式和文件格式(例如,SAS、ASCII);数据传输;数据库更新;数据储存和归档。
为了确保有足够的信息可供用于外部数据的鉴别和处理,选择关键变量(唯一地描述每一个样本记录的数据)时必须谨慎。若无关键变量,将会对患者、样本和访视与结果记录的准确配对造成困难。
本地实验室数据一般通过人工录入方式收集,需关注不同实验室检测单位及其正常值范围之间的差别,重视对缺失数据、异常数据,以及重复数据等的检查。中心实验室数据的收集主要通过电子化的文件形式传输。在研究开始之前,数据管理员要为中心实验室制定一份详细的数据传输协议,对外部数据的结构、内容、传输方式、传输时间以及工作流程等作具体的技术要求。
数据管理员应及时对外部数据进行核查,如应用逻辑检验程序,进行相应的关联检查和医学审查等,并对发现的问题启动质疑。
对于实验室和其他外部数据核查中发现的问题,临床研究监查员要对这些数据作100%的源数据核查。
10.数据盲态审核
无论临床试验过程是开放或盲法操作,在临床试验数据库锁定前,应由申办方、研究者、数据管理人员和统计分析师在盲态下共同最终审核数据中未解决的问题,并按照临床试验方案进行统计分析人群划分、核查严重不良事件报告与处理情况记录等。
如双盲临床试验还需检查紧急揭盲信件和临床试验总盲底是否密封完好,如有紧急揭盲情况发生,需有紧急揭盲理由及处理报告。
11.数据库锁定
数据库锁定是临床研究过程中的一个重要里程碑。它是为防止对数据库文档进行无意或未授权的更改,而取消的数据库编辑权限。数据库锁定过程和时间应有明确的文档记录,对于盲法临床试验,数据库锁定后才可以揭盲。
11.1.数据库锁定清单
数据库锁定时,应事先制定锁库的工作程序并严格遵守,应保证通知了试验相关工作人员,并获得所有相关人员的批准后方可锁定试验数据库。
数据管理员应制定数据库锁定清单,数据库锁定清单建议包括但不限于以下内容:所有的数据已经收到并正确录入数据库;所有的数据质疑表已经解答并进入数据库;所有的病例报告表已经得到主要研究者签字批准;非病例报告表数据(例如,中心实验室电子数据)已经合并到试验数据库中,并完成了与试验数据库的数据一致性核查;已完成医学编码;已完成最终的数据的逻辑性和一致性验证结果审查;已完成最终的明显错误或异常的审查;已完成最终的医学核查;已完成数据质量审核,并将质量审核中发现的错误发生率记录在文档中;根据SOP更新并保存了所有试验相关文档。
一旦完成上面所述步骤,就应书面批准数据库锁定,并由试验相关人员签名及签署日期,试验相关人员有:数据管理人员、生物统计师、临床监查员代表、研究者代表等。一旦获得数据库锁定的书面批准文件,就应收回数据库的数据编辑权限,并将收回数据编辑权限的日期记录在文档中。
针对期中分析,应严格按照方案中规定时间点或事件点进行分析,期中分析数据库锁定过程与最终分析的数据库锁定要求可能有所不同,但是所有数据库锁定的要求以及采取的步骤都应记录在文件中,还应报告截止至进行期中分析时的数据情况、时间情况及终点事件情况等。
11.2.数据库锁定后发现数据错误
如果数据库锁定后发现有数据错误,应仔细的考虑处理并记录这些错误数据。最重要的是,应评估这些数据错误对安全性分析和有效性分析的潜在影响。然而,并非所有发现的数据错误都必须更正数据库本身。数据错误也可以记录在统计分析报告和临床报告文档中。尽管一些申办者选择更改发现的数据库中的所有错误,但一些申办者可能只更改对安全性/有效性分析有重要影响的数据错误。最重要的是,申办者应事先确定一个程序来决定应处理哪些数据错误和记录这些数据错误。
如果一个数据库锁定后又重新开锁,这个过程必须谨慎控制,仔细记录。重新开锁数据库的流程应包括通知项目团队,清晰地定义将更改哪些数据错误,更改原因以及更改日期,并且由主要研究者、数据管理人员和统计分析师等人员共同签署。数据库的再次锁定应遵循和数据库首次锁定一样的通知/批准过程。
12.数据备份与恢复
在整个研究的数据管理过程中,应及时备份数据库。通常是在另外一台独立的计算机上进行备份,并根据工作进度每周对备份文件进行同步更新。最终数据集将以只读光盘形式备份,必要时,未锁定数据集也可进行光盘备份。
当数据库发生不可修复的损坏时,应使用最近一次备份的数据库进行恢复,并补充录入相应数据。
相关计算机必须具有相应的有效防病毒设置,包括防火墙、杀病毒软件等。
13.数据保存
数据保存的目的是保证数据的安全性、完整性和可及性(Accessibility)。
保证数据的安全性主要是防止数据可能受到的物理破坏或毁损。在进行临床试验的过程中,把所有收集到的原始数据(如CRF和电子数据)存储在安全的地方,诸如受控的房间,保证相应的温度、湿度,具有完善的消防措施,防火带锁文档柜。这些原始文档是追踪到原始数据的审核路径的一部分,应如同电子审核路径对数据库的任何修改或备份所做记录一样,严格进行保护。数据保存期限应按照法规的特定要求执行。
数据的内容及其被录入数据库的时间、录入者和数据在数据库中所有的修改历史都需要保存完整。保证数据的可及性是指用户在需要时能够自如登录和获取数据,以及数据库中的数据可以按照需要及时传输。
在临床试验完成后,应对试验过程中的文档进行存档。下表中总结了临床试验数据归档保存的各类型信息:
归档内容 | 要求 |
临床试验数据 | 试验中收集的所有数据。这些数据既包括记录在病例报告表上的数据也包括非病例报告表收集的数据(例如实验室检查结果,心电图检查结果以及受试者电子日记)。 |
外部数据 | 外部收集并将导入至临床试验数据管理系统(CDMS)的数据,包括所有导入的数据及其文件和用于外部数据质量控制的所有文件。 |
数据库元数据信息 | 临床试验数据结构相关信息。这类典型信息是表、变量名、表单、访视和任何其他相关对象,也包括编码列表。 |
数据管理计划书 | 数据管理计划的微软Word或PowerPoint文档可以转成PDF格式文件或打印成纸张文件归档保存。 |
编码词典 | 如果数据是使用公司内词典或同义词表自动编码,那么使用的词典和统一词表都应归档保存。 |
实验室检查参考值范围 | 实验室检查的参考值范围。如果临床试验研究过程中使用多个版本的参考值范围,那么每个版本的参考值范围都应归档保存。 |
稽查轨迹 | 试验稽查轨迹的整个内容,并使用防修改的方式。 |
逻辑检验,衍生数据变更控制列表 | 以工作清单、工作文件、工作报告的形式提供逻辑检验定义和衍生数据的算法,以及它们的变更控制记录。 |
数据质疑表 | 所有数据质疑表,传递数据质疑表的相关邮件及数据质疑表解答的复印件。纸张形式的数据质疑表可以扫描归档保存,并且为扫描文件添加索引。 |
程序代码 | 数据质量核查程序的代码,衍生数据的代码以及临床试验数据统计分析的程序代码。程序代码文档应归档保存。最理想情况是,这些文件以在线方式保存,并编制索引或超链接。 |
病例报告表的映像PDF格式文件 | 对于纸张的病例报告表临床试验来说,CRF映像文件通常可以通过扫描方式获得,并将这些扫描文件转成PDF格式。对于电子数据采集的临床试验来说,电子表单的PDF格式映像文件可以通过EDC/M应用创建。 |
其他 | 其他与数据管理相关的文件,如数据库锁库和开锁记录、数据库使用者清单等。 |
下表中列举不同类型的临床试验数据及其常用的归档格式。
格式 | 描述 |
CSV | 以逗号为分隔符的ASCII文本文件,可以使用文本编辑器、文字处理器以及Excel电子表格软件编辑。 |
XML | 以ASCII技术为基础,便于不同系统间结构化信息的转换。 |
XPT | SAS公司提供的开源格式文件。通常用来提交临床试验数据。 |
Adobe PDF | 应用广泛的文本输出格式。 |
对于使用纸质病例报告表的临床试验,机构应保存所有纸质病例报告表的复印件。对于使用电子数据试验,临床试验数据管理系统的供应商应为临床研究机构提供一份所有电子病例报告表的PDF文件格式以备案。
14.数据保密及受试者的个人隐私保护
14.1.数据保密
数据保密是药物研发过程中必须遵守的基本原则,参与药物研发的机构应建立适当的程序保证数据库的保密性,包括建立及签署保密协议以规范相应人员的行为,以及建立保密系统以防止数据库的泄密。
14.2.受试者的个人隐私保护
临床试验受试者的个人隐私应得到充分的保护,受保护医疗信息包含:姓名、生日、单位、住址;身份证/驾照等证件号;电话号码、传真、电子邮件;医疗保险号、病历档案、账户;生物识别(指纹、视网膜、声音等);照片;爱好、信仰等。
个人隐私的保护措施在设计数据库时就应在技术层面考虑,在不影响数据的完整性和不违反GCP原则的条件下尽可能不包括上述受保护医疗信息,比如:数据库不应包括受试者的全名,而应以特定代码指代。