CDISC STANDARD
CDISC STANDARD
什么是CDISC standard
clinical data interchange standards consortium
临床数据标准协会
规范药厂提供的数据,例如实验结果图表,原始数据和中间步骤数据集,规范有效性判断指标,方便核对待审药物临床实验的数据变量和数值意义,确保避免多次反复核对.
优点:
- 规定数据记录标准以及方式,单位,名称等,进行数据标准化
- 避免数据造假
- 方便分析过程中和团队进行沟通
- 对数据规定进行统一规定,并给出一些提示
CDISC 标准
针对每期实验的过程所指定的标准
分支:
- send-动物实验(非临床数据交换标准,用于递交临床前研究的数据,SDTM的拓展)
- PRM-实验计划(方案描述模型,研究方案的内容)
- CDASH-数据收集(临床数据后期标准协调,以cdisc为指导基于SDTM联合开发的,用于病例报表中基础字段的收集,规定数据如何收集)
- SDTM-制表(规定原始数据集收集后的标准化呈现方式)
- ADaM-分析(分析数据模型,有关分析数据集的相关文件)
- 提交
CDISC 补充文件(拥有标准化数据值) - control terminolog
- BRIDG
- Glossary等
收到数据之后步骤
- 先整理成符合SDTM标准的数据集(SDTM标准下有每个数据的放置的位置)
- SDTM之后,创建ADaM数据集(偏向结果的分析性,analysis-ready)
SDTM (study data tabulation model)
- 用于临床实验数据的标准化,根据实验药的不同,数据收集的样式也会各有不同,但是在经过SDTMB标准化之后,相同类别的数据一定相同
- 不同实验在数据集、变量和变量的值有所不同
- 无法完全覆盖实验情况,每款药物有自己特殊情况,custom domain的位置
基础知识
五个变量
- identity—编号类
- topic
- timing—时间观察
- qualifier–对topic的补充说明
- grouping qualifiers
- result qualifiers
- synonym qualifiers
- record qualifiers
- variable qualifiers - rule–放在实验设计相关的domain中
变量存在度的要求
- 变量只有两种类型,char和num
- core
- req-必须存在
- exp-希望存在的变量
- perm-允许存在,是否添加根据实验设计
补充数据集与自定义数据
-临床实验收集的数据一定要上交,如果SDTM无法标准化,则需要补充数据集和自定义数据集
补充数据集
- 命名标准:以supp开头+原本数据集的名称
- 创建的基本要求是追溯性,数据集的一条记录必须能够找到在主数据集中对应的数据
自定义数据集
- 要求以xyz开头,两位,例如定义一个数据集叫xf,xy
- 90%的实验都不需要自定义数据集
DM数据集(人口统计学)
数据集分类
类别与包含的数据集(7个类别44个数据集)
- special purpose 特殊目的类
-无法归类的数据集,4个- co(评价数据,文本类一般,与其他数据集相连,有可能需要创建多个)
- dm(人口统计)
- sv/se(患者本身的来访时期元素,sv时间,se时期)
- intervention 干涉类
-对患者有影响的行为数据
-cm 伴随用药,患者服用其他药品
-ex(计划药物使用) and ec(实际药物使用)
-pr 患者治疗和诊断相关过程
-su 其他非药物使用情况 - events 事件类,不在计划范围内的
-AE 副作用数据集,meddra文档记录副作用的详细信息
-CE
-DS
-DV
-HO
-MH - findings 发现类(用于特殊药物与试验中,常用的有)
-EG
-IE
-LB
-QS
-VS
(癌症类)
-TU TR RS
通用变量
-检测名称xxtest/xxtestcd
-检测分类 xxcat/xxscat
-检测结果(字符数字以及单位) xxorres/xxorresu/xxstresc/xxstresn/xxstresu
-试验检测–visit/visitnum
-检测时间 xxdtc/dy - finding about 发现相关类
-FA
-SR
-收集数据不像发现类那么标准 - trail design 实验设计类(冲sap中直接获得)
- TA
- TD
- TE
- TI
- TV
- TS
- relationship 关系类
-supp 可以作为补充数据集
-relrec 关系记录
SDTM标准小知识点
supp补充数据集(368pg in IG)
- 以supp+sdtm数据集的名字命名
- supp数据集不是必须要有的
- 十个变量(idvar 使用哪些变量以及idvarval 变量的对应的值)
- 有主数据相关的变量
custom domain 自定义数据集
- 保留自由度
- 命名以XYZ开头两位大写字母
- 仔细阅读,确认数据是否真的不能放进SDTM数据集中
- 如果需要自定义数据集,考虑这些数据的类别
- 找到每个类别的几个数据集,选取共同required变量看看自己的数据怎么放到这些变量中
- 给自定义数据集取名字,方便定位
controlled term
ADaM–用来分析数据
把SDTM转化为ADaM,然后ADaM转化为图表,偏向数据的可分析性,变量意义根据实验的不同可以进行调整
创建的意义(只包含分析需要的数据)
避免在SDTM中发生错误,简化编程,使数据分析工作更准确,标准、更快速
- 标准需要清晰以及标准
- 被常用软件使用
- 必须有metadata,元数据
- 可追溯性-matadata and datapoint(数据从sdtm哪条数据而来)
- 可分析性
变量存在度
- req
- con req 条件性必须
- perm
ADSL BOS 与 OCCDS(三个是对立关系)
ADSL每个患者一条记录数据结构
subject level analysis dataset
与SDTM中的dm对应
BDS基础数据结构
basic data structure
finding 和 finding about 数据类型按照BDS的结构生成ADaM数据集
命名规则字母AD+所用主要SDTM数据集的名称
基本要求是每个患者每个参数每个时间点一条记录
OCCDS发生数据
occurrence data
event数据分类中
自定义变量与记录(重要)(2-6 创建新纪录)
- rule 1一个与AVL 与BASE 相关,不跨越参数,不涉及base 变量的变化 创建新变量(aval-base)
- rule 2-对aval的转化不满足条件1,创建新纪录
- rule 3-使用相同参数一条或几条记录来分析时间点的新纪录
- 按照实验要求创建分析时间点
- 填补缺失值时候,需要创建新纪录来填补(locf 和 wocf方法 去填补缺失值) - rule 4-一个值通过同参数多条记录计算而来,新增加一个记录
- rule 5 - 一个计算跨参数,创建新的记录
- rule 6-对基准线定义有多重时候,每一种中的一组都需要创建新纪录