CDISC STANDARD

什么是CDISC standard

clinical data interchange standards consortium
临床数据标准协会

规范药厂提供的数据,例如实验结果图表，原始数据和中间步骤数据集，规范有效性判断指标，方便核对待审药物临床实验的数据变量和数值意义，确保避免多次反复核对.
优点:

规定数据记录标准以及方式,单位，名称等，进行数据标准化
避免数据造假
方便分析过程中和团队进行沟通
对数据规定进行统一规定，并给出一些提示

CDISC 标准

针对每期实验的过程所指定的标准
分支：

send-动物实验(非临床数据交换标准，用于递交临床前研究的数据，SDTM的拓展)
PRM-实验计划(方案描述模型，研究方案的内容)
CDASH-数据收集(临床数据后期标准协调,以cdisc为指导基于SDTM联合开发的，用于病例报表中基础字段的收集,规定数据如何收集)
SDTM-制表(规定原始数据集收集后的标准化呈现方式)
ADaM-分析(分析数据模型，有关分析数据集的相关文件）
提交
CDISC 补充文件（拥有标准化数据值）
control terminolog
BRIDG
Glossary等

收到数据之后步骤

先整理成符合SDTM标准的数据集(SDTM标准下有每个数据的放置的位置)
SDTM之后，创建ADaM数据集(偏向结果的分析性，analysis-ready)

SDTM (study data tabulation model)

用于临床实验数据的标准化，根据实验药的不同，数据收集的样式也会各有不同，但是在经过SDTMB标准化之后，相同类别的数据一定相同
不同实验在数据集、变量和变量的值有所不同
无法完全覆盖实验情况，每款药物有自己特殊情况，custom domain的位置

基础知识

五个变量

identity—编号类
topic
timing—时间观察
qualifier–对topic的补充说明
- grouping qualifiers
- result qualifiers
- synonym qualifiers
- record qualifiers
- variable qualifiers
rule–放在实验设计相关的domain中

变量存在度的要求

变量只有两种类型，char和num
core
- req-必须存在
- exp-希望存在的变量
- perm-允许存在，是否添加根据实验设计

补充数据集与自定义数据

-临床实验收集的数据一定要上交，如果SDTM无法标准化，则需要补充数据集和自定义数据集

补充数据集

命名标准：以supp开头+原本数据集的名称
创建的基本要求是追溯性，数据集的一条记录必须能够找到在主数据集中对应的数据

自定义数据集

要求以xyz开头，两位，例如定义一个数据集叫xf，xy
90%的实验都不需要自定义数据集

DM数据集(人口统计学)

数据集分类

类别与包含的数据集(7个类别44个数据集)

special purpose 特殊目的类
-无法归类的数据集，4个
- co(评价数据，文本类一般,与其他数据集相连，有可能需要创建多个)
- dm(人口统计)
- sv/se（患者本身的来访时期元素，sv时间，se时期）
intervention 干涉类
-对患者有影响的行为数据
-cm 伴随用药，患者服用其他药品
-ex（计划药物使用） and ec（实际药物使用）
-pr 患者治疗和诊断相关过程
-su 其他非药物使用情况
events 事件类，不在计划范围内的
-AE 副作用数据集，meddra文档记录副作用的详细信息
-CE
-DS
-DV
-HO
-MH
findings 发现类（用于特殊药物与试验中，常用的有）
-EG
-IE
-LB
-QS
-VS
（癌症类）
-TU TR RS
通用变量
-检测名称xxtest/xxtestcd
-检测分类 xxcat/xxscat
-检测结果(字符数字以及单位) xxorres/xxorresu/xxstresc/xxstresn/xxstresu
-试验检测–visit/visitnum
-检测时间 xxdtc/dy
finding about 发现相关类
-FA
-SR
-收集数据不像发现类那么标准
trail design 实验设计类(冲sap中直接获得)
TA
TD
TE
TI
TV
TS
relationship 关系类
-supp 可以作为补充数据集
-relrec 关系记录

SDTM标准小知识点

supp补充数据集（368pg in IG）

以supp+sdtm数据集的名字命名
supp数据集不是必须要有的
十个变量（idvar 使用哪些变量以及idvarval 变量的对应的值）
有主数据相关的变量

custom domain 自定义数据集

保留自由度
命名以XYZ开头两位大写字母
仔细阅读，确认数据是否真的不能放进SDTM数据集中
如果需要自定义数据集，考虑这些数据的类别
找到每个类别的几个数据集，选取共同required变量看看自己的数据怎么放到这些变量中
给自定义数据集取名字，方便定位

controlled term

ADaM–用来分析数据

把SDTM转化为ADaM，然后ADaM转化为图表，偏向数据的可分析性，变量意义根据实验的不同可以进行调整

创建的意义(只包含分析需要的数据)

避免在SDTM中发生错误，简化编程，使数据分析工作更准确，标准、更快速

标准需要清晰以及标准
被常用软件使用
必须有metadata，元数据
可追溯性-matadata and datapoint(数据从sdtm哪条数据而来)
可分析性

变量存在度

req
con req 条件性必须
perm

ADSL BOS 与 OCCDS(三个是对立关系)

ADSL每个患者一条记录数据结构

subject level analysis dataset
与SDTM中的dm对应

BDS基础数据结构

basic data structure
finding 和 finding about 数据类型按照BDS的结构生成ADaM数据集
命名规则字母AD＋所用主要SDTM数据集的名称
基本要求是每个患者每个参数每个时间点一条记录

OCCDS发生数据

occurrence data
event数据分类中

自定义变量与记录（重要）(2-6 创建新纪录)

rule 1一个与AVL 与BASE 相关，不跨越参数，不涉及base 变量的变化创建新变量(aval-base)
rule 2-对aval的转化不满足条件1，创建新纪录
rule 3-使用相同参数一条或几条记录来分析时间点的新纪录
- 按照实验要求创建分析时间点
- 填补缺失值时候，需要创建新纪录来填补(locf 和 wocf方法去填补缺失值)
rule 4-一个值通过同参数多条记录计算而来，新增加一个记录
rule 5 - 一个计算跨参数，创建新的记录
rule 6-对基准线定义有多重时候，每一种中的一组都需要创建新纪录

查看全文

https://www.fengoutiyan.com/post/14129.html