导图社区 PR快速入门建议
临床PR入门建议,临床试验数据分析流程:SAP、mockup、临床试验数据(raw data)、标准数据模型(SDTM)、分析数据模型(ADaM)、TFLs、SAR。
编辑于2023-08-07 19:05:44 广东PR快速入门建议
I. 临床试验数据分析流程
1. SAP、mockup
2. 临床试验数据(raw data)
3. 标准数据模型(SDTM)
4. 分析数据模型(ADaM)
5. TFLs
PR的工作
6. SAR
II. 掌握SAS基础知识
了解SAS语法、数据处理和分析的基本概念。可以通过阅读SAS官方文档、参加培训课程或在线教程来学习。
1. SAS语言和应用
1. SAS软件概述
1. SAS软件
SAS(Statistical Analysis System)是一种广泛应用于统计分析和数据管理的软件。
2. SAS类型介绍
1. 桌面版
子主题
2. 虚拟机版(SAS University Edition)
3. 网页版(SAS Studio)
SAS on demand
3. SAS界面
打开EG自己熟悉
4. 数据分析流程
数据分析流程包括数据输入、数据处理、数据分析和结果输出等部分。
1. 数据输入
1. LIBNAME:为SAS数据集分配一个库名。
2. PROC IMPORT:用于从外部文件导入数据。
3. PROC DATASETS:用于创建、合并、拆分等操作数据集。
2. 数据处理
1. PROC SORT:用于对数据集进行排序。
2. PROC TRANSPOSE:用于将数据集的行和列互换。
3. PROC SUMMARY:用于计算数据集的汇总统计量。
4. PROC MEANS:用于计算数据集的均值、标准差等统计量。
3. 数据分析
1. PROC REG:用于进行线性回归分析。
2. PROC ANOVA:用于进行方差分析。
3. PROC UNIVARIATE:用于进行单变量分析。
4. PROC TTEST:用于进行t检验。
4. 结果输出
1. PROC PRINT:用于输出数据集的内容。
2. PROC CONTENTS:用于输出数据集的变量列表。
3. PROC GPLOT:用于绘制图形。
4. PROC REPORT:用于生成报告。
2. SAS基本语法
后续再详细分享,先自己下去掌握
3. SAS程序结构和逻辑
1. SAS程序的框架
1. Data step
1. 数据处理
2. 可以使用任何已经定义的SAS函数
3. 生成与原结构相同的数据集
4. 针对行处理
2. Proc step
1. 数据统计分析
2. 不能在Proc中使用SAS函数,sql列外
3. 生成与原结构不同的数据集或输出结果
4. 针对列处理
2. 读取数据集或文件
1. LIBNAME:为SAS数据集分配一个库名。
2. PROC IMPORT:用于从外部文件导入数据。
3. 连接数据集
1. 纵向连接 set proc sql
2. 横向连接 merge(data步横向连接时,所有用于横向连接的数据集必须使用BY提前排序,建议在merge后不要跟其他语句) proc sql
4. 变量操作顺序
data sas(keep=var1 var2); 1 set sashel.class; 2 keep var1 var2........ 3 run;
keep drop rename where
5. 输出数据集或文件
1. proc export
2. data step
4. 数值型变量及相关函数
1. 默认长度为8,可以自定义长度,3-8之间,用于储存数值与时间
2. 数字运算类 :mean(var1,var2,var3)、 mean(of var-var3)按后缀名找参数、mean(of var--var3)按位置找参数、median、max、min,注意当参数中存在缺失值时,把缺失值当做不存在,不对缺失值进行处理
3. 数字化简类函数:round(var1,0.1)、floor(var1)、ceil(var1)
4. 数值计算类:zbs(),constant('pi')、1/0,除数(分母)不能为0,当分母为0时,SAS把分母当作缺失值处理,数值型的缺失值用.表示,并且缺失值的大小为最小,其他的下去自己熟悉
5. 日期类型变量
1. 日期类型变量就是数值型变量,只是显示方式不同
2. SAS以1960年1月1日为日期起点,1960年1月1日0时0分0秒为时间起点
3. 日期数值的意义为与起点日期间隔的天数
4. 时间数值的意义为与起点时间间隔的秒数
5. 日期、时间可以为负值,表示为1960年1月1日之前的日期时间
6. 相关函数year()、month()、day()、mdy(mm,dd,yy)
7. 日期间隔函数intck('interval',start,end)、intnx('interval',start,n),interval可以取值day、week、month、quarter、year
5. 字符型变量及相关函数
1. 默认长度在创建时确定,用于存储字符
2. 截取函数substr(var1,1,2),ksubstr((var1,1,2)、scan(var1,1,"-")、index(var1,"想查找 的字符串")、find(var1,'想查找的字符串','指示符',1)
3. 字符控制函数
1. strip(var1) 删除首尾空格,一般对字符型变量进行函数嵌套时,建议都套一个strip
2. compbl(var1) 将多个空格缩为1个
3. compress(var1,'字符',指示符) 删除空格及指定文本
4. left(var1) 将字符串非空文本移到变量左侧
4. 其他类
tranwrd(var1,"原字符串","新字符串")
translate(var1,"新字符串","原字符串")
length、lengthn、lengthm(完整变量的长度)
6. SAS的数据格式
1. SAS的数据格式是SAS读取和显示数据的方式,不是数据的真实值
2. 数值型变量常见格式:8.1、8.2、8.3、3.2、dollar8.3、best.
3. 字符型变量常见格式:$20、$ascii12、$binary20
4. 日期时间型变量常见格式:e8601da.、yymmdd10.、date9.、e8601tm.、time5.、timeampm8.、e8601dt.
5. 变量类型转换
1. input(var1,格式)字符型转数值型
2. put(var1,格式)数值型转字符型
6. 自定义格式
proc format
2. 宏
宏基础
宏变量
宏逻辑
宏函数
III. 熟悉CDISC标准
CDISC (Clinical Data Interchange Standards Consortium) 标准是用于临床试验数据管理的一组标准,旨在促进临床试验数据的互操作性和可重复性。CDISC 标准包括多个模块,如 SDTM (Study Data Tabulation Model),ADaM (Analysis Data Model),SEND (Standard for Exchange of Nonclinical Data) 等,用于规范临床试验数据的收集、转换、存储和分析等方面。这些标准不仅有助于提高临床试验数据的质量和效率,还可以加速新药研发和上市进程。
IV. 了解临床试验设计
了解临床试验的基本原理、设计和统计方法。这将帮助你理解如何使用SAS来分析试验数据。
V. 学习SAS数据处理
掌握SAS的数据处理技巧,包括数据导入、数据清洗和数据转换等。这些技能对于准确分析临床试验数据至关重要。
VI. 学习SAS统计分析
了解SAS中常用的统计分析方法,如描述性统计、方差分析、回归分析等。这将帮助你对临床试验数据进行合理的统计分析。
VII. 参与实践项目
尝试使用SAS进行实际的临床试验数据分析项目。通过实践,你可以提高自己的技能并加深对SAS的理解
VIII. 参考资料
除了官方文档外,还可以阅读相关的书籍、论文或在线资源,以深入了解临床试验中的SAS应用。