导图社区 基本数据处理
《R语言实战》从解决实际问题入手,尽量跳脱统计学的理论阐述来讨论R语言及其应用,讲解清晰透澈,极具实用性。作者不仅高度概括了R语言的强大功能、展示了各种实用的统计示例,而且对于难以用传统方法分析的凌乱、不完整和非正态的数据也给出了完备的处理方法。通读本书,你将全面掌握使用R语言进行数据分析、数据挖掘的技巧,并领略大量探索和展示数据的图形功能,从而更加高效地进行分析与沟通。
R语言实战之正则表达式知识梳理,包括字符串基础、模式匹配、其他类型的模式、其他应用等等。
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
基本数据处理
创建新变量
mydata$sum<-mydata$x1+x2
attch(mydata),detach(mydata)
mydata <- transform(mydata,sumx=x1+x2)
变量重编码
variable[condition] <- expression 将仅在condition 的值为TURE时执行赋值
变量重命名
fix() 交互式编辑器
reshape包中的rename()
rename(dataframe,c(oldname="newname",...))
names(data)<-"newname"
缺失值
is.na()
<-NA
判断数据中是否存在缺失值
na.rm=TURE,na.omit()
删除含有缺失值的观测
日期值
as.Date(x,"input_format")
Sys.Date()
返回当天日期
date()
返回当前的日期时间
format(x,format="output_format")
输出指定格式的日期值,并可以提取日期值中的某些部分
difftime()
计算时间间隔
类型转化
判断
转换
is.numeric()
as.numeric()
is.character()
as.character()
is.vector()
as.vector()
is.matrix()
as.matrix()
ia.data.frame()
is.factor()
is.logical()
数据排序
order() 默认升序
加 -号为降序
数据集的合并
添加列
merge(dataframeA,dataframeB,by="ID")
cbind()
添加行
rbind()
数据集取子集
选入变量
newdata<-leadership[,c(6:10)]
剔除变量
myvars <- names(leadership)%in%c("q3,q4"),newdata <- leadership[!myvars]
newdata <- leadership[, c(-8,-9)]
leadership$q3 <- leadership$q4 <- NULL
选入观测
newdata <- leadership[1:3,]
which()作用在行上
subset函数
subset(data,age>35|age<45,select=gender:q4)
随机抽样
sample(data, n, replace=FALSE)