导图社区 高级数据管理
《R语言实战》从解决实际问题入手,尽量跳脱统计学的理论阐述来讨论R语言及其应用,讲解清晰透澈,极具实用性。作者不仅高度概括了R语言的强大功能、展示了各种实用的统计示例,而且对于难以用传统方法分析的凌乱、不完整和非正态的数据也给出了完备的处理方法。通读本书,你将全面掌握使用R语言进行数据分析、数据挖掘的技巧,并领略大量探索和展示数据的图形功能,从而更加高效地进行分析与沟通。
R语言实战之正则表达式知识梳理,包括字符串基础、模式匹配、其他类型的模式、其他应用等等。
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
高级数据管理
数值和字符处理函数
数学函数
abs()
sqrt()
ceiling()
floor()
trunc()
round()
signif(x,digits=n)
cos(),sin(),tan()
acos(),asin(),atan()
cosh(),sinh(),tanh()
acosh(),asinh(),atanh()
log(x,base=n),log(x),log10
exp()
统计函数
mean()
median()
sd()
var()
mad()
quantile(x,probs)
range()
sum()
diff(x,lag=n)
min(),max()
scale(x,center=TURE,scale=TURE)
概率函数
格式 : [dpqr] distribution_abbreviation()
d=密度函数 ,p=分布函数 ,q=分位数函数 ,r=生成随机数
beta,binom, cauchy, chisq, exp, f, gamma, geom, hyper, lnorm, logis, multinom, nbinom, norm, pois, signrank, t, unif, weibull, wilcox
设定随机数种子
set.seed(n)
生成多元正态数据
library(MASS),mvrnorm(n,mean,sigma)
字符处理函数
nchar()
substr(x, start, stop)
fixed=FALSE表示pattern为一个正则表达式,否则为文本字符串 fixed=FALSE表示pattern为一个正则表达式,否则为文本字符串
sub(pattern, replacement, x, ignore.case=FALSE, fixed=FALSE)
strsplit(x, split, fixed=FALSE)
paste(..., sep="")
toupper(), tolower()
其他实用函数
seq(from, to, by)
rep(x, n)
cut(x, n)
pretty(x, n)
cat(..., file="myfile", append=FALSE)
\n 新行 , \t 制表符 , \' 单引号 , \b 退格
将函数应用于矩阵和数据框
apply(x, MARGIN, FUN, ...)
控制流
重复和循环
for循环
while结构
条件执行
if-else
if else (cond, statement1, statement2)
switch (expr , ...)
用户自编函数
myfounction ,<- function (arg1, arg2, ...){ statement, return(object) }
整合与重构
转置
t ()
整合数据
aggregate(x, by, FUN)
by中的变量必须在一个list 中
reshape包
melt 融合
每个测量变量独占一行,行中带有唯一确定这个测量所需的标识符变量
melt( data, id=(c("id","time") ) )
cast 重铸
cast(md, formula, FUN)
formula: rowvar1 +rowvar2 + ...~ colvar1 + colvar2+ ...