导图社区 正则表达式
R语言实战之正则表达式知识梳理,包括字符串基础、模式匹配、其他类型的模式、其他应用等等。
《R语言实战》从解决实际问题入手,尽量跳脱统计学的理论阐述来讨论R语言及其应用,讲解清晰透澈,极具实用性。作者不仅高度概括了R语言的强大功能、展示了各种实用的统计示例,而且对于难以用传统方法分析的凌乱、不完整和非正态的数据也给出了完备的处理方法。通读本书,你将全面掌握使用R语言进行数据分析、数据挖掘的技巧,并领略大量探索和展示数据的图形功能,从而更加高效地进行分析与沟通。
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
正则表达式
字符串基础
"" '' 来创建字符串,c()函数来创建字符向量
stringr中的函数, str_length()返回字符串中的字符数量
str_c() 组合两个或更多字符串
str_sub() 提取字符串中的一部分
str_to_upper(c("i", "l") )
str_to_upper(c("i", "l"), locale = "tr")
模式匹配
基础匹配
x <-c("apple", "banana", "pear")
str_view(x, "an")
str_view(x, ".a.")
锚点
^ 从字符串开头进行匹配
str_view(x, "^a")
$ 从字符串结尾进行匹配
字符类与字符选项
\d 可以匹配任意数字
\s可以匹配任意空白字符
[abc] 可以匹配a, b或c
[^abc]可以匹配a,b,c外的任意字符
重复
?:0次或多次
+:一次或多次
x<- "1888 is the longest year in roman numeals: MDCCCLXXXVIII "
str_ view(x, "cc?")
*:0次或多次
{n}匹配n次
{n,}匹配n次或更多次
{,m} 最多匹配m次
{n , m} 匹配n到m次
分组与回溯引用
str_view(fruit, "(..)\\1", match = TURE)
其他类型的模式
当使用一个字符串作为模式是,R会自动调用 regex() 函数对其进行包装
ignore_case = TURE 既可以匹配大写字母,也可以匹配小写字母,总是使用当前的区域设置
mutiline = TURE 可以使得^和$从每行的开头和末尾匹配,而不是从完整的字符串开头和末尾开始匹配
comments =TURE 可以再复杂的正则表达式中加入注释和空白
dotall = TURE 可以匹配包括\n在内的所有字符
其他应用
apropos()
apropos( "replace" )
dir()
head ( dir(patten = "\\.Rmd$") )
stringi
stringr 建立与stringi 的基础上
str_
stri_
区别
创建\s\或\d的正则表达式,需对\进行转义,输入\\s \\d
str_view(x, "a$")