导图社区 字符串
本图是关于字符串的思维导图,字符串的本质是:字符序列python中的字符串是不可变的;在Python中,字符串属于不可变对象,不支持原地修改,如果需要修改其中的值,智能创建新的字符串对象。
编辑于2023-09-12 22:38:25字符串
字符串
字符串的本质是:字符序列 python中的字符串是不可变的
字符串的编码
Python3直接支持Unicode,可以表示世界上任何书面语言的字符。Python3的字符默认就是16位 Unicode编码,ASCII码是Unicode编码的子集。 使用内置函数ord()可以把字符转换成对应的Unicode码; 使用内置函数chr()可以把十进制数字转换成对应的字符。
引号创建字符串
可以通过单引号或双引号创建字符串。例如:a=’abc’; b=”sxt” 使用两种引号的好处是可以创建本身就包含引号的字符串,而不用使用转义字符。 产学研合作框架下的"Python 学习" >>> resume='''name="韩明" age="37" company="shijiazhuang University"''' >>> resume 'name="韩明"\nage="37"\ncompany="shijiazhuang University"'
空字符串和len()函数
Python允许空字符串的存在,不包含任何字符且长度为0。 len()用于计算字符串含有多少字符。 >>> c='韩明' >>> len(c) 2 注意:汉字和英文字符长度一样
转义字符
使用“\+特殊字符”,实现某些难以用字符表示的效果。比如:换行等。常见的转义字符有 \(在行尾时) 续行符 \\ 反斜杠符号 \' 单引号 \" 双引号 \b 退格(Backspace) \n 换行 \t 横向制表符 \r 回车
字符串拼接
1. 可以使用+将多个字符串拼接起来。例如:’aa’+ ’bb’ ==>’aabb’。 a. 如果+两边都是字符串,则拼接。 b. 如果+两边都是数字,则加法运算。 c. 如果+两边类型不同,则抛出异常。 2. 可以将多个字面字符串直接放到一起实现拼接。例如:’aa’’bb’==>’aabb’ >>> a='dddd''wwwww' >>> a 'ddddwwwww'
字符串复制
使用*可以实现字符串复制。 【操作】字符串复制操作 >>> a="hanming"*5 >>> a 'hanminghanminghanminghanminghanming'
不换行打印
我们前面调用print时,会自动打印一个换行符。有时,我们不想换行,不想自动添加换行符。我们可 以自己通过参数end = “任意字符串”。实现末尾添加任何内容: print("aa",end="*") print("bb",end="##") print("cc",end="\t")
从控制台读取字符串
可以使用input()从控制台读取键盘输入的内容。 >>> myname=input("请输入你的名字") 请输入你的名字韩明 >>> myname '韩明' 在input()函数处执行了阻塞和等待
str()实现数字转型字符串
str()可以帮助我们将其他数据类型转换为字符串。例如: str(5.20) ==> ‘5.20’ str(3.14e2)==>’314.0’ str(True) ==> ‘True’
使用[]提取字符
字符串的本质就是字符序列,我们可以通过在字符串后面添加[],在[]里面指定偏移量,可以提取 该位置的单个字符。 正向搜索: 最左侧第一个字符,偏移量是0,第二个偏移量是1,以此类推。直到len(str)-1为止。 反向搜索: 最右侧第一个字符,偏移量是-1,倒数第二个偏移量是-2,以此类推,直到-len(str)为止。 >>> a="hanminghanguoguo" >>> a[2] 'n' >>> a[-1] 'o' >>> a[-2] 'u' >>> a[-15] 'a' >>> a[-20] Traceback (most recent call last): File "<pyshell#50>", line 1, in <module> a[-20] IndexError: string index out of range 正向搜索可以相当于字符数组
字符串切片slice操作
切片slice操作可以让我们快速的提取子字符串。标准格式为: [起始偏移量start:终止偏移量end:步长step] >>> a = 'abcdefghijklmnopqrstuvwxyz' >>> a 'abcdefghijklmnopqrstuvwxyz' >>> a[3]='河' Traceback (most recent call last): File "<pyshell#94>", line 1, in <module> a[3]='河' TypeError: 'str' object does not support item assignment >>> a = 'abcdefghijklmnopqrstuvwxyz' >>> a 'abcdefghijklmnopqrstuvwxyz' >>> a = a.replace('c','高') 'ab高defghijklmnopqrstuvwxyz' 包头不包尾 典型操作(三个量为正数的情况)如下:[:] 提取整个字符串 “abcdef”[:] “abcdef” [start:]从start索引开始到结尾 “abcdef”[2:] “cdef” [:end]从头开始知道end-1 “abcdef”[:2] “ab” [start:end]从start到end-1 “abcdef”[2:4] “cd” [start:end:step]从start提取到end-1, 步长是step “abcdef”[1:5:2] “bd”
split()分割和join()合并
split()可以基于指定分隔符将字符串分隔成多个子字符串(存储到列表中)。如果不指定分隔符,则默认 使用空白字符(换行符/空格/制表符)。
join()的作用和split()作用刚好相反,用于将一系列子字符串连接起来。
拼接字符串要点
使用字符串拼接符+,会生成新的字符串对象,因此不推荐使用+来拼接字符串。推 荐使用join函数,因为join函数在拼接字符串之前会计算所有字符串的长度,然后逐一拷贝,仅新建一 次对象。
字符串驻留机制和字符串比较
字符串驻留
仅保存一份相同且不可变字符串的方法,不同的值被存放在字符串驻留池中。 Python支持字符串驻留机制,对于符合标识符规则的字符串(仅包含下划线(_)、字母和数字)会启 用字符串驻留机制驻留机制。
字符串比较和同一性
我们可以直接使用==,!=对字符串进行比较,是否含有相同的字符。 我们使用is / not is,判断两个对象是否同一个对象。比较的是对象的地址,即id(obj1)是否和id(obj2) 相等。
成员操作符
in /not in 关键字,判断某个字符(子字符串)是否存在于字符串中。 >>> a="abcdefg" >>> "abc"in a True >>> "abc" not in a False
字符串常用方法汇总
常用查找方法
en(a) 字符串长度 96 a.startswith('我是韩明') 以指定字符串开头 True a.endswith('超越我') 以指定字符串结尾 Trua.find('韩') 第一次出现指定字符串的位置 2 a.rfind('韩') 最后一次出现指定字符串的位置 29 a.count("韩知宜") 指定字符串出现了几次 3 a.isalnum() 所有字符全是字母或数字 False
去除首尾信息
通过lstrip()去除字符串左边指定信息,rstrip()去除字 符串右边指定信息。
大小写转换
设 定一个测试变量: a = "gaoqi love programming, love SXT"
a.capitalize() 产生新的字符串,首字母大写 'Gaoqi love programming, love sxt' a.title() 产生新的字符串,每个单词都首字 母大写 'Gaoqi Love Programming, Love Sxt' a.upper() 产生新的字符串,所有字符全转成 大写 'GAOQI LOVE PROGRAMMING, LOVE SXT' a.lower() 产生新的字符串,所有字符全转成 小写 'gaoqi love programming, love sxt' a.swapcase() 产生新的,所有字母大小写转换 'GAOQI LOVE PROGRAMMING, LOVE sxt
格式排版
子主题
可变字符串
在Python中,字符串属于不可变对象,不支持原地修改,如果需要修改其中的值,智能创建新的字符串对象。 但是,经常我们确实需要原地修改字符串,可以使用io.StringIO对象或array模块。 >>> import io >>> s="hello sxt" >>> sio=io.StringIO(s) >>> sio <_io.StringIO object at 0x000001D0C5D16048> >>> sio.getvalue() 'hello sxt' >>> sio.seek(7)#指针 7 >>> sio.write("g") 1 >>> sio.getvalue() 'hello sgt'