5. Python数据类型
5.3 字符串类型

基本概念

在 Python 中,字符串(String)是用于表示文本信息的数据类型。它可以用来存储各种文本信息,包括单词、句子、段落等。

字符串由若干个字符组成,其本质上是一种序列。在 Python 中,我们可以使用单引号 ' 或双引号 " 来表示字符串,例如:

s1 = 'Hello, world!'
s2 = "Python is a great programming language."

需要特别注意的是,在 Python 中,字符串是不可变的。这意味着,一旦创建了字符串,我们就不能对它进行修改。当然,我们可以使用字符串运算符来创建新的字符串。例如,我们可以使用加号 "+" 来拼接两个字符串:

s3 = s1 + ' ' + s2
print(s3)  # 输出: Hello, world! Python is a great programming language.

基本操作

Python 本身内建了很多字符串方法,可以帮助我们轻松地处理字符串。

这里列出一下常用的方法:

  • len(s):返回字符串 s 中字符的数量。
  • s.lower():返回字符串 s 中所有字符都转换为小写后的结果。
  • s.upper():返回字符串 s 中所有字符都转换为大写后的结果。
  • s.strip():返回字符串 s 中前导空格和尾随空格都已删除的结果。
  • s.isalpha():如果字符串 s 中只包含字母,则返回 True;否则返回 False
  • s.isdigit():如果字符串 s 中只包含数字,则返回 True;否则返回 False
  • s.replace(old, new):返回字符串 s 中所有的 old 字符都被替换为 new 字符后的结果。
  • s.find(sub):返回字符串 s 中第一次出现子字符串 sub 的位置,如果找不到,则返回 -1
  • s.index(sub):与 find() 方法类似,但如果找不到子字符串 sub,则会引发 ValueError 异常。
  • s.split(sep):使用分隔符 sep 将字符串 s 分割成多个子字符串,并将结果以列表的形式返回。
  • s.join(iterable):将字符串 s 作为分隔符,将可迭代对象中的所有元素连接起来,并返回连接后的字符串。
  • s.format(*args, **kwargs):使用 {}{} 格式化字符串 s 中的占位符,并使用可变参数或关键字参数提供的值替换占位符。
  • s.encode(encoding, errors='strict'):将字符串 s 编码为指定编码方式的字节序列,并返回编码后的字节序列。

参考示例

# len(s) 返回字符串 s 中字符的数量。
s = "Hello, world!"
length = len(s)  # length== 13
 
# s.lower() 返回字符串 s 中所有字符都转换为小写后的结果。
t = "HeLLo, wORLd!"
lowercase = t.lower()  # lowercase == "hello, world!"
 
# s.upper() 返回字符串 s 中所有字符都转换为大写后的结果。
u = "HeLLo, wORLd!"
uppercase = u.upper()  # uppercase == "HELLO, WORLD!"
 
# s.strip() 返回字符串 s 中前导空格和尾随空格都已删除的结果。
v = "    hello, world!    "
stripped = v.strip()  # stripped == "hello, world!"
 
# s.isalpha() 如果字符串 s 中只包含字母,则返回 True;否则返回 False。
w = "hello"
is_alpha = w.isalpha()  # is_alpha == True
 
# s.isdigit() 如果字符串 s 中只包含数字,则返回 True;否则返回 False。
x = "123"
is_digit = x.isdigit()  # is_digit == True
 
# s.replace(old, new) 返回字符串 s 中所有的 old 字符都被替换为 new 字符后的结果。
y = "hello, world!"
replaced = y.replace("world", "everyone")  # replaced == "hello, everyone!"
 
# s.find(sub) 返回字符串 s 中第一次出现子字符串 sub 的位置,如果找不到,则返回 -1。
z = "hello, world!"
index = z.find("world")  # index == 7
 
# s.index(sub) 与 find() 方法类似,但如果找不到子字符串 sub,则会引发 ValueError 异常。
a = "hello, world!"
index = a.index("world")  # index == 7
 
# s.split(sep) 使用分隔符 sep 将字符串 s 分割成多个子字符串,并将结果以列表的形式返回。
b = "hello, world!"
split = b.split(",")  # split == ["hello", " world!"]
 
# s.join(iterable) 将字符串 s 作为分隔符,将可迭代对象中的所有元素连接起来,并返回连接后的字符串。
c = ["hello", "world"]
joined = "-".join(c)  # joined == "hello-world"
 
# s.format(*args, **kwargs) 使用 `{}` 和 `{}` 格式化字符串 s 中的占位符,并使用可变参数或关键字参数提供的值替换占位符。
d = "Hello, {0}! You are {1} years old."
formatted = d.format("Alice", 30)  # formatted == "Hello, Alice! You are 30 years old."
 
# s.encode(encoding, errors='strict') 将字符串 s 编码为指定编码方式的字节序列,并返回编码后的字节序列。
e = "hello, world!"
encoded = e.encode("utf-8")  # encoded == b'hello, world!'

总结

在 Python 中,字符串(String)类型用于表示文本,是语言中最常用的数据类型之一。开发人员使用字符串执行各种任务,包括用户输入、文件输入/输出和数据处理。

开发人员可以使用各种 Python 的内置方法进行字符串操作,例如执行搜索、替换和格式化等任务。此外,字符串可以使用 + 运算符进行连接,并且可以使用索引和切片来提取特定字符或子字符串。

总体而言,字符串类型是 Python 的基本组成部分,它会在各种编程中被广泛使用。