Python的数据类型

数值（Numbers）
字符串（String）
元组（Tuple）
列表（List）
集合（Set）
字典（Dictionary）
……
其他数据类型
- 字节类型（Bytes）：b’Hello’
- 字节数组（Byte Arrays）： bytearray(b’Hello’)
- 空类型（None）：没有返回的函数值
- 未执行的（NotImplemented）：在运算时，对象不支持，返回该值
- 省略号（Ellipsis）：用于Numpy的切片或者表示无限循环

Python数据类型-数值型

Python数值型介绍

整型（int）：123
布尔型（bool）：False(0)、True(1)
浮点型（float）：123.04
复数型（complex）：3 + 7j、real + imagj

复数的一些常见应用场景包括：

工程学：在电气工程中，复数用于分析交流电路，其中电压和电流随时间变化。复数使得可以轻松地处理电路中的电阻、电感、电容和它们的相位关系。
物理学：在量子力学中，波函数通常是复数。复数用于描述粒子的位置和动量等物理量。
数学：在纯数学中，复数用于解决不能在实数域内解决的问题，如在复平面上分析多项式方程的根。
信号处理：在数字信号处理中，复数用于表示频率和相位信息，以及进行傅里叶变换等操作。
计算机图形学：复数可以用于计算二维图形的旋转和平移。
其中的虚部j表示乘以根号下-1（即虚数单位），这意味着这个复数在复平面上距离原点3个单位向右（实部），4个单位向上（虚部）。

对象由identity、type和value标识

a = 
b = 
c = 
d = 
print(id(a), type(a), a)
print(id(b), type(b), b)
print(id(c), type(c), c)
print(id(d), type(d), d)

Python整数的存储

在内存中，变量存放到栈区，相对应的数据存放到常量区或堆区。

整型有一个“小整数池”（small integer pool）

这个区域是为了快速访问和存储小整数而设计的，它是一个固定的范围，用于缓存频繁使用的小整数。
整型的缓存区范围通常为[-5,256]
不同版本的python范围可能稍有不同

如果变量值是整数且不在“小整数池”的范围呢？如果是浮点型、布尔型或复数型呢？
新创建的变量和原来的id还会一样吗？

x = 10 + 9j
y = 10 + 9j
print(id(x))
print(id(y))
# del x
# del y
q = 10 + 9j
print(id(q))

def ppoi():
    x = 980 + 23j
    y = 980 + 23j
    print(id(x))
    print(id(y))
    del x
    del y
    q = 980 + 23j
    print(id(q))
    
ppoi()

def ppoi():
    x = 287
    y = 287
    print(id(x))
    print(id(y))
#     del x
#     del y
    
def ppo():
    q = 287
    print(id(q))
    
ppoi()
ppo()

Python的交互模式下，一行一行执行代码

不会检查内存中是否存在相同的变量值，所以相同的变量值也可能会出现id值不同。

若在同一个代码块中

首先检查内存中是否存在当前变量值，若存在则直接指向；若不存在会重新分配空间。

总结：

常量区的数据范围为[-5,256]，此区域内的数据有驻留机制
堆区的数据：在一个代码块中，数据的地址会暂时存储不被垃圾回收；不同代码块则会重新分配

类型转换函数（类似构造函数）

int() int()函数主要用于将一个值转换为整数
- 浮点数转换时，向下取整。
- 布尔值转换时，True对应1，False对应0。
- 复数只有当虚数部分为0时才能转换，例如3+0j。
- 参数为字符串时，字符串内容必须为整数值。
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  f1 = float(120)
  print(f1)
  f2 = float(True)
  print(f2)
  f3 = float('120')
  print(f3)
  f4 = float('Infinity')#无穷大
  print(f4)
  f5 = float('NaN')
  print(f5)
bool()
float()

complex()

#布尔类型
b1 = bool(0) # 0和1
print(b1)
b2 = bool(98)# 'xyz123'
print(b2)

#复数类型
c1 = complex(3, 5)
print(c1)

一些问题

1.整型之间进行（加,减,乘,除,取余,幂次）运算，最后得到的是整型吗？

2.浮点型之间进行（加,减,乘,除,取余,幂次）运算，最后得到的是浮点型吗?

3.布尔型变量之间可以进行布尔运算，整型和浮点型变量之间可以吗？
4.复数型的实部和虚部具体是什么数据类型？

Python数据类型-字符串

Python字符串介绍

字符串是什么？

字符串是一种以Unicode编码的序列，是一种 有顺序 的 不可变 的序列。 Unicode 规范https://www.unicode.org/ 旨在罗列人类语言所用到的所有字符，并赋予每个字符唯一的编码。该规范一直在进行修订和更新，不断加入新的语种和符号。

字符串的创建

用单引号、双引号或三引号包围起来创建字符串。

单引号受限制的情况下，需要用双引号或三引号

#单引号受限制的情况,字符串中包含单引号
# str1 = 'He's a good boy.'

#改成双引号：

message = "He's a good boy."
print(message)
#改成三引号：三引号（''' 或 """）可以用来定义多行字符串，
# 也可以用来避免单引号和双引号的冲突
message = """He's a "good" boy."""
print(message)

#长字符串中间有换行的可以用三引号
word = '''Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.'''

字符串中包含双引号则可以用单引号包围
如下情况必须使用三引号
- 字符串中既包含单引号又包含双引号时
- 作为文档字符串时
- 定义多行字符串时

#1. 例如"It's my book."、    "hello'p'ython"、    "o'"
str4 = '''"It's my book."''' 
print(str4)

#2. 在Python中，函数、类的开头可以包含一个文档字符串，用于说明代码的用途和行为。
def my_function():
    """这是一个文档字符串，用三引号包围，用于解释函数的用途。"""
    pass
#3. 多行的字符串：黄河之水天上来，奔流到海不复回。
str5 = """黄河之水天上来，
奔流到海不复回。"""
print(str5)

用类型构造函数str()创建字符串

#数值型转化为字符串
a = 123
print(a, type(a))

str6 = str(a)
print(str6, type(str6))

转义字符

以\开头的字符叫转义字符，通过转义字符可以正确表示具有二义性的字符或无法显示的控制字符。例如：It's my book.中的'既是普通字符又是标识字符串的符号。
在'前加上\，可以使字符仅作为普通字符出现，避免二义性。

1
2
3

#打印字符串"Let's go!"
print('"Let\'s go!"')
print("\"Let's go!\"")

常用的转义字符：

\n（换行符）
\t（Tab制表符）
\r（回车）
\'（单引号）
\"（双引号）
\\（反斜线）

PEP8规范建议：
为了增加代码的可读性，对于字符串内部的引号，尽量使用与内部不同的引号标识字符串，而不是使用转义字符。

如果不想让转义字符生效，怎么办？

1
2
3

#在字符串前面加r或R
print(r'D:\thedir\one\now')
print(R'D:\thedir\two\now')

字符串的索引和切片

1.通过索引获取字符串中的元素

正索引：元素位置（下标）从左往右从0开始，依次递增。
负索引：元素位置（下标）从右往左从-1开始，依次递减。

2.切片是一种高级索引

切片可以灵活获取字符串的多个元素

#切片操作尝试
s = "string"
s[1:3]
#字符串的切片操作
s = "string"
#步长为正数的情况：
print(s[::2])
#步长为负数的情况：
print(s[1::-1])

切片的定义：
切片是用于截取索引片段获得序列中元素的方法。

切片的表示形式：
sequence[start : end : step]
start→起始索引值，省略时代表索引值为0；
end→结束索引值（不包含在内），省略时代表索引值为end+1；

step→步长，两个相邻元素间的步长为1，步长为1时可省略。步长为负数时，反转序列。 step的两个重要功能：

跳过某些元素
反转序列

注意： 字符串是不可变的，不能用索引和切片给字符串重新赋值。

索引和切片总结：

索引只能获取单个元素，切片可以获取多个元素。
切片适用于所有序列，不仅仅是字符串。
字符串不可变，不能用索引或切片给字符串重新赋值。

字符串的拼接

用 + 拼接
用 * 拼接
格式化拼接 %
格式化拼接 format()
格式化拼接 f-string（Python 3.6及更高版本）
join()方法

#用+拼接两个字符串
str1 = "hello"
str2 = "你好"
str3 = str1 + str2
print(str3)

#重复操作符（`*`）：用于将字符串重复指定次数
str0 = 's+'
str1 = str0 * 20
print('str1:',str1)

str2 = str0 * -2
print('str2:',str2)

#格式化拼接
name = 'Mary'
city = 'New York'
age = 'thirty years old'
#%
letter = 'My name is %s, and I come from %s' % (name, city) 
print(letter)
#format()
answer = 'Hi,{}, I also come from {}'.format(name, city)
print(answer)
#f-string
message = f"Her name is {name}, and she is {age} years old."
print(message)

format()更多用法：

print("My name is {1} and I am {0} years old.".format(age, name)) #位置索引占位符
print("My name is {name} and I am {age} years old.".format(name=name, age=age)) #指定变量名
print("The value of pi is approximately {:.2f}.".format(num)) #格式化数字： {:,}千位符

join()的语法格式：

1	str.join(iterable)

其中str是分隔符，用于连接iterable中的元素。

str.join(iterable)

s = ' '  #使用空格做分隔符
say1 = ('长路', '漫漫', ',', '其修', '远兮')#['长路', '漫漫', '，', '其修', '远兮'] 
say2 = s.join(say1)
print(say2)

def re(str1, str2):
    str1 = str1[::-1]
    str2 = str2[::-1]
#     s0 = 'Reverse:' + str1 + ' ' + str2    #用+拼接

#     s1 = ' '.join((str1, str2))
#     ss1 = 'Reverse:' + s1         #用join拼接法
    
    #格式化拼接方法：
    
#     return f'Reverse:{str1} {str2}'   
#     return 'Reverse:%s %s' % (str1, str2)
#     return 'Reverse:{} {}'.format(str1, str2)

    return ss1

aa = re('one','two')

总结：

+拼接方法，常用于字符串变量之间的相加。
格式化拼接方法，代码具有可读性和可维护性。
join()方法，适用于拼接的字符串较多时。

成员关系操作符（in、not in）

成员关系运算符用来判断一个字符串是否包含在另一个字符串中。

v_str = 'water.tif, app.jpg, wechat.png, google.gif, football.jfif'
# print('.psd' in v_str)
# print('.psd' not in v_str)

#空字符串呢？
print('' not in v_str)
print('' in v_str)

字符串对象的常用方法

- 字符串类型判断

s.isnumeric() #是否只包含数字字符
s.isalpha()  #是否全为字母
s.islower()  #字母是否全为小写
s.isupper()  #字母是否全为大写

字符串大小写转换

s.lower()  #转为小写
s.upper()  #转为大写
s.swapcase()  #大小写呼唤
s.capitalize() #在整个字符串中首字母大写，其余小写
s.title()  #对每个字符串中的单词而言

字符串拆分、组合及去空格

split(sep=None, maxsplit=-1) #按sep（默认为空格）分割字符串，maxsplit是分割的最大次数，返回列表。
strip()     #移除两端空格或指定字符
lstrip()    #移除左端空格或指定字符
rstrip()    #移除右端空格或指定字符

# 函数接收一个任意字符串s，要求删除两侧的空白字符，把字符串中连续多个空格替换为1个空格，返回处理后的新字符串。例如，s为'a    bb   c '时返回'a bb c'。
def stri(s):
    s = s.strip()
    s = s.split()
    s = ' '.join(s)
    return s

s = 'a   bb   c  '
s1 = stri(s)
s1

字符串的查找和替换

s.find()     #查找指定字符串n，返回n的起始下标，没有则返回-1
s.replace(old, new) #替换字符串中的指定子串,old为旧子串，new为新子串。

enumerate(iterable)   #返回字符串元素的索引和对应的元素值,常用于for循环中

# 函数接收一个表示日期时间的字符串s，格式为'2020-02-18 22:02:22'，要求删除每一部分的前导0，返回格式为'2020-2-18 22:2:22'的字符串。不能导入任何模块，注意年月日和时分秒之间有且只有一个空格。


def main(s):

    # 分割年月日和时分秒
    date_part, time_part = s.split()

    # 处理年月日部分
    year, month, day = map(int, date_part.split('-'))
    date_formatted = f'{year}-{month}-{day}'

    # 处理时分秒部分
    hour, minute, second = map(int, time_part.split(':'))
    time_formatted = f'{hour}:{minute}:{second}'

    # 输出格式化后的字符串
    result = f'{date_formatted} {time_formatted}'
    print(result)

# 调用主函数
s = '2020-02-18 22:02:22'
ss = main(s)