- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

python对象下的可变类型与不可变类型

~大鱼~ 发表于 2021/05/27 18:02:01 2021/05/27

【摘要】前言 python对象对于修改这个行为，大家的操作方式都是不一样的。有些对象是可变类型，所以他就可以直接修改。其它的都是不可变类型，那我们要修改他时怎么办呢，这个时候就新生成的一个对象，然后将变量名指向这个新对象，修改动作就完成了。关于可变类型与不可变类型的一个特点，我们可以先看看一段奇怪的代码 In [1]: a = 'a' In [2]: b = 'a' I...

前言

python对象对于修改这个行为，大家的操作方式都是不一样的。有些对象是可变类型，所以他就可以直接修改。其它的都是不可变类型，那我们要修改他时怎么办呢，这个时候就新生成的一个对象，然后将变量名指向这个新对象，修改动作就完成了。关于可变类型与不可变类型的一个特点，我们可以先看看一段奇怪的代码

In [1]: a = 'a' In [2]: b = 'a' In [3]: a is b Out[3]: True In [4]: a == b Out[4]: True In [5]: c = [1] In [6]: d = [1] In [7]: c is d Out[7]: False In [8]: c == d Out[8]: True

In [1]: a = 'a'

In [2]: b = 'a'

In [3]: a is b

Out[3]: True

In [4]: a == b

Out[4]: True

In [5]: c = [1]

In [6]: d = [1]

In [7]: c is d

Out[7]: False

In [8]: c == d

Out[8]: True

你有没有觉得，a b 明明都是不同的对象，但是使用a is b 的时候竟然返回了true ，这里面就会深入到对象的别名，标识与相等性，先说回到可变类型与不可变类型

区分类型?有这个必要吗?

当然是显然的，虽然我们在实际的工程环节都会围绕整体的业务问题，很少去了解底层的原理，但是我们一旦涉及到优化，涉及到底层的时候就很有必要了解技术细节。举个例子，如何高效的拼接字符串，我想下面的代码大部分人都写过，包括我

In [13]: str_build = '' In [14]: for p in 'aaabbbccc': ...: str_build = str_build + p

In [13]: str_build = ''

In [14]: for p in 'aaabbbccc':

...: str_build = str_build + p

事实上，这样的效率并不是很高。如上所言，我们知道str 是不可变类型，我们在拼接字符串的时候，实际上是生成了一个新的对象，然后在变量名指向他，随着拼接的次数越来越多，我们生成对象的操作次数也会越来越多，这样就很没有这个必要(C# 里面的StringBuilder 就是为了解决字符串拼接的)，那有效率的写法是怎样的呢

builder_list = [] for data in container: builder_list.append(str(data)) "".join(builder_list) ### Another way is to use a list comprehension "".join([str(data) for data in container]) ### or use the map function "".join(map(str, container))

builder_list = []

for data in container:

builder_list.append(str(data))

"".join(builder_list)

### Another way is to use a list comprehension

"".join([str(data) for data in container])

### or use the map function

"".join(map(str, container))

我们通过使用列表，可以轻松的在本身对象的基础上修改内容，不会生成新对象来处理操作，这样就会节省内存
另外的一个我们会遇到关于可变类型的一个坑

def my_function(param=[]): param.append("thing") return param my_function() # returns ["thing"] my_function() # returns ["thing", "thing"]

def my_function(param=[]):

param.append("thing")

return param

my_function() # returns ["thing"]

my_function() # returns ["thing", "thing"]

你会不会觉得，我去，不管我调用多少次，这丫不是应该就返回一个[‘thing’]回来吗？但是事实上你也看到了，因为可变对象一直都会引用同一段内容，我们在操作列表的时候都会对同一个列表操作，比如我们在函数体里面操作了一个set ,list ,或者 dict ，虽然我们没有返回内容，但是外部的内容还是会变的，所以我们要记得，不要给可变对象做为参数的时候加上默认值！

def my_function2(param=None): if param is None: param = [] param.append("thing") return param

def my_function2(param=None):

if param is None:

param = []

param.append("thing")

return param

结论

正确的区分可变类型与不可变类型，对于我们深入了解python是非常有帮助的，更多的关注技术细节，才能更好的拔高我们的技术水平

番外

我们在前言里面有提到的那个奇怪的问题，很显然，那是共享了字符串的字面量，这种Cpython里面一个优化策略，叫驻留(interning).CPython 还会在小的整数上使用这个优化措施，防止重复的创建”热门“数字，比如0，-1，和42等等，但是CPython不会驻留所有的字符串和整数。比如如下的代码

In [5]: c = 1 In [6]: d = 1 In [7]: id(c) Out[7]: 4297514912 In [8]: id(d) Out[8]: 4297514912 In [9]: e = 22569 In [10]: f = 22569 In [11]: e is f Out[11]: False In [12]: c is d Out[12]: True

In [5]: c = 1

In [6]: d = 1

In [7]: id(c)

Out[7]: 4297514912

In [8]: id(d)

Out[8]: 4297514912

In [9]: e = 22569

In [10]: f = 22569

In [11]: e is f

Out[11]: False

In [12]: c is d

Out[12]: True

所以千万不要依赖字符串或者整数的驻留！比较字符串或者整数是否相等的时，应该使用== 而不是is. 驻留是python 解释器内部使用的一个特性。

文章来源: brucedone.com，作者：大鱼的鱼塘，版权归原作者所有，如需转载，请联系作者。

原文链接：brucedone.com/archives/1085

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

python对象下的可变类型与不可变类型

前言

分类

不可变类型

可变类型

区分类型?有这个必要吗?

结论

番外

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

python对象下的可变类型与不可变类型

前言

分类

不可变类型

可变类型

区分类型?有这个必要吗?

结论

番外

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品