Python中的 `!=`与`is not`不同
2020-02-09
翻译:老齐
与本文内容配套的图书:《跟老齐学Python:轻松入门》《Python大学实用教程》,各大电商平台有售。
Python中的is
和==
是不一样的。使用is
可以比较数字,代码也正常运行。也有人说is
比==
要更快,或者你可能觉得它看起来更像Python。然而,重要的是要记住这些运算符的行为并不完全相同。
==
用于比较两个对象的值是否相等,而is
检查两个变量是否指向内存中的同一个对象。在大多数情况下,这意味着你应该使用==
和!=
,除非与None
进行比较。
在本文中,你将学习:
- 对象相等和同一性的区别是什么
- 何时使用
==
和is
比较对象 - 这些Python运算符的原理是什么
- 为什么使用
is
和is not
比较值会导致意外 - 如何编写自定义的
__eq__()
类方法来定义相等运算符行为
介绍is
和is not
的应用
is
和is not
用来比较两个对象。在CPython中,比较的是对象的内存地址。Python中的一切都是对象,每个对象都存储在特定的内存位置, is
和is not
‘检查两个变量是否引用内存中的同一个对象。
注意: 记住,具有相同值的对象可能存储在不同的内存地址中。
你可以使用id()
来检查一个对象的内存地址:
1 | >>> help(id) |
最后一行显示存储内置函数id
本身的内存地址。
通常,具有相同值的对象在默认情况下具有相同的id。例如,数字-5到256在CPython中被保存,每个数字都存储在内存中单一且固定的位置,这为常用整数节省了内存。
你可以使用sys.intern()
来保存字符串以提高性能,此函数允许你比较它们的内存地址,而不是对字符串里的字符进行逐个比较:
1 | >>> from sys import intern |
变量a
和b
最初指向内存中的两个不同对象,如它们的不同id所示。使用intern
后,a
和b
则指向内存中的同一对象。在原来的操作中,两个'hello world'
分别在新的内存位置创建对象,但是,对同样的字符串执行intern
后,后面所创建的字符串所指向的内存地址与第一个'hello world'
的内存地址相同。
注意:即使对象的内存地址在任何给定的时间都是唯一的,但这个内存地址在同一代码的不同运行过程中是不同的,并且取决于CPython的版本和运行代码的计算机。
默认情况下,具有intern
效果的对象是None
、True
、False
和简单字符串。请记住,大多数情况下,具有相同值的不同对象将存储在不同的内存地址中,这意味着你不应该使用is
来比较值。
存储整数
Python将常用的值(例如,整数-5到256)默认保存在内存中,从而节省内存开支。下面的代码向你展示了为什么只有一些整数具有固定的内存地址:
1 | >>> a = 256 |
最初,a
和b
引用内存中的同一个存储对象,但当它们的值超出常用整数的范围(从-5到256)时,它们就存储在不同的内存地址中。
当多个变量引用同一对象时
用赋值运算符(=
)使一个变量等于另一个变量时,可以使这些变量指向内存中的同一对象。这可能会导致可变对象出现意外行为:
1 | >>> a = [1, 2, 3] |
刚才发生了什么? 你向a
添加了一个新元素,但是现在b
也包含了这个元素! 在b = a
这一行,设置b指向与a相同的内存地址,这样两个变量就都引用相同的对象。
如果你独立地定义这些列表,那么它们就被存储在不同的内存地址中,并独立地运行:
1 | >>> a = [1, 2, 3] |
因为a
和b
现在引用内存中的不同对象,所以更改一个对象不会影响另一个对象。
用==
和!=
比较对象
回想一下,具有相同值的对象通常存储在不同的内存地址中。如果要检查两个对象是否具有相同的值,而不管它们存储在内存中的位置,使用运算符=
和!=
。在绝大多数情况下,这就是你想做的。
当对象副本相等但不相同时
在下面的示例中,b
是a
的副本(a
是可变对象,如列表或字典)。两个变量都有相同的值,但它们将各自存储在不同的内存地址:
1 | >>> a = [1, 2, 3] |
a
和 b
现在存储在不同的内存地址,因此a is b
不再返回True。但是,a==b
返回True,因为两个对象具有相同的值。
相等比较如何起作用
==
的魔力体现在该符号左边对象所具有的__eq__()
方法中。
这是一个神奇的类方法,每当这个类的一个实例与另一个对象进行比较时都会调用它。如果未实现此方法,则默认情况下==
比较两个对象的内存地址。
作为练习,创建一个继承str
的SillyString
类并实现__eq__()
,以比较此字符串的长度是否与另一个对象的长度相同:
1 | class SillyString(str): |
现在,用'hello world'
创建的SillyString实例应该等于用'world hello'
创建的实例,甚至等于长度相同的任何其他对象:
1 | >>> # Compare two strings |
当然,对于一个字符串形式的对象来说,这是愚蠢的行为,但它确实说明了当你使用==
比较两个对象时会发生什么。对于!=
,则是通过实现特定的__ne__()
方法,给出逆响应。
上面的示例还清楚地向你展示了为什么更好的做法是用 is
来比较None
,而不是使用==
运算符。is
比较的是内存地址,所以它不仅更快,而且更安全,因为它不依赖于任何__eq__()
方法的逻辑。
比较的比较
根据经验,你应该常用==
和!=
,除非与None
进行比较:
- 使用
==
和!=
比较对象的相等性。这里,你通常比较两个对象的值。如果要比较两个对象是否具有相同的内容,而不关心它们存储在内存中的位置,则需要下面的做法。 - 如果要比较对象的唯一标识,请使用
is
和is not
。这里,你要比较两个变量是否指向内存中的同一个对象。这些运算符的主要用例是与None进行比较。与使用类方法相比,按内存地址与None进行比较更快、更安全。
具有相同值的变量通常存储在不同的内存地址中,这意味着你应该使用==
和!=
来比较他们的值。只有当你想检查两个变量是否指向同一个内存地址时,才使用is
和is not
。
结论
在本文中,你了解了==
和!=
比较两个对象的值,而is
和is not
比较两个变量是否引用内存中的同一个对象。如果你牢记这一区别,那么应该能够防止代码中出现意外行为。
你还可以看看如何使用sys.intern()
来优化字符串的内存使用和比较,尽管Python可能已经在幕后自动为你处理了这一问题。
现在你已经了解了两种比较的幕后操作,可以尝试编写自己的__eq__()
方法,这些方法定义了在使用==
运算符时如何比较该类的实例。去应用关于Python比较运算符的这些新知识吧!
若你觉得我的文章对你有帮助,欢迎点击上方按钮对我打赏
关注微信公众号,读文章、听课程,提升技能