【Python】python深拷贝和浅拷贝(二)
前言
上一期我们介绍了Python中深拷贝和浅拷贝的定义以及它们在执行过程中内存结构,同时也给出了深拷贝和浅拷贝的方法。(没有看上一期的朋友看这里,python深拷贝和浅拷贝(一))这一期我们将介绍一下在Python中自定义类型该如何控制深拷贝和前拷贝的行为。
自定义浅拷贝行为
上一期我们介绍了进行一个对象的潜拷贝需要调用copy库中的copy
方法。在代码底层会经历5个步骤:
- 获取对象的类,这一点可以理解为调用
__class__
魔术方法; - 在已有的【_copy_dispatch】中获取现有的copier;
- 如果在【_copy_dispatch】中没有现有的copier,那么先判断他是否是元类(MetaClass)创建的对象,即类(Class),如果是则调用
_copy_immutable
方法,处理方式和不可变对象一致; - 如果上述copier都是None,则检查对象的
__copy__
方法,如果存在该方法则调用该方法; - 使用序列化的方式进行拷贝…
现在定义一个空类并调用copy
方法,看看会发生什么:
class A:def __init__(self) -> None:self.product_list = [1, 2, 3, 4]self.dict = {1: 'a', 2: 'b'}a = A()
a_copier = copy(a)
print(id(a.list), id(a_copier.list))
print(id(a.dict), id(a_copier.dict))
从上图可以看到,如果没有定义相关拷贝方法,使用copy
方法对自定义类的对象进行拷贝将会直接执行步骤5。
从程序的运行结果可以看到复制的对象和原始对象的内存位置不同,但是内部元素地址都是相同的,也就是说如果不实现__copy__
魔术方法,那么他的行为和其他内置对象例如列表的浅拷贝行为一致,这种策略符合了python对浅拷贝的定义。
浅拷贝:构造一个新的对象,尽可能的将原始对象中的所有找到的对象引用加入到新构造的对象中;
如果想要控制对象浅拷贝的行为,需要在类中实现__copy__
魔术方法,现在重新写一个类:
class A(object):def __init__(self):self.list = [1, 2, 3, 4]self.set = {1, 2, 3, 4}self.dict = {1: 'a', 2: 'b', 3: 'c'}def __copy__(self):print("进行浅拷贝")cls = self.__class__result = cls.__new__(cls)result.__dict__ = {k: v for k, v in self.__dict__.items()}return resulta = A()
a_copied = copy(a)
print(id(a), id(a_copied))
print(id(a.list), id(a_copied.list))
print(id(a.set), id(a_copied.set))
print(id(a.dict), id(a_copied.dict))
我们在A这个类中重写了__copy__
方法,此时浅拷贝有三个步骤
- 通过
__class__
方法获取对象的类(class); - 通过调用
__new__
方法创建了一个新对象; - 将被拷贝对象的
__dict__
属性通过字典推导式赋予新对象的__dict__
属性;
从程序结果看,a和a_copied已经是两个对象了,但是它们内部的属性依旧是指向同一个子对象。
自定义深拷贝行为
上一期介绍到想要进行深拷贝需要调用copy库中的deepcopy
方法。在代码底层和copy
方法一致,只不过是从【_deepcopy_dispatch】和【dispatch_table】中获取相应的拷贝方法对象,下面的代码以【list】对象的深拷贝为例进行介绍:
def _deepcopy_list(x, memo, deepcopy=deepcopy):y = []memo[id(x)] = yappend = y.appendfor a in x:append(deepcopy(a, memo))return y
列表的深拷贝就是嵌套的对列表中每一个元素进行深拷贝,同时采用memo这个字典对象进行记录。符合Python对深拷贝的定义。
深拷贝:构造一个新的对象,然后递归的在原始对象中将找到的对象的副本插入其中。
接下来将会以画图的方式以一个列表做对象进行演示
from copy import copy, deepcopy
list1 = [1, 2, [3, 4]]
list1_deepcopied = deepcopy(list1)
深拷贝完毕之后【list1】和【list1_deepcopied】的内存分布如下:
最后如果想要控制对象深拷贝的行为,需要重写__deepcopy__
方法,以浅拷贝的类为例:
class A(object):def __init__(self):self.list = [1, 2, 3, 4]self.set = {1, 2, 3, 4}self.dict = {1: 'a', 2: 'b', 3: 'c'}def __copy__(self):print("进行浅拷贝")cls = self.__class__result = cls.__new__(cls)result.__dict__ = {k: v for k, v in self.__dict__.items()}return resultdef __deepcopy__(self, memo):print("进行深拷贝")cls = self.__class__result = cls.__new__(cls)memo[id(self)] = resultfor k, v in self.__dict__.items():setattr(result, k, deepcopy(v, memo))return resulta = A()
a_copied = deepcopy(a)
print(id(a), id(a_copied))
print(id(a.list), id(a_copied.list))
print(id(a.set), id(a_copied.set))
print(id(a.dict), id(a_copied.dict))
基本步骤和浅拷贝基本一致,需要注意的点如下:
- 定义一个memo字典放置循环引用的无限复制;
- 通过被拷贝对象的
__dict__
属性递归进行新对象的属性设置,本质还是对所有子对象都进行深拷贝。
运行结果如下,可以看到所有的子对象地址都不再相同。
如果我们查看【list】属性的0号元素,可以发现他们的地址是相同的,具体原因可以看上一期源码分析,针对整数、字符串这种不可变类型,copier的处理方式都是直接将原始对象引用直接返回。
print(id(a.list[0]), id(a_copied.list[0]))