python堆栈内存_【python测试开发栈】—python内存管理机制（二）—垃圾回收

作者：xiashi | 来源：互联网 | 2023-09-13 18:08

在上一篇文章中(python内存管理机制—引用计数)中，我们介绍了python内存管理机制中的引用计数，python正是通过它来有效的管理内存。今天来介

在上一篇文章中(python 内存管理机制—引用计数)中&＃xff0c;我们介绍了python内存管理机制中的引用计数&＃xff0c;python正是通过它来有效的管理内存。今天来介绍python的垃圾回收&＃xff0c;其主要策略是引用计数为主&＃xff0c;标记-清除和分代回收为辅助的策略(熟悉java的同学回回忆下&＃xff0c;其实这和JVM的策略是有类似之处的)。

引用计数垃圾回收

我们还接着上一篇文章来接着介绍引用计数的相关场景&＃xff0c;方便我们来理解python如何通过引用计数来进行垃圾回收。其实通过字面意思&＃xff0c;我们应该也不难理解&＃xff0c;当一个对象的引用计数变为0时&＃xff0c;表示没有对象再使用这个对象&＃xff0c;相当于这个对象变成了无用的"垃圾"&＃xff0c;当python解释器扫描到这个对象时就可以将其回收掉。

我们通过一些例子来看下&＃xff0c;可以使python对象的引用计数增加或减少的场景&＃xff1a;

# coding&＃61;utf-8

"""

~~~~~~~~~~~~~~~~~

&＃64;Author&＃xff1a;xuanke

&＃64;contact: 784876810&＃64;qq.com

&＃64;date: 2019-11-29 19:52

&＃64;function: 验证引用计数增加和减少的场景

"""

import sys

def ref_method(str):

print(sys.getrefcount(str))

print("我调用了{}".format(str))

print(&＃39;方法执行完了&＃39;)

def ref_count():

# 引用计数增加的场景

print(&＃39;测试引用计数增加&＃39;)

a &＃61; &＃39;ABC&＃39;

print(sys.getrefcount(a))

b &＃61; a

print(sys.getrefcount(a))

ref_method(a)

print(sys.getrefcount(a))

c &＃61; [1, a, &＃39;abc&＃39;]

print(sys.getrefcount(a))

# 引用计数减少的场景

print(&＃39;测试引用计数减少&＃39;)

del b

print(sys.getrefcount(a))

c.remove(a)

print(sys.getrefcount(a))

del c

print(sys.getrefcount(a))

a &＃61; 783

print(sys.getrefcount(a))

if __name__ &＃61;&＃61; &＃39;__main__&＃39;:

ref_count()

运行结果如下&＃xff1a;

测试引用计数增加

我调用了ABC

方法执行完了

测试引用计数减少

从上面的结果我们得出以下结论&＃xff1a;

引用计数增加的场景&＃xff1a;

对象被创建并赋值给某个变量&＃xff0c;比如&＃xff1a; a &＃61; &＃39;ABC&＃39;

变量间的相互引用(相当于变量指向了同一个对象)&＃xff0c;比如&＃xff1a;b&＃61;a

变量作为参数传到函数中。比如&＃xff1a;ref_method(a)&＃xff0c;其实上一篇文章&＃xff0c;我们也提过调用getrefcount会使引用计数增加。

将对象放到某个容器对象中(列表、元组、字典)。比如&＃xff1a;c &＃61; [1, a, &＃39;abc&＃39;]

引用计数减少的场景&＃xff1a;

当一个变量离开了作用域&＃xff0c;比如&＃xff1a;函数执行完成时&＃xff0c;上面的运行结果中&＃xff0c;不知道大家发现没&＃xff0c;执行方法前后的引用计数保持不变&＃xff0c;这就是因为方法执行完后&＃xff0c;对象的引用计数也会减少&＃xff0c;如果在方法内打印&＃xff0c;则能看到引用计数增加的效果。

对象的引用变量被销毁时&＃xff0c;比如del a 或者 del b。注意如果del a&＃xff0c;再去获取a的引用计数会直接报错。

对象被从容器对象中移除&＃xff0c;比如&＃xff1a;c.remove(a)

直接将整个容器销毁&＃xff0c;比如&＃xff1a; del c

对象的引用被赋值给其他对象&＃xff0c;相当于变量不指向之前的对象&＃xff0c;而是指向了一个新的对象&＃xff0c;这种情况&＃xff0c;引用计数肯定会发生改变。(排除两个对象默认引用计一致的场景)。

引用计数虽然可以实时的知道某个对象是否可以被回收&＃xff0c;但是也有两个缺点&＃xff1a;

需要额外的空间维护引用计数。

遇到有循环引用的对象&＃xff0c;无法有效处理。所谓循环引用就是比如&＃xff1a;对象A引用了对象B&＃xff0c;而对象B又引用了对象A&＃xff0c;造成它们两个引用计数都不能减少到0 &＃xff0c;因此不能被回收。

标记-回收垃圾回收

为了解决引用计数法无法解决的循环引用问题&＃xff0c;python采用了标记-回收垃圾回收算法&＃xff0c;它的整个过程分为两步&＃xff1a;

标记&＃xff1a; 遍历所有的对象&＃xff0c;如果是可达的(reachable)&＃xff0c;也就是还有对象正引用它&＃xff0c;那么就标记该对象为可达&＃xff1b;

清除&＃xff1a; 再次遍历所有的对象&＃xff0c;如果某个对象没有被标记为可达&＃xff0c;则将其回收掉。

需要注意的是在python中可以产生循环引用问题的可能是&＃xff1a;列表、字典、用户自定义类的对象、元组等对象&＃xff0c;而对于数字字符串这种简单的数据类型&＃xff0c;并不会产生循环引用&＃xff0c;因此后者并不在标记清除算法的考虑之列。

针对标记-回收垃圾回收的过程&＃xff0c;我从网上找了几张图片&＃xff0c;方便大家来了解整个过程&＃xff1a;

第一张图是初始状态&＃xff0c;图片上不仅有ref_count&＃xff0c;还有一个gc_ref的值&＃xff0c;这个gc_ref其实就是为了来解决引用计数问题的&＃xff0c;它是ref_count的一个副本&＃xff0c;所以它的初始值和ref_count保持一致。当开始遍历所有对象时&＃xff0c;当发现link1引用了link2对象时&＃xff0c;会将link2的gc_ref值减少1&＃xff0c;如此类推&＃xff0c;就得到下图的结果。

第二张图中我们看到link2、link3、link4的gc_ref都已经为0&＃xff0c;当python垃圾回收器再次扫描所有对象时&＃xff0c;那么它们就会被标记为GC_TENTATIVELY_UNREACHABLE&＃xff0c;同时被移到Unreachable列表中。有同学可能会疑惑为啥link2没有被移到Unreachable列表中&＃xff0c;其实它理论上也应该被移到Unreachable列表中&＃xff0c;如第三张图所示&＃xff1a;

如果python垃圾回收器再次扫描对象时&＃xff0c;发现某个对象的ref_count不为0&＃xff0c;那么就会将其标记为GC_REACHABLE&＃xff0c;表示还正在被引用着&＃xff0c;如下图所示的link1就是这种情况。

除了将link1标记为可达的之外&＃xff0c;python垃圾回收器&＃xff0c;还会从当前可达节点依次遍历所有可达的节点&＃xff0c;比如从link1可以到达link2和link3&＃xff0c;但link3已经被放到Unreachable列表中&＃xff0c;因此还需要将link3再移回到Object to Scan列表中&＃xff0c;表示对象还是可以触达的。最终的结果如下图所示&＃xff0c;只有link4会被回收掉&＃xff1a;

标记-清除法虽然可以解决循环引用的问题&＃xff0c;但是缺点也比较明显&＃xff0c;就是需要python垃圾回收器对python对象执行两遍扫描&＃xff0c;而每次扫描&＃xff0c;python解释器就会暂停处理其他事情&＃xff0c;等到扫描结束后才能恢复正常。这个过程就好比&＃xff1a;图书管理员要对图书馆进行清洁整理&＃xff0c;那么将会关闭图书馆&＃xff0c;直到收拾干净后才能重新打开图书馆&＃xff0c;供同学们使用。

分代垃圾回收

那既然在python垃圾回收过程中&＃xff0c;会暂停整个应用程序&＃xff0c;有没有更好的优化方案呢&＃xff1f;答案是肯定的。在python解释器中&＃xff0c;对象的存活时间是不一样的&＃xff1a;

长时间存活(或一直存活)的对象&＃xff0c;它们是内存垃圾的可能性低&＃xff0c;可以减少对它们扫描的次数。

临时或短时间存活的对象&＃xff0c;这种对象比较容易成为内存垃圾&＃xff0c;所以得频繁扫描。

位于前两种情况的之间的对象。可根据情况进行内存扫描。

这样区分对象后&＃xff0c;就可以节省每次扫描的时间(不需要所有对象都扫描)&＃xff0c;重而能提升垃圾回收的速度。

python中结合着上面列出的三种类型的对象分了三个对象代(0&＃xff0c;1&＃xff0c;2)&＃xff0c;它们其实对应了3个链表&＃xff1a;每一个新生对象在generation zero中&＃xff0c;如果它在一轮gc扫描中活了下来&＃xff0c;那么它将被移至generation one,在这一个对象代扫描次数将会减少&＃xff1b;如果它又活过了一轮gc,它又将被移至generation two&＃xff0c;在这一个对象代对象扫描次数将会更少。

python触发垃圾回收扫码的时机

python解释器只会在触发某个条件时&＃xff0c;才会去执行垃圾回收。这个条件就是当python分配对象的次数和取消分配对象的次数(引用计数变为0)做差值高于某个阈值&＃xff0c;我们可以通过python提供的方法来查看这个阈值。

def threshold_gc():

# 获取阈值

print(gc.get_threshold())

# 可设置阈值

gc.set_threshold(800, 10, 10)

print(gc.get_threshold())

# 运行结果

(700, 10, 10)

(800, 10, 10)

上面程序运行结果中值的含义如下&＃xff1a;

700是垃圾回收启动的阈值。

后面两个10与分代回收有关(上面介绍过python分了三个对象代&＃xff1a;0、1、2)&＃xff0c;第一个10表示每进行10次0代对象扫描&＃xff0c;则进行1次1代对象扫描。

最后一个10表示每进行10次1代对象扫描&＃xff0c;则执行1次2代对象扫描。

此外可以自己根据情况&＃xff0c;调用set_threshold()方法来调整垃圾回收的频率。比如&＃xff1a;set_threshold(700,10,5)&＃xff0c;相当于增加了对2代对象的扫描频率。

gc这个库中还有一些很好玩的函数&＃xff0c;大家可以了解下(更多方法可以参考官方文档)&＃xff1a;

def gc_method():

# 启动垃圾回收

gc.enable()

# 停用垃圾回收

gc.disable()

# 手动指定垃圾回收&＃xff0c;参数可以指定垃圾回收的代数&＃xff0c;不填写参数就是完全的垃圾回收

gc.collect()

# 设置垃圾回收的标志&＃xff0c;多用于内存泄漏的检测

gc.set_debug(gc.DEBUG_LEAK)

# 返回一个对象的引用列表

gc.get_referrers()

额外补充-python内存分层结构

在python中&＃xff0c;内存管理机制被抽象成分层次的结构&＃xff0c;从python解释器Cpython的源码obmallic.c的注释中抓取了对内存分层的描述&＃xff1a;

Object-specific allocators

_____ ______ ______ ________

[ int ] [ dict ] [ list ] ... [ string ] Python core |

&＃43;3 | | |

_______________________________ | |

[ Python&＃39;s object allocator ] | |

&＃43;2 | ####### Object memory ####### | |

______________________________________________________________ |

[ Python&＃39;s raw memory allocator (PyMem_ API) ] |

&＃43;1 | | |

__________________________________________________________________

[ Underlying general-purpose allocator (ex: C library malloc) ]

0 | |

&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;

_______________________________________________________________________

[ OS-specific Virtual Memory Manager (VMM) ]

-1 | |

__________________________________ __________________________________

[ ] [ ]

-2 | | | |

第-2层是物理内存层。

第-1层是操作系统虚拟的内存管理器。

第0层是C中的malloc、free等内存分配和释放相关的层。当申请的内存大于256K时&＃xff0c;会调用第0层的malloc分配内存。

第1层和第2层是python级别的内存分配器(内存池)&＃xff0c;当申请的内存小于256K时&＃xff0c;会由这两层来进行处理。这两层存在3个级别的内存结构&＃xff1a;arena>pool>block&＃xff0c;其中arena大小固定是256K&＃xff0c;pool的固定大小是4K&＃xff0c;而block的大小是8的整数倍&＃xff0c;用来满足最小分配需求。

第3层是python对象内存分配器&＃xff0c;也就是我们通常所用的python对象&＃xff0c;比如&＃xff1a;列表和字典、元组等。

python的内存这么分层设计&＃xff0c;最根本的目的还是为了提高python的执行性能&＃xff0c;因为如果不分层&＃xff0c;频繁的调用malloc和free&＃xff0c;非常的耗费系统资源&＃xff0c;会产生性能问题。而分层之后&＃xff0c;第1层和第2层充当了内存池的作用&＃xff0c;根据分配的内存大小不同&＃xff0c;交给不同的层去处理&＃xff0c;减少了频繁的调用malloc。

总结

本文介绍了python中垃圾回收的三种方式&＃xff0c;以及python内存的分层管理方式&＃xff0c;属于比较深层次的python知识&＃xff0c;不过相信也可以帮助你了解python的内存管理方式。如果在之后找工作过程中再被面试官问道"python垃圾回收机制"这样的问题&＃xff0c;假如你能将文中的内容讲出来绝对是加分项。

推荐阅读

jsp
求解hdu 1003 java题目的动态规划优化方法

本文讨论了如何优化解决hdu 1003 java题目的动态规划方法，通过分析加法规则和最大和的性质，提出了一种优化的思路。具体方法是，当从1加到n为负时，即sum(1,n)sum(n,s)，可以继续加法计算。同时，还考虑了两种特殊情况：都是负数的情况和有0的情况。最后，通过使用Scanner类来获取输入数据。 ... [详细]

蜡笔小新 2023-12-14 13:11:00
default
Java容器中的compareto方法排序原理解析

本文从源码解析Java容器中的compareto方法的排序原理，讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点，回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录，展示了整个讲解过程。 ... [详细]

蜡笔小新 2023-12-14 13:53:31
default
Java太阳系小游戏分析和源码详解

本文介绍了一个基于Java的太阳系小游戏的分析和源码详解。通过对面向对象的知识的学习和实践，作者实现了太阳系各行星绕太阳转的效果。文章详细介绍了游戏的设计思路和源码结构，包括工具类、常量、图片加载、面板等。通过这个小游戏的制作，读者可以巩固和应用所学的知识，如类的继承、方法的重载与重写、多态和封装等。 ... [详细]

蜡笔小新 2023-12-14 19:53:34
function
JS进修笔记——闭包的运转机制和作用域

本文介绍了闭包的定义和运转机制，重点解释了闭包如何能够接触外部函数的作用域中的变量。通过词法作用域的查找规则，闭包可以访问外部函数的作用域。同时还提到了闭包的作用和影响。 ... [详细]

蜡笔小新 2023-12-14 18:45:00
jsp
Java实现大数乘法（分治算法）

本文介绍了使用Java实现大数乘法的分治算法，包括输入数据的处理、普通大数乘法的结果和Karatsuba大数乘法的结果。通过改变long类型可以适应不同范围的大数乘法计算。 ... [详细]

蜡笔小新 2023-12-14 15:43:50
default
Java猜拳小游戏代码

本文介绍了一个Java猜拳小游戏的代码，通过使用Scanner类获取用户输入的拳的数字，并随机生成计算机的拳，然后判断胜负。该游戏可以选择剪刀、石头、布三种拳，通过比较两者的拳来决定胜负。 ... [详细]

蜡笔小新 2023-12-14 15:39:08
jsp
OC学习笔记之@property和@synthesize

本文介绍了OC学习笔记中的@property和@synthesize，包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]

蜡笔小新 2023-12-14 12:05:06
int
如何在有序字符序列中插入新字符并保持有序

本文介绍了如何在给定的有序字符序列中插入新字符，并保持序列的有序性。通过示例代码演示了插入过程，以及插入后的字符序列。 ... [详细]

蜡笔小新 2023-12-14 11:16:33
select
安卓select模态框样式改变_微软Office风格的多端（Web、安卓、iOS）组件库——Fabric UI...

介绍FabricUI是微软开源的一套Office风格的多端组件库，共有三套针对性的组件，分别适用于web、android以及iOS，Fab ... [详细]

蜡笔小新 2023-12-14 05:55:08
default
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新 2023-12-13 22:09:56
int
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
default
python创建一个窗口_等一个大佬啊要求用python创建一个窗口，窗口按钮功能是创建一个球体或立方体。明天上课之前交给我...

展开全部下面的代码是创建一个立方体Thisexamplescreatesanddisplaysasimplebox.#Thefirstlineloadstheinit_disp ... [详细]

蜡笔小新 2023-12-13 16:26:09
int
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
int
差分约束系统求解House Man跳跃问题的思路与方法

本文讨论了使用差分约束系统求解House Man跳跃问题的思路与方法。给定一组不同高度，要求从最低点跳跃到最高点，每次跳跃的距离不超过D，并且不能改变给定的顺序。通过建立差分约束系统，将问题转化为图的建立和查询距离的问题。文章详细介绍了建立约束条件的方法，并使用SPFA算法判环并输出结果。同时还讨论了建边方向和跳跃顺序的关系。 ... [详细]

蜡笔小新 2023-12-14 11:49:51
select
javascript – 概述在Firefox上无法正常工作

我试图提出一些自定义大纲,以达到一些Web可访问性建议.但我不能用Firefox制作.这就是它在Chrome上的外观：而那个图标实际上是一个锚点.在Firefox上,它只概述了整个 ... [详细]

蜡笔小新 2023-12-14 10:20:38

xiashi

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章