(转载)V8引擎的垃圾内存回收机制

原文链接 https://juejin.cn/post/6875714523332870157#heading-9

垃圾回收的起因

在其他的后端语言中,如 Java/Go, 对于内存的使用没有什么限制,但是 JS 不一样,V8 只能使用系统的一部分内存。

我们都知道,所有的对象类型的数据再 JS 中都是通过堆进行空间分配的,当我们构造一个对象进项赋值操作的时候,其实相应的内存已经分配到了堆上,我们可以不断地这样创建对象,让 V8 为它分配空间,直到堆的大小达到上限。

v8 内存限制

那么问题来了,V8 为什么要给它设置内存上限?明明服务器的机器有几十 G 的内存,只能让我用这么一点?

究其根本,是由两个因素共同决定的:

  • 一个是 JS 单线程的执行机制
  • 另一个是 JS 垃圾回收机制的限制

首先 JS 是单线程运行的,这意味着一旦进入到垃圾回收,那么其它的各种运行逻辑都要暂停; 另一方面垃圾回收其实是非常耗时间的操作,V8 官方是这样形容的:

以 1.5GB 的垃圾回收堆内存为例,V8 做一次小的垃圾回收需要 50ms 以上,做一次非增量式(ps:后面会解释)的垃圾回收甚至要 1s 以上。

可见其耗时之久,而且在这么长的时间内,我们的 JS 代码执行会一直没有响应,造成应用卡顿,导致应用性能和响应能力直线下降。因此,V8 做了一个简单粗暴的 选择,那就是限制堆内存。

那么 V8 是如何进行内存的垃圾回收呢,防止有用的 JS 代码执行会一直没有响应,造成使用的应用卡顿。

V8 是如何进行垃圾回收的?

JS 引擎中对变量的存储主要有两种位置,栈内存和堆内存。

栈内存的回收

栈内存调用栈上下文切换后,栈顶的空间就会自动被回收。

堆内存的回收

v8 把堆内存划分为两部分进行处理————新生代内存老生代内存两个区域。

顾名思义,新生代就是临时分配的内存,存活时间短;老生代是常驻内存,存活的时间长。

新生代内存的回收

v8 的堆内存,也就是两个内存之和,由新生代老生代共同组成。

新生代&老生代

根据这两种不同种类的堆内存,v8 采用了不同的回收策略,来根据不同的场景做针对性的优化。

新生代的垃圾回收是怎么做的呢?

首先将新生代内存空间一分为二,如图

新生代内存

其中的 From 部分表示正在使用的内存,To 是目前闲置的内存。

当进行垃圾回收时,v8 将 From 部分的对象检查一遍。

  • 如果是存活对象,那么直接复制到 To 内存中(在 To 内存中按照顺序从头放置的
  • 如果是非存活对象,直接回收即可

当所有的 From 中的存活对象按照顺序进入到 To 内存之后,From 和 To 两者的角色对调,From 现在被闲置,To 为正在使用,如此循环。

那你很可能会问了,直接将非存活对象回收了不就万事大吉了嘛,为什么还要后面的一系列操作?

注意,我刚刚特别说明了,在 To 内存中按照顺序从头放置的,这是为了应对这样的场景:

内存碎片

深色的小方块代表存活对象,白色部分表示待分配的内存,由于堆内存是连续分配的,这样零零散散的空间可能会导致稍微大一点的对象没有办法进行空间分配, 这种零散的空间也叫做内存碎片。刚刚介绍的新生代垃圾回收算法也叫 Scavenge 算法

Scavenge 算法主要就是解决内存碎片的问题,在进行一顿复制之后,To 空间变成了这个样子:

整理内存碎片

是不是整齐了许多?这样就大大方便了后续连续空间的分配。

不过 Scavenge 算法的劣势也非常明显,就是内存只能使用新生代内存的一半,但是它只存放生命周期短的对象,这种对象一般很少,因此时间性能非常优秀。

老生代内存的回收

刚刚介绍了新生代的回收方式,那么新生代中的变量如果经过多次回收后依然存在,那么就会被放入到老生代内存中,这种现象就叫晋升

发生晋升其实不只是这一种原因,我们来梳理一下会有哪些情况触发晋升:

  • 已经经历过一次 Scavenge 回收。
  • To(闲置)空间的内存占用超过 25%。

现在进入到老生代的垃圾回收机制当中,老生代中累计的变量空间一般都是很大的,当然不能用 Scavenge 算法啦,因为它不仅会浪费一半空间,还会对庞大的内存空间进行复制呢。

那么对于老生代而言,究竟是采取怎样的策略进行垃圾回收的呢?

「第一步」,进行标记-清除。主要分为两个阶段,即标记阶段清除阶段。首先会遍历堆中的所有对象,对它们作上标记,然后对代码环境中使用的变量以及被强引用的变量取消标记(因为它们属于被引用对象),剩下的就是要删除的变量了,在随后的清除阶段对其进行空间的回收。

当然这又会引发内存碎片的问题,存活对象的空间不连续对后续的空间分配造成障碍。老生代又是如何处理这个问题的呢?

「第二步」,整理内存碎片。v8 的解决方式非常简单粗暴,在清除阶段结束后,把存活的对象全部往一端靠拢。

整理内存碎片

由于是移动对象,它的执行速度不可能很快,事实上也是整个过程中最耗时间的部分。

增量标记

由于 JS 的单线程机制,V8 在进行垃圾回收的时候,不可避免地会阻塞业务逻辑的执行,倘若老生代的垃圾回收任务很重,那么耗时会非常可怕,严重影响应用的性能。 那这个时候为了避免这样问题,V8 采取了增量标记的方案,即将一口气完成的标记任务分为很多小的部分完成,每做完一个小的部分就”歇”一下,就 js 应用逻辑执行一会儿, 然后再执行下面的部分。如果循环,直到标记阶段完成才进入内存碎片的整理上面来。其实这个过程跟 React Fiber 的思路有点像,这里就不展开了。

经过增量标记之后,垃圾回收过程对 JS 应用的阻塞时间减少到原来了 1 / 6, 可以看到,这是一个非常成功的改进。

介绍一下引用计数和标记清除

  • 「引用计数」:给一个变量赋值引用类型,则该对象的引用次数+1,如果这个变量变成了其他值,那么该对象的引用次数-1,垃圾回收器会回收引用次数为 0 的对象。但是当对象循环引用时,会导致引用次数永远无法归零,造成内存无法释放。

  • 「标记清除」:垃圾收集器先给 内存中所有对象加上标记,然后从根节点开始遍历,去掉被引用的对象和运行环境中对象的标记,剩下的被标记的对象就是无法访问的,等待垃圾回收的对象。

V8 的垃圾回收是发生在什么时候?

浏览器渲染页面的空闲时间进行垃圾回收。