转载

发表于 2015年06月03日
浏览 (509)
评论 (0)

什么是垃圾回收

Published: 02 Jun 2015 Category: GC

本文摘自我们几周后即将出版的Garbage Collection Handbook一书的样章。同时也让你能熟悉下垃圾回收的基础知识——这选自该书的第一章。

乍一看，垃圾回收所做的事情应当恰如其名——查找并清除垃圾。事实上却恰恰相反。垃圾回收会跟踪所有仍在使用的对象，然后将剩余的对象标记为垃圾。牢记了这点之后，我们再来深入地了解下这个被称为“垃圾回收”的自动化内存回收在JVM中到底是如何实现的。

手动管理内存

在介绍现代版的垃圾回收之前，我们先来简单地回顾下需要手动地显式分配及释放内存的那些日子。如果你忘了去释放内存，那么这块内存就无法重用了。这块内存被占有了却没被使用。这种场景被称之为 内存泄露 。

下面是用C写的一个手动管理内存的简单例子：

int send_request() {  size_t n = read_size();  int *elements = malloc(n * sizeof(int));  if(read_elements(n, elements) < n) {   // elements not freed!   return -1;  }  // …  free(elements)  return 0; }

可以看到，你很容易就会忘了释放内存。内存泄露曾经是个非常普遍的问题。你只能通过不断地修复自己的代码来与它们进行抗争。因此，需要有一种更优雅的方式来自动释放无用内存，以便减少人为错误的可能性。这种自动化过程又被称为垃圾回收（简称GC）。

智能指针

自动垃圾回收早期的一种实现便是引用计数。你知晓每一个对象被引用了几次，当计数器归0的时候，这个对象就可以被安全地回收掉了。C++的共享指针就是一个非常著名的例子：

int send_request() {  size_t n = read_size();  stared_ptr<vector<int>> elements       = make_shared<vector<int>&gt();  if(read_elements(n, elements) < n) {   return -1;  }  return 0; }

我们使用的shared ptr会记录这个对象被引用的次数。如果你将它传递给别人则计数加一，当它离开了作用域后便会减一。一旦这个计数为0，shared ptr会自动地删除底层对应的vector。当然这只是个示例，因为也有读者指出来了，这个在现实中是不太可能出现的，但作为演示是足够了。

自动内存管理

在上面的C++代码中，我们还得显式地声明我们需要使用内存管理。那如果所有的对象都采用这个机制会怎样呢？那简直就太方便了，这样开发人员便无需考虑清理内存的事情了。运行时会自动知晓哪些内存不再使用了，然后释放掉它。也就是说，它自动地回收了这些垃圾。第一代的垃圾回收器是1959年Lisp引入的，这项技术迄今为止一直在不断演进。

引用计数

刚才我们用C++的共享指针所演示的想法可以应用到所有的对象上来。许多语言比如说Perl, Python以及PHP，采用的都是这种方式。这个通过一张图可以很容易说明：

什么是垃圾回收

绿色的云代表的是程序中仍在使用的对象。从技术层面上来说，这有点像是正在执行的某个方法里面的局部变量，亦或是静态变量之类的。不同编程语言的情况可能会不一样，因此这并不是我们关注的重点。

蓝色的圆圈代表的是内存中的对象，可以看到有多少对象引用了它们。灰色圆圈的对象是已经没有任何人引用的了。因此，它们属于垃圾对象，可以被垃圾回收器清理掉。

看起来还不错对吧？没错，不过这里存在着一个重大的缺陷。很容易会出现一些孤立的环，它们中的对象都不在任何域内，但彼此却互相引用导致引用数不为0。下面便是一个例子：

什么是垃圾回收

看到了吧，红色部分其实就是应用程序不再使用的垃圾对象。由于引用计数的缺陷，因此会存在内存泄露。

有几种方法可以解决这一问题，比如说使用特殊的“弱”引用，或者使用一个特殊的算法回收循环引用。之前提到的Perl,Python以及PHP等语言，都是使用类似的方法来回收循环引用的，不过这已经超出本文讲述的范围了。我们准备详细介绍下JVM所采用的方法。

标记删除

首先，JVM对于对象可达性的定义要明确一些。它可不像前面那样用绿色的云便含糊了事的，而是有着非常明确及具体的垃圾回收根对象（Garbage Collection Roots）的定义：

局部变量
活动线程
静态字段
JNI引用
其它（后面将会讨论到）

JVM通过标记删除的算法来记录所有可达（存活）对象，同时确保不可达对象的那些内存能够被重用。这包含两个步骤：

标记是指遍历所有可达对象，然后在本地内存中记录这些对象的信息
删除会确保不可达对象的内存地址可以在下一次内存分配中使用。

JVM中的不同GC算法，比如说Parallel Scavenge，Parallel Mark+Copy， CMS都是这一算法的不同实现，只是各阶段略有不同而已，从概念上来讲仍然是对应着上面所说的那两个步骤。

这种实现最重要的就是不会再出现泄露的对象环了：

什么是垃圾回收

缺点就是应用程序的线程需要被暂停才能完成回收，如果引用一直在变的话你是无法进行计数的。这个应用程序被暂停以便JVM可以收拾家务的情况又被称为Stop The World pause(STW)。这种暂停被触发的可能性有很多，不过垃圾回收应该是最常见的一种。

正文到此结束

所属分类：编程技术

本文标签： db 管理 root UI PHP 安全云 cat 开发线程遍历 tar 智能 CTO 自动化代码
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

热门推荐

openfire数据库安装指南

浏览(12,908) 评论(0)
Caffe 深度学习框架上手教程

浏览(9,967) 评论(0)
ReactiveCocoa入门教程：第一部分

浏览(10,822) 评论(0)
开源HIDS-OSSEC使用实例:监测CC攻击

浏览(10,702) 评论(0)
Decorators in ES7

浏览(15,190) 评论(4)
用Electron（Atom编辑器的兄弟项目）开发桌面应用

浏览(28,135) 评论(0)
Windows下JetBrains CLion中文输出乱码的解决方法

浏览(11,629) 评论(1)
同步-@synchronized, NSLock, pthread, OSSpinLock性能比较

浏览(10,675) 评论(0)
Seaweedfs之Volume读请求重定向

浏览(24,937) 评论(3)
HTML、CSS及JavaScript ：有Promise，不会搞大肚子

浏览(12,803) 评论(0)

相关文章

阿里云首购8折

Loading...

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

[HBLOG]公众号

HBLOG

HBLOG