JAVA应用性能监控之JVM层GC调优

1. JVM内存结构

1.1 运行时数据

运行时数据区是规范,内存结构是具体实现。

JAVA应用性能监控之JVM层GC调优

官方运行时数据区定义

  • 程序计数器PC Register:JVM支持多线程同时执行,每一个线程都有自己的PC Register,线程正在执行的方法叫做当前方法,如果是java代码,PC Register里面存放的就是房钱正在执行的指令的地址,如果你是C代码,则为空。
  • Java虚拟机栈(Java Virtual Machine Stacks)是线程私有的,它的生命周期与线程相同。虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧,用于存储局部变量表、操作数栈、动态链接、方法出口灯信息。每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。
  • Java堆(Java Heap)是Java虚拟机所管理的内存中最大的一块。堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例,几乎所有的对象实例都在这里分配内存。Java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可。
  • 方法区(Method Area):方法区域java堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常亮、静态变量、即时编译器编译后的代码等数据。虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却有一个别名叫做Non-Heap(非堆),目的是与Java堆区分开来。
  • 运行时常量池(Runtime Constant Pool)是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池(Constant Pool Table),用于存放编译器生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的常量池中存放。
  • 本地方法栈(Native Method Stacks)与虚拟机栈所放回的作用是非常相似的,它们之间的区别不过是虚拟机栈为虚拟机执行的Java方法(也就是字节码)服务,而本地方法栈则为虚拟机使用到的Native方法服务。

1.2 JVM的内存结构

JAVA应用性能监控之JVM层GC调优

CCS:压缩类空间,这个空间只有当启用了压缩类短指针时候,这个空间才会存在,在堆中分配的每一个对象,都有一个指向自己的Class的一个指针,64位的虚拟机指针的长度是64位,如果考虑性能的原因,我们可以把这个指针采用短指针方式引用,采用32位指针,所引用的class文件都存储在压缩类空间。如果不启用短指针,那么压缩类空间就不存在。
CodeCache:存放的是JIT编译后的源代码,还有JVM执行的JNI Native代码。如果没有启用JIT即时编译,或者没有引用JNI方法,这块空间不存在。
Metaspace = Class、Package、Method、Method、Field、字节码、常量池、符号引用等等。
CCS:32位指针的Class。
CodeCache:JIT编译后的本地代码、JNI使用的C代码。

实例:

启用压缩类空间:

JAVA应用性能监控之JVM层GC调优

jstat -gc 13144

JAVA应用性能监控之JVM层GC调优

禁用压缩类空间:

JAVA应用性能监控之JVM层GC调优

jstat -gc 13523

JAVA应用性能监控之JVM层GC调优

codecache也是一样操作。

-xint

JAVA应用性能监控之JVM层GC调优

常用参数

  • -Xms-Xmx
  • -XX:NewSize -XX:MaxNewSize
  • -XX:NewRatio -XX:SurvivorRatio
  • -XX:MetaspaceSize -XX:MaxMetaspaceSize
  • -XX:+UseCompressedClassPointers
  • -XX:CompressedClassSpaceSize
  • -XX:InitialCodeCacheSize
  • -XX:ReservedCodeCacheSize

2. 垃圾回收算法

C++和Java中内存泄露区别:在C++中New了一个对象,但是将该对象的指针丢失了,这就导致这个对象占用的内存永远得不到释放,就造成了内存泄露。在JAVA中New一个对象后,这个对象的指针一直被应用程序所持有,这样垃圾回收就不能将其释放,这样就导致内存泄露。

2.1 如何确定垃圾

思想:枚举根节点,做可达性分析
根节点:类加载器、Thread、虚拟机栈的本地变量表、static成员、常亮引用、本地方法栈的变量等等。

2.2 各类算法

标记清除:算法分为“标记”和“清除”两个阶段,首先标记出所有需要回收的对象,在标记完成后统一回收所有。缺点是效率不高,标记和清除两个过程的效率都不高;产生碎片,碎片太多会导致提前GC。
复制算法:它将可用内存按照容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。优缺点是实现简单,运行高效,但是空间利用率低。
标记整理算法:标记过程仍然与“标记-清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。优缺点是没有了内存碎片,但是整理内存比较耗时。
分代垃圾回收:Young区采用复制算法,Old区采用标记清除或者标记整理算法。

对象分配:

  • 对象优先分配在Eden区。
  • 大对象直接进入老年代:-XX:PretenureSizeThreshold,该参数规定多大的对象会直接分配在老年代。
  • 长期存活对象进入老年代:
    -XX:MaxTenuringThreshold 晋升阈值
    -XX:+PrintTenuringDistribution 发生Young GC时候,打印存活对象的年龄的分布情况
    -XX:TargetSurivorRatio 设置Surivor区,Young区垃圾回收后存活对象的比例,假设该值设置为80%,意味着发生一次Young GC,Surivor区存活对象为80%,这时候需要计算这些80%存活对象的平均年龄,用平均年龄和晋升阈值之间取一个最小值,如果有对象年龄大于该最小值,也会将该对象晋升到老年代。

3. 垃圾收集器

3.1 三种类型垃圾收集器

  • 串行收集器Serial:Serial、Serial Old。单线程,适用于内存小的嵌入式设备。
  • 并行收集器Parallel:Paralel Scavenge、Parallel Old,吞吐量优先。
  • 并发收集器Concurrent:CMS、G1,停顿时间优先。

3.2 并行VS并发

  • 并行是指多条垃圾收紧线程并行工作,但此时用户线程仍然处于等待状态。适合科学计算、后台处理等弱交互场景。
  • 并发指用户线程与垃圾收集线程同时执行(但不一定是并行的,可能会交替执行),垃圾收集线程在执行的时候不会停顿用户程序的运行。适合对响应时间有要求的场景,比如Web。

3.3 停顿时间VS吞吐量

  • 停顿时间:垃圾收集器做垃圾回收中断应用执行的时间,-XX:MaxGCPauseMillis
  • 吞吐量:花在垃圾收集的时间和花在应用时间的占比。-XXGCTimeRatio=<n>,来及收集时间占:1/1+n。

3.4 如何评价一个垃圾回收器的好坏

最理想的情况下,吞吐量最大的时候,停顿时间最小。现实中,这两个指标是互斥的,GC调优时候,很大部分工作就是如何权衡这两个变量。

3.5 三种类型垃圾收集器开启与停用

串行收集器:

-XX:+UseSerialGC -XX:+UseSerialOldGC

并行收集器:

吞吐量优先,
 -XX:+UseParallelGC  -XX:+UseParallelOldGC
 Server模式下的默认收集器,JVM会根据当前系统内存情况决定启用Server模式还是Client模式,内存大于2G,JVM就会认为是Server模式。
 jinfo -flag UseParallelGC 21669

并发收集器:

在Java8中,有两个并发垃圾收集器,一个是CMS,一个是G1。
 响应时间优先。
 CMS: XX:+UseConcMarkSweepGC -XX:UseParNewGC
 G1: -XX:UseG1GC

JAVA应用性能监控之JVM层GC调优

3.6 垃圾收集器搭配

JAVA应用性能监控之JVM层GC调优

  • 有连线的是可以相互搭配使用。
  • JDK8推荐使用G1,性能比较好,在Yong区和Old区都可以使用。
  • 虚线表示CMS可能退化成SerialOld,空间担保分配失败。

如何选择垃圾收集器? 官方指导垃圾收集器选取方法

  • 优先调整堆的大小,让JVM自己来选择;
  • 如果内存小于100M,使用串行收集器;
  • 如果是单核,并没有停顿时间的要求,串行或JVM自己选;
  • 如果允许停顿时间超过1秒,选择并行或JVM自己选;
  • 如果响应时间非常重要,并且不能超过1秒,使用并发收集器;

3.7 两种常用垃圾收集器

3.7.1 Parallel Collector

工作原理:当发现内存不够时,暂停应用程序,启动多个垃圾回收线程来回收垃圾,垃圾回收结束后,重新启动应用程序。

-XX:+UseParallelGC 手动开启,server模式默认开启;

-XX:ParallelGCThreads=<n> 开启多少个GC线程;

CPU > 8 ,N=5/8;
  CPU < 8 ,N=CPU;

并行收集器的自适应特性(Parallel Collector Ergonomics),会自动调整堆得大小,来自适应调整满足我们设定的指标:

  • -XX:MaxGCPauseMills=<n> 最大停顿时间;
  • -XX:GCTimeRatio=<n> 吞吐量;
  • -Xmx<n> 堆的大小;
    优先满足停顿时间要求,然后满足吞吐量要求,如果两个都满足的话,它会减小堆得大小,来满足停顿时间的要求,直到这三个条件中有一个是满足不了的。自适应其实不是最优的,因为它需要动态调整堆得大小来满足这些条件。
    动态内存调整
    并行收集器在自适应的时候会动态调整内存;
  • -XX:YongGenerationSizeIncrement=<Y> Yong区动态调整每次增加的大小,默认20%;
  • -XX:TenuredGenerationSizeIncrement=<T> Old区动态调整每次增加的大小,默认20%;
  • -XX:AdaptiveSizeDecrementScaleFactor=<D> 动态减小时每次减小的大小,默认4%;
    在生产环境下很少使用自适应功能,主要通过手动调整。

3.7.2 CMS Collector

并发收集
低停顿,低延迟
老年代收集器

(1)CMS垃圾收集过程

原文 

https://segmentfault.com/a/1190000020957089

本站部分文章源于互联网,本着传播知识、有益学习和研究的目的进行的转载,为网友免费提供。如有著作权人或出版方提出异议,本站将立即删除。如果您对文章转载有任何疑问请告之我们,以便我们及时纠正。

PS:推荐一个微信公众号: askHarries 或者qq群:474807195,里面会分享一些资深架构师录制的视频录像:有Spring,MyBatis,Netty源码分析,高并发、高性能、分布式、微服务架构的原理,JVM性能优化这些成为架构师必备的知识体系。还能领取免费的学习资源,目前受益良多

转载请注明原文出处:Harries Blog™ » JAVA应用性能监控之JVM层GC调优

赞 (0)
分享到:更多 ()

评论 0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址