OOM问题排查解决方案、Arthas分析高CPU问题

一、OOM问题

分析流程：
第一步：进程分析，分析老年代回收次数和消耗时间
第二步：日志分析，找出OOM发生时间的日志来锁定执行方法，对应的机器ip
第三步：找到对应的ip机器查看，进一步分析
第四步：下载的dump，使用mat分析堆内存，找到堆占用率前3，查看堆指向

问题产生:
查看新生代最高1000M，如果大数据量调用，jvm会把产生的大对象分配在新生代，新生代full gc后放到老年代，老年代gc后触发OOM，就会像类似死循环一样，一直full gc了

解决方案：
1、临时方法：

① 先进行扩容

② 任务先降下来
2、洗数据标签放到单独的服务
3、新生代放大
4、大数据量存储进行报警

二、Arthas分析高CPU问题：
优点：
1、快速定位和修复问题的一站式服务

使用方法：
１、dashboard + thread 命令，基本可以在几秒钟内一键定位问题，找出消耗 CPU 最多的线程和方法栈；
①　dashboard 命令用于整体展示进程所有线程、内存、GC 等情况，分析占用CPU 较多的线程
②　使用thread -n查看最放慢的线程在执行的线程栈，找到执行的方法
２、直接 jad 反编译相关代码，来确认根因
３、如果调用入参不明确的话，可以使用 watch 观察方法入参，并根据方法执行时间来过滤慢请求的入参。
４、由于 monitor、trace、watch 等命令是通过字节码增强技术来实现的，会在指定类的方法中插入一些切面来实现数据统计和观测，因此诊断结束要执行 shutdown 来还原类或方法字节码，然后退出 Arthas。

OOM问题排查解决方案、Arthas分析高CPU问题

更多推荐

大数据之Hive

第30章_瑞萨MCU零基础入门系列教程之IRDA红外遥控实验

【Hierarchical Coverage Path Planning in Complex 3D Environments】

Go语言简介：历史背景、发展现状及语言特性

【C++】动态内存管理 ⑤ ( 基础数据类型数组内存分析 | 类对象内存分析 | malloc 分配内存 delete 释放 | new 分配内存 free 释放内存 )

【测试开发】基础篇 · 专业术语 · 软件测试生命周期 · bug的描述 · bug的级别 · bug的生命周期 · 处理争执

使用JAXB将xml转成Java对象

Linux系统编程——线程的学习

武汉凯迪正大—继保校验仪的产品特点

【AI视野·今日NLP 自然语言处理论文速览第三十五期】Mon, 18 Sep 2023

小白带你学习ceph分布式存储

热文推荐

TypeScript逆变：条件、推断和泛型的应用

Vue3 - 实现动态获取菜单路由和按钮权限控制指令

Postgresql JIT README翻译

Linux基础指令（四）

基于海康Ehome/ISUP接入到LiveNVR实现海康摄像头、录像机视频统一汇聚，做到物联网无插件直播回放和控制

java---jar详解

计算机竞赛深度学习+opencv+python实现车道线检测 - 自动驾驶

Layui快速入门之第十五节表格

docker run：--privileged=true选项解析（特权模式：赋予容器几乎与主机相同的权限）