SkyWalking Java Agent 启动性能优化实践

2025-05-08 21:53:15作者：廉皓灿Ida

APM, Application Performance Monitoring System

项目地址：https://gitcode.com/gh_mirrors/sky/skywalking

背景介绍

Apache SkyWalking 是一款优秀的应用性能监控(APM)系统，其 Java Agent 通过字节码增强技术实现对应用的监控能力。然而在实际生产环境中，我们发现 SkyWalking Java Agent 在某些场景下会显著增加应用的启动时间，这对于启动时间敏感的业务系统来说是一个需要解决的问题。

问题现象

某公司在推广使用 SkyWalking 过程中，部分项目团队反馈接入 SkyWalking Java Agent 后，应用启动时间从原来的35秒增长到了60秒，增幅达到71%。通过JMeter持续发送HTTP请求的测试方法验证了这一现象，确认启动时间确实有明显增加。

性能分析

通过代码插桩的方式，我们对关键方法进行了耗时分析：

SkyWalkingAgent#premain - Agent初始加载阶段
SkyWalkingAgent.Transformer#transform - 字节码转换阶段
ProtectiveShieldMatcher#matches - 类匹配检查阶段

分析结果显示，ProtectiveShieldMatcher#matches方法累计耗时超过16秒，成为启动时间增加的主要瓶颈。该方法负责检查每个类是否需要被增强，当应用中包含大量类时，这一检查过程会消耗大量时间。

优化方案

针对这一问题，我们提出了以下优化方案：

类匹配优化

核心思路是通过配置排除不需要增强的类路径。例如，公司内部的大量类都以com.our.company为前缀，这些类通常不需要被监控增强。通过在ByteBuddy匹配阶段提前排除这些类，可以显著减少匹配检查的时间消耗。

实现方式

在agent.config配置文件中增加排除类路径的配置项
在ProtectiveShieldMatcher中增加前缀匹配逻辑
对于匹配排除规则的类，直接返回不增强的结果，避免后续复杂的匹配检查

优化效果

实施上述优化后，启动时间得到了显著改善：

总启动时间从60秒降低到约40秒
ProtectiveShieldMatcher#matches方法耗时从16秒降低到2秒以内
应用快速部署和扩展能力得到恢复

技术原理

这一优化之所以有效，是因为它利用了以下技术原理：

类加载过滤：在字节码增强的最早期阶段就过滤掉不需要处理的类
减少字节码扫描：避免对已知不需要增强的类进行复杂的分析检查
配置化排除：通过外部配置灵活控制增强范围，适应不同应用场景

最佳实践建议

基于这一优化经验，我们建议在使用SkyWalking Java Agent时：

对于大型应用，应该分析并配置排除内部框架和工具类
定期审查增强类列表，确保只增强真正需要监控的类
对于启动时间敏感的应用，可以分阶段启用增强功能
监控Agent自身的性能指标，及时发现潜在问题

总结

SkyWalking Java Agent的启动性能优化是一个需要平衡监控需求和系统性能的工作。通过合理的类匹配优化，我们可以在保持监控能力的同时，最大程度地减少对应用启动时间的影响。这一实践不仅解决了具体问题，也为类似性能优化场景提供了可借鉴的思路。

APM, Application Performance Monitoring System

项目地址：https://gitcode.com/gh_mirrors/sky/skywalking

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

最新内容推荐

AcFunDown视频下载工具完全指南还在为数字笔记抓狂？这款开源神器让手写批注效率提升300%Windows笔记本电池健康管理全指南：从根源解决电池损耗问题 gmx_MMPBSA分子间相互作用索引错误的深度诊断与解决 Axure RP 11 本地化方案：Mac中文界面优化与原型设计工具汉化全指南如何高效获取教育资源？这款工具让教材下载效率提升80%视频元数据深度编辑：专业技巧与案例网盘直链下载技术解析与应用指南如何用DeepSeek-R1推理模型提升复杂任务解决能力：完整指南 5个突破瓶颈技巧：硬件优化工具让你的电脑性能提升30%

项目优选

收起

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

昇腾LLM分布式训练框架