SkyWalking Agent排错指南
介绍
SkyWalking Agent是Apache SkyWalking的探针组件,负责自动采集应用性能数据并上报至后端服务。当Agent运行异常时,可能导致监控数据丢失或应用性能下降。本指南将系统性地介绍常见问题的诊断与解决方法。
基础检查步骤
1. 验证Agent加载状态
在应用启动日志中搜索以下关键词确认Agent是否正常加载:
[main] INFO org.apache.skywalking.apm.agent.SkyWalkingAgent - SkyWalking agent started...
常见问题
若未找到该日志,可能是:
- JVM参数未正确配置
- Agent jar包路径错误
- 权限问题导致无法读取Agent
2. 检查网络连通性
Agent需要与OAP Server通信,使用以下命令测试网络:
telnet <oap-server-host> 11800 # 测试gRPC端口
telnet <oap-server-host> 12800 # 测试HTTP端口
典型问题分析
案例1:Agent未上报数据
现象:UI界面无数据,但应用日志显示Agent已启动。
诊断步骤:
- 检查Agent配置:
# agent.config
agent.service_name=your-service-name
collector.backend_service=<oap-server-host>:11800
- 开启调试日志:
logging.level.org.apache.skywalking.apm=DEBUG
- 查看网络包:
tcpdump -i any port 11800 -w agent_network.pcap