SkyWalking 常见运维问题
介绍
SkyWalking作为分布式系统的APM工具,在运维过程中可能会遇到配置错误、存储异常、性能瓶颈等问题。本章将系统讲解这些常见问题的现象、排查思路和解决方案,帮助初学者快速定位并处理运维故障。
常见问题分类
1. 服务启动失败
现象
- OAP服务无法启动
- WebUI无法连接后端
- 日志报端口冲突或配置错误
解决方案
# 检查端口占用(默认11800/12800)
netstat -tulnp | grep 11800
# 验证配置文件(以application.yml为例)
cat config/application.yml | grep -A 5 "core"
典型配置问题示例:
# 错误配置(缩进错误)
storage:
elasticsearch:
nameSpace: ${SW_NAMESPACE:""}
clusterNodes: ${SW_STORAGE_ES_CLUSTER_NODES:localhost:9200}
# 正确配置
storage:
elasticsearch:
nameSpace: ${SW_NAMESPACE:""}
clusterNodes: ${SW_STORAGE_ES_CLUSTER_NODES:localhost:9200}
注意
YAML文件对缩进敏感,建议使用2空格缩进(不要用Tab)