SkyWalking 自监控配置
概述
SkyWalking作为一款优秀的APM(应用性能监控)工具,不仅能监控其他应用,还能监控自身运行状态。自监控(Self-Observability)功能让运维人员可以实时掌握SkyWalking各组件的健康状况、性能指标和潜在问题,确保监控系统本身的可靠性。
为什么需要 自监控?
当SkyWalking出现性能瓶颈或故障时,如果没有自监控数据,排查问题将变得异常困难。自监控就像给监控系统装上了"健康检测仪"。
基础配置
1. 启用自监控
在SkyWalking的配置文件 application.yml
中启用自监控模块:
telemetry:
prometheus:
host: 0.0.0.0
port: 1234
sslEnabled: false
关键参数说明:
host
: 暴露指标的IP地址(0.0.0.0表示所有网络接口)port
: Prometheus抓取指标的端口sslEnabled
: 是否启用SSL加密
2. 配置指标采集频率
在 oap-server
的配置中调整自监控数据采集频率:
core:
default:
# 每10秒收集一次OAP自身指标
selfObservabilityLevel: INFO
selfObservabilityInterval: 10
核心监控指标
SkyWalking自监控主要关注以下几类指标:
关键指标示例
-
JVM指标:
jvm_memory_used_bytes
: 各内存区域使用量jvm_gc_collection_seconds
: GC耗时
-
线程指标:
process_cpu_usage
: CPU使用率thread_count
: 线程数量
-
GRPC指标:
grpc_server_requests_total
: 请求总数grpc_server_handled_seconds
: 处理耗时