收集器监控指标
介绍
在Zipkin的分布式追踪系统中,**收集器(Collector)**是接收、处理和存储追踪数据的核心组件。监控收集器的运行指标(Metrics)能帮助开发者快速定位性能瓶颈、发现异常行为,并优化系统稳定性。本章将详细介绍Zipkin收集器的关键监控指标及其实际应用。
核心监控指标
Zipkin收集器默认通过/metrics
端点暴露监控数据(需集成Micrometer或Prometheus等监控库)。以下是关键指标分类:
1. 吞吐量指标
counter.zipkin_collector.messages
: 接收到的总消息数(如HTTP请求、Kafka消息)。counter.zipkin_collector.bytes
: 接收到的数据总字节数。counter.zipkin_collector.spans
: 成功处理的Span数量。
2. 错误指标
counter.zipkin_collector.messages_dropped
: 因队列满或格式错误被丢弃的消息数。counter.zipkin_collector.spans_dropped
: 处理失败的Span数量。
3. 性能指标
timer.zipkin_collector.message
: 处理单条消息的平均耗时(单位:毫秒)。gauge.zipkin_collector.message_queue_size
: 当前待处理消息队列长度。