images\cherry_red.png1 Prometheus
      images\cherry_blue.png1.1 监控系统设计
         images\cherry_orange.png1.1.1 框架结构
            images\cherry_cyan.png1.1.1.1 储存形式
            images\cherry_cyan.png1.1.1.2 服务发现
            images\cherry_cyan.png1.1.1.3 报警绘图
      images\cherry_blue.png1.2 监控系统部署
         images\cherry_orange.png1.2.1 启动参数
         images\cherry_orange.png1.2.2 配置文件
         images\cherry_orange.png1.2.3 node_exporter
      images\cherry_blue.png1.3 数据采集编写
         images\cherry_orange.png1.3.1 数据采集形式分类
         images\cherry_orange.png1.3.2 监控数据分析/算法
         images\cherry_orange.png1.3.3 监控稳定测试
      images\cherry_blue.png1.4 监控自动化
      images\cherry_blue.png1.5 监控图形化展示
         images\cherry_orange.png1.5.1 配置文件展示
      images\cherry_blue.png1.6 监控数据格式
         images\cherry_orange.png1.6.1 metrics
         images\cherry_orange.png1.6.2 k/v数据形式
         images\cherry_orange.png1.6.3 主动模式exporter
         images\cherry_orange.png1.6.4 被动模式pushgateway
      images\cherry_blue.png1.7 监控实例
         images\cherry_orange.png1.7.1 CPU使用率
            images\cherry_cyan.png1.7.1.1 公式拆分讲解
      images\cherry_blue.png1.8 函数
         images\cherry_orange.png1.8.1 increase
         images\cherry_orange.png1.8.2 sum
         images\cherry_orange.png1.8.3 by (instance)
         images\cherry_orange.png1.8.4 rate
         images\cherry_orange.png1.8.5 topk
         images\cherry_orange.png1.8.6 count
      images\cherry_blue.png1.9 标签
      images\cherry_blue.png1.10 监控数据采集脚本开发
业务监控 QPS
系统监控 CPU,内存,硬盘,io,TCP链接,流量等
网络监控 网络状态监控
日志监控 splunk,elk
程序监控 特质日志格式


监控高度集成化,自动化处理

监控本身重视程度

监控最终理想化

完整自愈监控体系
1,自愈系统完善,自动化,持续集成,人工智能,灾备,缓存等

某原因因此各层级告警

无关告警忽略掉,链路方式,最终引起问题地方,报警

业务和代码结合起来

不支持集群化,监控集群过大,本身性能存在瓶颈


操作系统需有很深入扎实的知识,不能只浮现于表面

基本内核基于数学公式组成 T-S(四则运算,算法-> 微积分,代数,数论)

监控经验有很高的要求,监控项 K-V

images\1-1.png