热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

TiDB监控实现存活监控

多年来,基于MySQL构建的传统关系型数据库服务,已经难于支撑美团业务的爆发式增长,这就促使我们去探索更合理的数据存储方案,并实践新的运维方式。infofromserver:“pr

作者:刘春雷

原文来源:https://tidb.net/blog/5a3f54c2



TiDB监控实现 – 存活监控

--20190228 刘春雷


1、需求

1、随着TiDB集群的数量的发展,需要监控TiDB集群的存活情况

2、公司监控使用zabbix,需要将TiDB的监控接入进去

3、需要实现一键添加、删除集群监控,实现自动化


2、实现方式

1、通过Prometheus 的接口,获取各个组件的状态,处理数据后,推送至zabbix;

2、通过各个组件(TiDB、PD、TiKV、Grafana)的本地 API 获取组件状态,防止prometheus的单点问题,开发中。

3、通过zabbix的接口,创建监控等

4、通过zabbix实现短信报警

美团的实现方式:

tech.meituan.com – 22 Nov 18


新一代数据库TiDB在美团的实践

多年来,基于MySQL构建的传统关系型数据库服务,已经难于支撑美团业务的爆发式增长,这就促使我们去探索更合理的数据存储方案,并实践新的运维方式。

5、其他实现

也可以通过Alertmanager报警


3、具体实现

3.1、规范


3.1.1、host规范

{tidb/pd/tikv/prometheus/grafana}{实例端口port}{实例IP}

举例:

tidb_6666_10.0.0.1

pd_6666_10.0.0.1

tikv_6666_10.0.0.1

prometheus_6666_10.0.0.1 暂时没有查到接口判断存活

grafana_666_10.0.0.1


3.1.2、监控项

注:Prometheus 的自己存活无接口,先忽略

24


3.1.3、触发器

25


3.2、发送至zabbix实现


3.2.1、举例zabbix_sender命令

/zabbix_agent34/bin/zabbix_sender --zabbix-server=10.0.0.2 --host=tidb_6666_10.1.1.1 --key=TiDBaliveCheck --value=1

info from server: “processed: 1; failed: 0; total: 1; seconds spent: 0.000037”

sent: 1; skipped: 0; total: 1


3.2.2、具体

tidb_monitor

输入如下:

python tidb_monitor.py -c {$cluster_id1,$cluster_id2} (检查 指定tidb cluster) python tidb_monitor.py -a (检查 所有tidb cluster) python tidb_monitor.py -g (从mysql获取tidb集群信息,生成最新的配置文件) python tidb_monitor.py -m (检查zabbix的监控与cdb的一致性)

1】举例检查某个Tidb集群

tidb_monitor.py -c 6666-1

单个集群的检查时间:0.298s

【2 】举例检查全部Tidb集群,耗时0.936s

python tidb_monitor.py -a


3.3、一致性检查

python tidb_monitor.py -m

获取zabbix的host

检查zabbix多的,并删除

检查元信息库多的,并添加

【一致的情况】

bb842×87

【zabbix缺少监控的情况】


3.4、更新配置文件

配置文件里面记录了集群的拓扑信息,用于检查监控获取实例信息

tidb_monitor -g


3.5、配置文件


3.6、运行

放在管理机的crontab任务里面运行,后期与平台联动即可


4、zabbix部分

4.1、Template

TiDB


4.2、Applications


4.3、items


4.4、Triggers


4.5、Graphs


4.6、Actions


4.7、Users


4.8、 测试报警


4.9.1、宕机测试 – 微信


4.9.2、宕机测试 – 短信


4.9.3、宕机测试 – zabbix

bb885×40


4.9.4、ack测试

bb875×42


4.9.5、恢复测试–zabbix

bb872×31


4.9.6、恢复测试–微信


4.9.7、恢复测试– 短信


推荐阅读
  • redis 端口_使用Prometheus和Grafana构建Redis实时监控平台
    Redis作为缓存系统,在整个后端体系中是较为重要的一环,需要实时监控运行状态。现在有各种各样的工具都可以对Redis进行监控,例如&#x ... [详细]
  • 本文介绍了计算机网络的定义和通信流程,包括客户端编译文件、二进制转换、三层路由设备等。同时,还介绍了计算机网络中常用的关键词,如MAC地址和IP地址。 ... [详细]
  • Docker下Prometheus和Grafana三部曲之一:极速体验
    开源监控工具Prometheus目前广为使用,配合Grafana即可直观展现监控数据,但对于初学者来说搭建这样一个系统要花费些时间,或者有 ... [详细]
  • 快速搭建云原生开发环境(k8s+pv+prometheus+grafana)
    欢迎访问我的GitHub这里分类和汇总了欣宸的全部原创(含配套源码):https:github.comzq2599blog_demos本篇概览欣宸正在为接下新的Ja ... [详细]
  • 安装mysqlclient失败解决办法
    本文介绍了在MAC系统中,使用django使用mysql数据库报错的解决办法。通过源码安装mysqlclient或将mysql_config添加到系统环境变量中,可以解决安装mysqlclient失败的问题。同时,还介绍了查看mysql安装路径和使配置文件生效的方法。 ... [详细]
  • 如何去除Win7快捷方式的箭头
    本文介绍了如何去除Win7快捷方式的箭头的方法,通过生成一个透明的ico图标并将其命名为Empty.ico,将图标复制到windows目录下,并导入注册表,即可去除箭头。这样做可以改善默认快捷方式的外观,提升桌面整洁度。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念,以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器,包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实,适合初学者了解Tomcat的基础知识。 ... [详细]
  • 本文介绍了通过ABAP开发往外网发邮件的需求,并提供了配置和代码整理的资料。其中包括了配置SAP邮件服务器的步骤和ABAP写发送邮件代码的过程。通过RZ10配置参数和icm/server_port_1的设定,可以实现向Sap User和外部邮件发送邮件的功能。希望对需要的开发人员有帮助。摘要长度:184字。 ... [详细]
  • 如何在服务器主机上实现文件共享的方法和工具
    本文介绍了在服务器主机上实现文件共享的方法和工具,包括Linux主机和Windows主机的文件传输方式,Web运维和FTP/SFTP客户端运维两种方式,以及使用WinSCP工具将文件上传至Linux云服务器的操作方法。此外,还介绍了在迁移过程中需要安装迁移Agent并输入目的端服务器所在华为云的AK/SK,以及主机迁移服务会收集的源端服务器信息。 ... [详细]
  • flowable工作流 流程变量_信也科技工作流平台的技术实践
    1背景随着公司业务发展及内部业务流程诉求的增长,目前信息化系统不能够很好满足期望,主要体现如下:目前OA流程引擎无法满足企业特定业务流程需求,且移动端体 ... [详细]
  • 小程序自动授权和手动接入的方式及操作步骤
    本文介绍了小程序支持的两种接入方式:自动授权和手动接入,并详细说明了它们的操作步骤。同时还介绍了如何在两种方式之间切换,以及手动接入后如何下载代码包和提交审核。 ... [详细]
  • 2016 linux发行版排行_灵越7590 安装 linux (manjarognome)
    RT之前做了一次灵越7590黑苹果炒作业的文章,希望能够分享给更多不想折腾的人。kawauso:教你如何给灵越7590黑苹果抄作业​zhuanlan.z ... [详细]
  • 2017年的时候,我刚去上海,朋友内推我去美团面试,之前我也写过一个一篇文章,也是在美团面试中遇到的:关于慢SQL,我和面试官扯了很久,面试官也是很谦虚的,总是点头,自己以为回答的 ... [详细]
  • kubeadm构建k8s之Prometheusoperated监控(0.18.1)
       介绍:    大家好,k8s的搭建有许多方式,也有许多快速部署的,为了简化部署的复杂度,官方也提供了开源的kubeadm快速部署,最新1.10.x版本已经可以实现部署集群,  ... [详细]
author-avatar
贤慧201077
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有