热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Linux服务器硬件运行状态及故障邮件提醒的监控脚本分享

这篇文章主要介绍了Linux服务器硬件运行状态及故障邮件提醒的监控脚本分享,能够测试CPU和内存的占用状况以及HTTP端的异常,需要的朋友可以参考下

监控硬件运行状况

shell 监控cpu,memory,load average,记录到log,当负载压力时,发电邮通知管理员。
原理:
1.获取cpu,memory,load average的数值
2.判断数值是否超过自定义的范围,例如(CPU>90%,Memory<10%,load average>2)
3.如数值超过范围,发送电邮通知管理员。发送有时间间隔,每小时只会发送一次。
4.将数值写入log。
5.设置crontab 每30秒运行一次。

ServerMonitor.sh

#!/bin/bash 
 
# 系统监控,记录cpu、memory、load average,当超过规定数值时发电邮通知管理员 
 
# *** config start *** 
 
# 当前目录路径 
ROOT=$(cd "$(dirname "$0")"; pwd) 
 
# 当前服务器名 
HOST=$(hostname) 
 
# log 文件路径 
CPU_LOG="${ROOT}/logs/cpu.log" 
MEM_LOG="${ROOT}/logs/mem.log" 
LOAD_LOG="${ROOT}/logs/load.log" 
 
# 通知电邮列表 
NOTICE_EMAIL='admin@admin.com' 
 
# cpu,memory,load average 记录上一次发送通知电邮时间 
CPU_REMARK='/tmp/servermonitor_cpu.remark' 
MEM_REMARK='/tmp/servermonitor_mem.remark' 
LOAD_REMARK='/tmp/servermonitor_loadaverage.remark' 
 
# 发通知电邮间隔时间 
REMARK_EXPIRE=3600 
NOW=$(date +%s) 
 
# *** config end *** 
 
 
# *** function start *** 
 
# 获取CPU占用 
function GetCpu() { 
  cpufree=$(vmstat 1 5 |sed -n '3,$p' |awk '{x = x + $15} END {print x/5}' |awk -F. '{print $1}') 
  cpuused=$((100 - $cpufree)) 
  echo $cpuused 
 
  local remark 
  remark=$(GetRemark ${CPU_REMARK}) 
 
  # 检查CPU占用是否超过90% 
  if [ "$remark" = "" ] && [ "$cpuused" -gt 90 ]; then 
    echo "Subject: ${HOST} CPU uses more than 90% $(date +%Y-%m-%d' '%H:%M:%S)" | sendmail ${NOTICE_EMAIL} 
    echo "$(date +%s)" > "$CPU_REMARK" 
  fi 
} 
 
# 获取内存使用情况 
function GetMem() { 
  mem=$(free -m | sed -n '3,3p') 
  used=$(echo $mem | awk -F ' ' '{print $3}') 
  free=$(echo $mem | awk -F ' ' '{print $4}') 
  total=$(($used + $free)) 
  limit=$(($total/10)) 
  echo "${total} ${used} ${free}" 
 
  local remark 
  remark=$(GetRemark ${MEM_REMARK}) 
 
  # 检查内存占用是否超过90% 
  if [ "$remark" = "" ] && [ "$limit" -gt "$free" ]; then 
    echo "Subject: ${HOST} Memory uses more than 90% $(date +%Y-%m-%d' '%H:%M:%S)" | sendmail ${NOTICE_EMAIL} 
    echo "$(date +%s)" > "$MEM_REMARK" 
  fi 
} 
 
# 获取load average 
function GetLoad() { 
  load=$(uptime | awk -F 'load average: ' '{print $2}') 
  m1=$(echo $load | awk -F ', ' '{print $1}') 
  m5=$(echo $load | awk -F ', ' '{print $2}') 
  m15=$(echo $load | awk -F ', ' '{print $3}') 
  echo "${m1} ${m5} ${m15}" 
 
  m1u=$(echo $m1 | awk -F '.' '{print $1}') 
 
  local remark 
  remark=$(GetRemark ${LOAD_REMARK}) 
 
  # 检查是否负载是否有压力 
  if [ "$remark" = "" ] && [ "$m1u" -gt "2" ]; then 
    echo "Subject: ${HOST} Load Average more than 2 $(date +%Y-%m-%d' '%H:%M:%S)" | sendmail ${NOTICE_EMAIL} 
    echo "$(date +%s)" > "$LOAD_REMARK" 
  fi 
} 
 
# 获取上一次发送电邮时间 
function GetRemark() { 
  local remark 
 
  if [ -f "$1" ] && [ -s "$1" ]; then 
    remark=$(cat $1) 
 
    if [ $(( $NOW - $remark )) -gt "$REMARK_EXPIRE" ]; then 
      rm -f $1 
      remark="" 
    fi 
  else 
    remark="" 
  fi 
 
  echo $remark 
} 
 
 
# *** function end *** 
 
cpuinfo=$(GetCpu) 
meminfo=$(GetMem) 
loadinfo=$(GetLoad) 
 
echo "cpu: ${cpuinfo}" >> "${CPU_LOG}" 
echo "mem: ${meminfo}" >> "${MEM_LOG}" 
echo "load: ${loadinfo}" >> "${LOAD_LOG}" 
 
exit 0 


监控网站是否异常
shell 监控网站是否异常的脚本,如有异常自动发电邮通知管理员。
流程:
1.检查网站返回的http_code是否等于200,如不是200视为异常。
2.检查网站的访问时间,超过MAXLOADTIME(10秒)视为异常。
3.发送通知电邮后,在/tmp/monitor_load.remark记录发送时间,在一小时内不重复发送,如一小时后则清空/tmp/monitor_load.remark。

#!/bin/bash 
 
SITES=("http://web01.example.com" "http://web02.example.com") # 要监控的网站 
NOTICE_EMAIL='me@example.com'                 # 管理员电邮 
MAXLOADTIME=10                        # 访问超时时间设置 
REMARKFILE='/tmp/monitor_load.remark'             # 记录时否发送过通知电邮,如发送过则一小时内不再发送 
ISSEND=0                           # 是否有发送电邮 
EXPIRE=3600                          # 每次发送电邮的间隔秒数 
NOW=$(date +%s) 
 
if [ -f "$REMARKFILE" ] && [ -s "$REMARKFILE" ]; then 
  REMARK=$(cat $REMARKFILE) 
   
  # 删除过期的电邮发送时间记录文件 
  if [ $(( $NOW - $REMARK )) -gt "$EXPIRE" ]; then 
    rm -f ${REMARKFILE} 
    REMARK="" 
  fi 
else 
  REMARK="" 
fi 
 
# 循环判断每个site 
for site in ${SITES[*]}; do 
 
  printf "start to load ${site}\n" 
  site_load_time=$(curl -o /dev/null -s -w "time_connect: %{time_connect}\ntime_starttransfer: %{time_starttransfer}\ntime_total: %{time_total}" "${site}") 
  site_access=$(curl -o /dev/null -s -w %{http_code} "${site}") 
  time_total=${site_load_time##*:} 
 
  printf "$(date '+%Y-%m-%d %H:%M:%S')\n" 
  printf "site load time\n${site_load_time}\n" 
  printf "site access:${site_access}\n\n" 
 
  # not send 
  if [ "$REMARK" = "" ]; then 
    # check access 
    if [ "$time_total" = "0.000" ] || [ "$site_access" != "200" ]; then 
      echo "Subject: ${site} can access $(date +%Y-%m-%d' '%H:%M:%S)" | sendmail ${NOTICE_EMAIL} 
      ISSEND=1 
    else 
      # check load time 
      if [ "${time_total%%.*}" -ge ${MAXLOADTIME} ]; then 
        echo "Subject: ${site} load time total:${time_total} $(date +%Y-%m-%d' '%H:%M:%S)" | sendmail ${NOTICE_EMAIL} 
        ISSEND=1 
      fi 
    fi 
  fi 
 
done 
 
# 发送电邮后记录发送时间 
if [ "$ISSEND" = "1" ]; then 
  echo "$(date +%s)" > $REMARKFILE 
fi 
 
exit 0 


推荐阅读
  • 本文介绍了在rhel5.5操作系统下搭建网关+LAMP+postfix+dhcp的步骤和配置方法。通过配置dhcp自动分配ip、实现外网访问公司网站、内网收发邮件、内网上网以及SNAT转换等功能。详细介绍了安装dhcp和配置相关文件的步骤,并提供了相关的命令和配置示例。 ... [详细]
  • 这是原文链接:sendingformdata许多情况下,我们使用表单发送数据到服务器。服务器处理数据并返回响应给用户。这看起来很简单,但是 ... [详细]
  • 本文介绍了使用AJAX的POST请求实现数据修改功能的方法。通过ajax-post技术,可以实现在输入某个id后,通过ajax技术调用post.jsp修改具有该id记录的姓名的值。文章还提到了AJAX的概念和作用,以及使用async参数和open()方法的注意事项。同时强调了不推荐使用async=false的情况,并解释了JavaScript等待服务器响应的机制。 ... [详细]
  • PHP设置MySQL字符集的方法及使用mysqli_set_charset函数
    本文介绍了PHP设置MySQL字符集的方法,详细介绍了使用mysqli_set_charset函数来规定与数据库服务器进行数据传送时要使用的字符集。通过示例代码演示了如何设置默认客户端字符集。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • Centos7.6安装Gitlab教程及注意事项
    本文介绍了在Centos7.6系统下安装Gitlab的详细教程,并提供了一些注意事项。教程包括查看系统版本、安装必要的软件包、配置防火墙等步骤。同时,还强调了使用阿里云服务器时的特殊配置需求,以及建议至少4GB的可用RAM来运行GitLab。 ... [详细]
  • 本文介绍了在Hibernate配置lazy=false时无法加载数据的问题,通过采用OpenSessionInView模式和修改数据库服务器版本解决了该问题。详细描述了问题的出现和解决过程,包括运行环境和数据库的配置信息。 ... [详细]
  • 如何使用Java获取服务器硬件信息和磁盘负载率
    本文介绍了使用Java编程语言获取服务器硬件信息和磁盘负载率的方法。首先在远程服务器上搭建一个支持服务端语言的HTTP服务,并获取服务器的磁盘信息,并将结果输出。然后在本地使用JS编写一个AJAX脚本,远程请求服务端的程序,得到结果并展示给用户。其中还介绍了如何提取硬盘序列号的方法。 ... [详细]
  • 本文介绍了如何找到并终止在8080端口上运行的进程的方法,通过使用终端命令lsof -i :8080可以获取在该端口上运行的所有进程的输出,并使用kill命令终止指定进程的运行。 ... [详细]
  • 禁止程序接收鼠标事件的工具_VNC Viewer for Mac(远程桌面工具)免费版
    VNCViewerforMac是一款运行在Mac平台上的远程桌面工具,vncviewermac版可以帮助您使用Mac的键盘和鼠标来控制远程计算机,操作简 ... [详细]
  • 本文详细介绍了云服务器API接口的概念和作用,以及如何使用API接口管理云上资源和开发应用程序。通过创建实例API、调整实例配置API、关闭实例API和退还实例API等功能,可以实现云服务器的创建、配置修改和销毁等操作。对于想要学习云服务器API接口的人来说,本文提供了详细的入门指南和使用方法。如果想进一步了解相关知识或阅读更多相关文章,请关注编程笔记行业资讯频道。 ... [详细]
  • 阿,里,云,物,联网,net,core,客户端,czgl,aliiotclient, ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 如何基于ggplot2构建相关系数矩阵热图以及一个友情故事
    本文介绍了如何在rstudio中安装ggplot2,并使用ggplot2构建相关系数矩阵热图。同时,通过一个友情故事,讲述了真爱难觅的故事背后的数据量化和皮尔逊相关系数的概念。故事中的小伙伴们在本科时参加各种考试,其中有些沉迷网络游戏,有些热爱体育,通过他们的故事,展示了不同兴趣和特长对学习和成绩的影响。 ... [详细]
  • 如何用UE4制作2D游戏文档——计算篇
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了如何用UE4制作2D游戏文档——计算篇相关的知识,希望对你有一定的参考价值。 ... [详细]
author-avatar
mobiledu2502872687
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有