服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

做运维的都知道,服务器出点问题,就够我们受的,轻则被骂,重则丢饭碗,所以,每逢节假日,我们恨不得在机房点上三柱香、贴上几张符,给服务器和网络设备跪拜一番,求它们别出问题,也让我们过个清闲的假日。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

然而,服务器虽然有一两颗火热的心,但是他们出起问题来,却都是冰冷冷的,一点都不讲情面,总是留下我们在机房凌乱而慌张。

所以,给服务器配置邮件告警,让它有小问题的时候,及时主动地通知我们,是为上策,我们也好及时处理,防患于未然,免得出大问题的时候,手忙脚乱。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

本文以戴尔R740服务器为例,讲解邮件告警的配置过程,需要说明的是,戴尔服务器的iDRAC功能非常强大,硬件监测、系统安装和维修都不在话下,邮件告警只是其中一个功能而已。

直奔主题,打开“SMTP(电子邮件)服务器设置”,见图1,在不久以前,这些选项填写正确后,就能发送测试邮件了,但是现在基本上不行了,笔者测试了好多个品牌的邮箱,都发送失败了。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

正确的步骤如下:

1、到戴尔官网下载最新的iDRAC固件程序

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

2、服务器做了虚拟化,里面有一台虚拟服务器安装了Windows Server 2016,遗憾的是,在虚拟机里面升级iDRAC固件程序失败了。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

3、在iDRAC界面里面找到手动更新,上传刚才下载的固件程序,完成后直接安装即可,放心,服务器是不会自动重启的,也不必重启,安装完成后,会有短暂的几分钟无法登录iDRAC,那是固件在更新而已,不用担心。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂
服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

注意版本号,iDRAC固件已经升级到最新的5.0了。

  1. 现在可以配置SMTP服务器了,笔者使用的是腾讯企业邮箱,具体设置见下图,注意SMTP端口号465,和连接加密协议是配套的,需要根据邮件供应商的参数设置。
服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

设置完成后,一定要进行测试,确认能收到测试邮件,才表示邮件告警成功完成了第一步的配置。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

如果测试邮件发送失败,那么请检查是否为iDRAC配置了DNS服务器,没有配置正确的DNS服务器,邮件是无法发送的。见下图。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

有时候,你会发现,测试邮件是收到了,可是时间不对啊,那是因为没有配置正确时区和NTP服务器,不好意思,经与戴尔公司沟通,iDRAC界面并不支持直接设置时间,所以要想让邮件显示正确的时间,只能配置NTP服务器,笔者选择了阿里的NTP服务器,以保证时间的正确性。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂
服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

收到测试邮件,并且时间正确后,就可以配置警报了,先启用警报,然后配置警报的类别和问题的严重性,笔者简单粗暴地选择了“快速警报配置”,类别选择了“系统运行情况”、“存储”和“配置”,问题严重性选择了“严重”和“警告”。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

其实服务器硬件并不值钱,坏什么换什么就是了,数据是最重要的,所以一旦收到“存储”的警报邮件,哪怕只是个“警告”,也一定要严阵以待、谨慎处理,该换硬盘的时候,千万别心疼那几个硬盘钱,要是数据文件丢失了,那饭碗也就基本上丢了。

文章来源:https://www.cnaaa.net,转载请注明出处:https://www.cnaaa.net/archives/11815

(0)
凯影的头像凯影
上一篇 2024年5月22日 下午2:45
下一篇 2024年5月23日 下午2:12

相关推荐

  • windows使用ipmitools管理ipmi

    今日有个服务器IPMI密码忘记,无法登陆,但是服务器不能够进行重启,并且还是windows系统,所以尝试通过ipmitool进行管理 首先安装ipmitool http://s.cnaaa11.com/soft/ipmitool.zip 服务器本地win系统下安装此工具,用于对自身服务器BMC发送指令,实现带内管理: 安装步骤: 1) 将IPMIToolWi…

    2024年5月7日
    1.1K00
  • linux centOS虚拟机出现entering emergency mode解决方案

    1、centos打开之后出现这个问题,迟迟打不开 按他的操作输入journalctl之后输入shift+g到日志最后查看报错发现是xfs(dm-0有问题) 输入xfs_repair -v -L /dev/dm-0因此修复 /dev/dm-0就可以了 -L 选项指定强制日志清零,强制xfs_repair将日志归零,即使它包含脏数据(元数据更改)。 #重启虚拟机…

    2024年1月11日
    1.1K00
  • 解决Ubuntu DNS覆盖写入127.0.0.53

    问题: ubuntu22.04解析网址时报错如图所示: 因为/etc/resolve.conf中存在 nameserver 127.0.0.53回环地址造成循环引用 原因: ubuntu17.0之后特有,systemd-resolvd服务会一直覆盖 解决方法: 1、修改resolv.config文件中的nameserver(选做),修改完后DNS解析就能恢复…

    2022年12月1日
    3.2K00
  • apache 设置ssl证书

    安装模块 安装mod_ssl和openssl 创建密钥存放的目录 上传证书和密钥到/etc/httpd/ssl目录下 验证证书和密钥的MD5 编辑配置文件 修改ssl.conf文件 打开ssl模块功能 在 /etc/httpd/conf.modules.d 目录下的 00-ssl.conf 配置文件找到 LoadModule ssl_module modul…

    2022年11月29日
    96600
  • 又见问题之-Windows Server 2012 R2 安装.net 4.6.1

    服务器是新版的Windows Server 2012 R2 ,今天安装一个软件,软件需要(.net v4.6.1)环境,发现报错,缺少.Netframework, Version=v4.6.1,直接下载对应版本的.Netframework 连续点击是,会跳转到 .net 的下载页面,选中所需的 .net 版本 下载安装之后报错,你需要先安装 对应于 KB29…

    2023年10月25日
    1.4K00

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

在线咨询: QQ交谈

邮件:712342017@qq.com

工作时间:周一至周五,8:30-17:30,节假日休息

关注微信