服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

做运维的都知道,服务器出点问题,就够我们受的,轻则被骂,重则丢饭碗,所以,每逢节假日,我们恨不得在机房点上三柱香、贴上几张符,给服务器和网络设备跪拜一番,求它们别出问题,也让我们过个清闲的假日。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

然而,服务器虽然有一两颗火热的心,但是他们出起问题来,却都是冰冷冷的,一点都不讲情面,总是留下我们在机房凌乱而慌张。

所以,给服务器配置邮件告警,让它有小问题的时候,及时主动地通知我们,是为上策,我们也好及时处理,防患于未然,免得出大问题的时候,手忙脚乱。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

本文以戴尔R740服务器为例,讲解邮件告警的配置过程,需要说明的是,戴尔服务器的iDRAC功能非常强大,硬件监测、系统安装和维修都不在话下,邮件告警只是其中一个功能而已。

直奔主题,打开“SMTP(电子邮件)服务器设置”,见图1,在不久以前,这些选项填写正确后,就能发送测试邮件了,但是现在基本上不行了,笔者测试了好多个品牌的邮箱,都发送失败了。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

正确的步骤如下:

1、到戴尔官网下载最新的iDRAC固件程序

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

2、服务器做了虚拟化,里面有一台虚拟服务器安装了Windows Server 2016,遗憾的是,在虚拟机里面升级iDRAC固件程序失败了。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

3、在iDRAC界面里面找到手动更新,上传刚才下载的固件程序,完成后直接安装即可,放心,服务器是不会自动重启的,也不必重启,安装完成后,会有短暂的几分钟无法登录iDRAC,那是固件在更新而已,不用担心。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂
服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

注意版本号,iDRAC固件已经升级到最新的5.0了。

  1. 现在可以配置SMTP服务器了,笔者使用的是腾讯企业邮箱,具体设置见下图,注意SMTP端口号465,和连接加密协议是配套的,需要根据邮件供应商的参数设置。
服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

设置完成后,一定要进行测试,确认能收到测试邮件,才表示邮件告警成功完成了第一步的配置。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

如果测试邮件发送失败,那么请检查是否为iDRAC配置了DNS服务器,没有配置正确的DNS服务器,邮件是无法发送的。见下图。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

有时候,你会发现,测试邮件是收到了,可是时间不对啊,那是因为没有配置正确时区和NTP服务器,不好意思,经与戴尔公司沟通,iDRAC界面并不支持直接设置时间,所以要想让邮件显示正确的时间,只能配置NTP服务器,笔者选择了阿里的NTP服务器,以保证时间的正确性。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂
服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

收到测试邮件,并且时间正确后,就可以配置警报了,先启用警报,然后配置警报的类别和问题的严重性,笔者简单粗暴地选择了“快速警报配置”,类别选择了“系统运行情况”、“存储”和“配置”,问题严重性选择了“严重”和“警告”。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

其实服务器硬件并不值钱,坏什么换什么就是了,数据是最重要的,所以一旦收到“存储”的警报邮件,哪怕只是个“警告”,也一定要严阵以待、谨慎处理,该换硬盘的时候,千万别心疼那几个硬盘钱,要是数据文件丢失了,那饭碗也就基本上丢了。

文章来源:https://www.cnaaa.net,转载请注明出处:https://www.cnaaa.net/archives/11815

(0)
凯影的头像凯影
上一篇 2024年5月22日 下午2:45
下一篇 2024年5月23日 下午2:12

相关推荐

  • 解决Composer Installing dependencies from lock file

    1、问题描述 2、原因 这是因为不匹配composer.json要求的版本。提示我的PHP 7版本太高,不符合composer.json需要的版本,但是在PHP 7下应该也是可以运行的,composer可以设置忽略版本匹配。 3、解决方案 composer install –ignore-platform-reqs 或者 composer update -…

    2023年2月14日
    1.2K00
  • Jenkins常见报错(持续更新)

    1、Jenkins连接Git仓库时候报错Permission denied, please try again. 解决方法(1): jenkins 使用root 用户运行jenkins (因为是使用的是Yum的安装方式,默认启动是以jenkins 用户运行的,但是我们签发的证书是在root 下签发的,所以提示权限拒绝) [root@jenkins .ssh]…

    2023年5月16日
    1.4K00
  • Windows主机入侵痕迹排查办法

    一、排查思路 在攻防演练保障期间,一线工程师在实施主机入侵痕迹排查服务时可能面临时间紧、任务急、需要排查的主机数量众多情况。为了确保实施人员在有限的时间范围内,可以高效且保证质量的前提下完成主机入侵痕迹排查工作,本人总结了自己的一些经验,下面的内容特此分享主机入侵痕迹排查服务中重点、关键的排查项,仅作为参考使用。 1.1初步筛选排查资产 一般情况下,客户资产…

    2023年3月3日
    1.4K00
  • CentOS7系统下扩容根目录

    利用单一磁盘的剩余空间 在同一块磁盘下,有剩余空间未分配,将该空间合并到根目录中 本文以/dev/sda为例 查看磁盘分区情况 lsblk或者fdisk -l /dev/sda 可以看到 sda 总容量为30G,而 sda1和 sda2 加起来总共使用了10G,因此我们可以将剩余的容量添加到目录中 对剩余空间进行分区格式化操作 fdisk /dev/sda …

    2022年6月9日
    1.5K00
  • linux查看某个文件夹的大小(ls命令、du命令详解)

    ls 命令:列出当前工作目录下的所有文件/文件夹的名称 使用ls -l,会显示成字节大小,ls- lh会以KB、MB等为单位进行显示更加直观。 du 命令:查看当前目录和子目录文件夹/文件大小情况 du = disk usage 磁盘使用率,输出每个文件或者目录总大小,其用法如下: du -sh:查看当前目录总大小。 du -sh *:查看当前目录所有子目录…

    2024年5月13日
    1.2K00

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

在线咨询: QQ交谈

邮件:712342017@qq.com

工作时间:周一至周五,8:30-17:30,节假日休息

关注微信