服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

做运维的都知道,服务器出点问题,就够我们受的,轻则被骂,重则丢饭碗,所以,每逢节假日,我们恨不得在机房点上三柱香、贴上几张符,给服务器和网络设备跪拜一番,求它们别出问题,也让我们过个清闲的假日。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

然而,服务器虽然有一两颗火热的心,但是他们出起问题来,却都是冰冷冷的,一点都不讲情面,总是留下我们在机房凌乱而慌张。

所以,给服务器配置邮件告警,让它有小问题的时候,及时主动地通知我们,是为上策,我们也好及时处理,防患于未然,免得出大问题的时候,手忙脚乱。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

本文以戴尔R740服务器为例,讲解邮件告警的配置过程,需要说明的是,戴尔服务器的iDRAC功能非常强大,硬件监测、系统安装和维修都不在话下,邮件告警只是其中一个功能而已。

直奔主题,打开“SMTP(电子邮件)服务器设置”,见图1,在不久以前,这些选项填写正确后,就能发送测试邮件了,但是现在基本上不行了,笔者测试了好多个品牌的邮箱,都发送失败了。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

正确的步骤如下:

1、到戴尔官网下载最新的iDRAC固件程序

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

2、服务器做了虚拟化,里面有一台虚拟服务器安装了Windows Server 2016,遗憾的是,在虚拟机里面升级iDRAC固件程序失败了。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

3、在iDRAC界面里面找到手动更新,上传刚才下载的固件程序,完成后直接安装即可,放心,服务器是不会自动重启的,也不必重启,安装完成后,会有短暂的几分钟无法登录iDRAC,那是固件在更新而已,不用担心。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂
服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

注意版本号,iDRAC固件已经升级到最新的5.0了。

  1. 现在可以配置SMTP服务器了,笔者使用的是腾讯企业邮箱,具体设置见下图,注意SMTP端口号465,和连接加密协议是配套的,需要根据邮件供应商的参数设置。
服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

设置完成后,一定要进行测试,确认能收到测试邮件,才表示邮件告警成功完成了第一步的配置。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

如果测试邮件发送失败,那么请检查是否为iDRAC配置了DNS服务器,没有配置正确的DNS服务器,邮件是无法发送的。见下图。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

有时候,你会发现,测试邮件是收到了,可是时间不对啊,那是因为没有配置正确时区和NTP服务器,不好意思,经与戴尔公司沟通,iDRAC界面并不支持直接设置时间,所以要想让邮件显示正确的时间,只能配置NTP服务器,笔者选择了阿里的NTP服务器,以保证时间的正确性。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂
服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

收到测试邮件,并且时间正确后,就可以配置警报了,先启用警报,然后配置警报的类别和问题的严重性,笔者简单粗暴地选择了“快速警报配置”,类别选择了“系统运行情况”、“存储”和“配置”,问题严重性选择了“严重”和“警告”。

服务器出问题了,作为IT,怎样才能第一个知道?免得被骂

其实服务器硬件并不值钱,坏什么换什么就是了,数据是最重要的,所以一旦收到“存储”的警报邮件,哪怕只是个“警告”,也一定要严阵以待、谨慎处理,该换硬盘的时候,千万别心疼那几个硬盘钱,要是数据文件丢失了,那饭碗也就基本上丢了。

文章来源:https://www.cnaaa.net,转载请注明出处:https://www.cnaaa.net/archives/11815

(0)
凯影的头像凯影
上一篇 2024年5月22日 下午2:45
下一篇 2024年5月23日 下午2:12

相关推荐

  • 统一身份认证系统 OpenLDAP 完整部署

    LDAP 介绍LDAP 是什么?在那些地方用会用到 LDAP?LDAP英文名称:Lightweight Directory Access Protocol 轻型目录访问协议。常用在单点登录,用户可以通过一个用户和密码登录多个服务,方便管理。目前我们使用的一下工具,Jenkins,GitLab,Jumpserver,Grafana,Confluence,Nex…

    2023年12月11日
    1.2K00
  • 七牛云对象存储使用 qshell 批量管理文件存储类型(实战教程)

    七牛云对象存储使用 qshell 批量管理文件存储类型(实战教程) 一、适用场景说明 本教程适用于以下典型场景: 二、前置条件 1️⃣ 准备 qshell 下载地址:https://github.com/qiniu/qshell/releases 确认版本(建议记录): 2️⃣ 七牛云 AccessKey / SecretKey 确保账号具备以下权限(至少)…

    2025年12月19日
    43100
  • HBase 详细图文介绍

    一、HBase 定义 Apache HBase™ 是 以 hdfs 为数据存储的 ,一种分布式、可扩展的 NoSQL 数据库。 二、HBase 数据模型 HBase 的设计理念依据 Google 的 BigTable 论文,论文中对于数据模型的首句介绍 。Bigtable 是一个稀疏的 、 分布式的 、 持久的多维排序 map 。之后对于映射的解释如下:该映…

    2023年12月15日
    1.1K00
  • CentOS 使用speedtest命令行测试网速

    安装speedtest-cli speedtest-cli是一个用Python编写的轻量级Linux命令行工具,在Python2.4至3.4版本下均可运行。它基于Speedtest.net的基础架构来测量网络的上/下行速率。安装speedtest-cli很简单——只需要下载其Python脚本文件。 使用speedtest-cli测试网速 输入这个命令后,它会…

    2022年6月28日
    1.5K00
  • Linux 时间同步 Chrony

    Chrony是NTP(Network Time Protocol,网络时间协议,服务器时间同步的一种协议)的另一种实现,与ntpd不同,它可以更快且更准确地同步系统时钟,最大程度的减少时间和频率误差。 在CentOS6中,默认是使用ntpd来同步时间的,但ntpd同步时间并不理想,有可能需要数小时来同步时间。而且ntp也已经很老了。所以在Centos7中换成…

    2023年1月6日
    1.7K00

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

在线咨询: QQ交谈

邮件:712342017@qq.com

工作时间:周一至周五,8:30-17:30,节假日休息

关注微信