有一DELL R730服务器,安装了PERC H730P mini阵列卡。
阵列卡固件版本:25.5.8.0001,系统BIOS版本:2.12.1,均为2021年3月时最新版。
该服务器近期报告故障,提示PERC电池(BBU)失效。采购新电池,并将服务器关机断电后进行了更换。
更换后开机,自检过程中仍然提示“The battery is currently discharged or disconnected…”以及“Waiting for POWERBACK to get completely charged.”
最后提示“POWERBACK charging is not completed.”
进入操作系统后,使用OpenManage或者iDRAC进行查看,BBU的状态仍然为failed。
以为新换的电池有问题,又更换了第二块新电池,仍然复现上述的现象没有任何改变。
两块新电池同时出故障的几率微乎其微,难道是PERC坏了?
查阅了DELL的官方文档,发现dell提供了一个工具名为perccli(即PERC-CLI,命令行下管理PERC的工具)。
perccli提供了对BBU进行查询和简单操作的功能。DELL官网提供下载,在服务器的SAS-RAID分类中。并且提供x86和x64两个版本。
(因故障服务器使用x64系统,故以x64版本的perccli64.exe进行示范。)
执行命令perccli64 /c0/bbu show all(“/c0/bbu”是连写的,无空格。因为服务器内只有这一块PERC,所以编号是0)
可以查询到如下信息:
(注:没能及时复制故障时的信息,下列信息均由健康电池产生)
BBU_Info :
========
----------------------
Property Value
----------------------
Type BBU
Voltage 3925 mV //当前电池电压
Current 0 mA //充放电电流,负数指示放电电流
Temperature 27 C //电池温度
Battery State Optimal //电池状态
----------------------
BBU_Capacity_Info :
=================
--------------------------------------
Property Value
--------------------------------------
Relative State of Charge 100%
Absolute State of charge 0%
Remaining Capacity 434 mAh //剩余容量
Full Charge Capacity 435 mAh //完全充满的容量
Run time to empty Unavailable
Average time to empty 35 min
Average Time to full Unavailable
Cycle Count 2
Max Error 0%
Remaining Capacity Alarm 0 mAh
Remaining Time Alarm 0 minutes(s)
--------------------------------------
BBU_Design_Info :
===============
--------------------------------
Property Value
--------------------------------
Date of Manufacture 00/00/0
Design Capacity 460 mAh //电池设计容量
Design Voltage 0 mV //下面这些显示不了都正常,出厂自带电池或者新买的配件电池,都显示不了。
Specification Info 0
Serial Number 0
Pack Stat Configuration 0
Manufacture Name 0x113
Device Name
Device Chemistry
Battery FRU N/A
Transparent Learn 1
App Data 1
Module Version 0.6
--------------------------------
故障状态下,在“剩余”和“完全充满”两个容量上,均只有89mAh。系统因电池的可用容量太小,而提示电池失效。
笔者推测,BBU电池初次报告失效,可能是因为旧电池容量损失过大。而新电池安装后,系统未能正确识别到。
笔者按这个思路,使用perccli64 /c0/bbu start learn命令,对新电池进行了一次校准操作。
可以使用perccli64 /c0/bbu show learn命令查看校准相关信息:
BBU Learn :
=========
-------------------------------------------------
Property Value
-------------------------------------------------
Auto Learn Mode Transparent
Schedule Time THU, June 3, 2021 at 20:54:18
Interval 12 Weeks 6 Days
Learn Cycle Active No //如显示“Yes”,则表示正在进行电池校准(learn cycle)
-------------------------------------------------
校准完成后,新电池容量正确显示为4xxmAh,BBU Failed状态自动解除。
文章来源:https://www.cnaaa.net,转载请注明出处:https://www.cnaaa.net/archives/9428