Dell服务器MegaCli命令只返回Exit Code: 0x00问题分析
SAS 6i/R的raid信息用MegaCli64命令就获取不到呢,SAS 6/iR 只支持2块硬盘做raid0或者raid1。现在返回去看看MegaCli64工具,MegaCli64工具虽然非常好用,功能也很多,不仅能查看RAID卡信息,而且还能设置RAID卡,但是它却不支持SAS 6/iR的RAID卡,Dell好多1U型号的服务器默认的RAID控制器都是SAS 6i/R ,而对于这款控制器MegaCli64是不能使用的。那为什么MegaCli64不支持SAS 6i/R呢,因为megacli是为PERC控制器设计的(它使用的是大家熟悉的megaraid驱动),但是SAS 6i/R控制器针对的是mpt*类型的驱动,所以MegaCli64取不出raid信息。不过想在命令行模式下想管理SAS 6i/R,可以使用Lsiutil这个工具。
因为megacli不支持SAS 6/iR卡,使用一款叫做lsiutil的绿色免安装工具来查看SAS 6/iR卡的信息。
链接:
ftp://ftp.ntplx.net/pub/LSI/LSIUtil_1.62.zip
如果你是debian/ubuntu系统,则可以下载相应的deb包
wget 'http://hwraid.le-vert.net/debian/pool-wheezy/lsiutil_1.60-1_amd64.deb'
dpkg -i lsiutil_1.60-1_amd64.deb
关于次问题的官方解释如下:
http://lists.us.dell.com/pipermail/linux-poweredge/2009-March/038758.html
实例 :
[root@k]# ./lsiutil 【交互式运行】
LSI Logic MPT Configuration Utility, Version 1.56, March 19, 20081 MPT Port foundPort Name Chip Vendor/Type/Rev MPT Rev Firmware Rev IOC1. /proc/mpt/ioc0 LSI Logic SAS1068E B3 105 00192f00 0Select a device: [1-1 or 0 to quit] 11. Identify firmware, BIOS, and/or FCode2. Download firmware (update the FLASH)4. Download/erase BIOS and/or FCode (update the FLASH)8. Scan for devices10. Change IOC settings (interrupt coalescing)13. Change SAS IO Unit settings16. Display attached devices20. Diagnostics21. RAID actions22. Reset bus23. Reset target42. Display operating system names for devices45. Concatenate SAS firmware and NVDATA files60. Show non-default settings61. Restore default settings69. Show board manufacturing information97. Reset SAS link, HARD RESET98. Reset SAS link99. Reset porte Enable expert mode in menusp Enable paged modew Enable loggingMain menu, select an option: [1-99 or e/p/w or 0 to quit] 69 --- 查看Raid 卡的信息板子名称【SAS6IR】Seg/Bus/Dev/Fun Board Name Board Assembly Board Tracer0 2 0 0 SAS6IRMain menu, select an option: [1-99 or e/p/w or 0 to quit] 8 ---扫描硬盘设备并打印设备状态SAS1068E's links are 3.0 G, 3.0 G, down, down, off, off, off, offB___T___L Type Vendor Product Rev SASAddress PhyNum0 0 0 Disk Dell VIRTUAL DISK 10280 8 0 EnclServ DP BACKPLANE 1.07 5942b0b02dcf1a00 8Hidden RAID Devices:B___T Device Vendor Product Rev SASAddress PhyNum0 1 PhysDisk 0 SEAGATE ST3600057SS ES62 5000c50023c4b95d 10 9 PhysDisk 1 SEAGATE ST3600057SS ES62 5000c50023c4bd95 0【查看Raid 状态】: 进入21 选项:Main menu, select an option: [1-99 or e/p/w or 0 to quit] 211. Show volumes2. Show physical disks3. Get volume state4. Wait for volume resync to complete23. Replace physical disk26. Disable drive firmware update mode27. Enable drive firmware update mode30. Create volume31. Delete volume32. Change volume settings33. Change volume name50. Create hot spare99. Reset porte Enable expert mode in menusp Enable paged modew Enable loggingRAID actions menu, select an option: [1-99 or e/p/w or 0 to quit] 2 ---查看设备在线状态1 volume is active, 2 physical disks are activePhysDisk 0 is Bus 0 Target 1PhysDisk State: onlinePhysDisk Size 572325 MB, Inquiry Data: SEAGATE ST3600057SS ES62Warning, page length in reply does not match page length in buffer(9 vs. 15)PhysDisk 1 is Bus 0 Target 9PhysDisk State: onlinePhysDisk Size 572325 MB, Inquiry Data: SEAGATE ST3600057SS ES62Warning, page length in reply does not match page length in buffer(9 vs. 15)注意,因为我的两块硬盘做得是Raid 0 ,如果你的磁盘做得是Raid 1 可以通过 【4. Wait for volume resync to complete】两块硬盘的同步状态RAID actions menu, select an option: [1-99 or e/p/w or 0 to quit] 4 ---我的是Raid 0Volume 0 State: optimal, enabled以下几个菜单可以在线创建阵列!30. Create volume31. Delete volume32. Change volume settings33. Change volume name50. Create hot spare#注意以上所有的退出使用阿拉数字零3、非交互方式查看SAS 6/iR卡信息如果你觉得上面的菜单选项比较麻烦,你也可以使用命令行模式完成!如下:lsiutil –p1 –a 8,21,4,0,0-p1 指1 MPT Port found-a 指你选择的菜单号,并使用逗号分开.0表示退出参数------即进入几个菜单,就是用几个0 做退出![root@k]# ./lsiutil -p1 -a 8,21,4,0,0LSI Logic MPT Configuration Utility, Version 1.56, March 19, 20081 MPT Port foundPort Name Chip Vendor/Type/Rev MPT Rev Firmware Rev IOC1. /proc/mpt/ioc0 LSI Logic SAS1068E B3 105 00192f00 0Main menu, select an option: [1-99 or e/p/w or 0 to quit] 8SAS1068E's links are 3.0 G, 3.0 G, down, down, off, off, off, off
B___T___L Type Vendor Product Rev SASAddress PhyNum0 0 0 Disk Dell VIRTUAL DISK 10280 8 0 EnclServ DP BACKPLANE 1.07 5942b0b02dcf1a00 8Hidden RAID Devices:B___T Device Vendor Product Rev SASAddress PhyNum0 1 PhysDisk 0 SEAGATE ST3600057SS ES62 5000c50023c4b95d 10 9 PhysDisk 1 SEAGATE ST3600057SS ES62 5000c50023c4bd95 0Main menu, select an option: [1-99 or e/p/w or 0 to quit] 21RAID actions menu, select an option: [1-99 or e/p/w or 0 to quit] 4Volume 0 State: optimal, enabledRAID actions menu, select an option: [1-99 or e/p/w or 0 to quit] 0Main menu, select an option: [1-99 or e/p/w or 0 to quit] 0
./lsiutil -p 1 -a 20,12,0,0 查看硬盘计数器./lsiutil -p 1 -a 21,1,0,0,0 查看逻辑卷状态
./lsiutil -p 1 -a 21,2,0,0,0 查看物理硬盘状态
状态值 对应含义
PhysDisk 0 is Bus 0 Target 3 编号
PhysDisk State: online 状态
Error Count 13, Last Error: Command = 28h, Key = 3, ASC/ASCQ = 11h/00h 错误计数器,大于0的话,就需要引起关注
./lsiutil -p 1 -i –s 显示端口1的设置和连接的设备./lsiutil –s 显示所有端口上连接的设备./lsiutil -p 2 -l 1 强制HBA卡端口2连接速度为1Gb./lsiutil –p1 –a 21,1,0,0,0 和上边菜单操作一样,只不过不用手动去选择菜单项了./lsiutil -p 1 -i –s 显示端口1的设置和连接的设备./lsiutil –s 显示所有端口上连接的设备./lsiutil -p 2 -l 1 强制HBA卡端口2连接速度为1Gb
./lsiutil -p 1 -a 21,1,0,0,0 — 查看逻辑卷状态
状态值 对应含义
Volume State: optimal, enabled 逻辑卷健康状况
Volume draws from Hot Spare Pools: 0 是否有热备
Volume Size 139392 MB, 2 Members 由几块硬盘组成
Primary is PhysDisk 1 (Bus 0 Target 9) 物理硬盘1
Secondary is PhysDisk 0 (Bus 0 Target 3) 物理硬盘0
./lsiutil.x86_64 -p1 -a 8,21,4,0,0
通常,我们使用的DELL/HP/IBM三家的机架式PC级服务器阵列卡是从LSI的卡OEM出来的,DELL和IBM两家的阵列卡原生程度较高,没有做太多封装,可以用原厂提供的阵列卡管理工具进行监控;而HP的阵列卡一般都做过封装了,因此需要使用自身特有的管理工具来监控。
本文以几种常用的阵列卡为例,展示其阵列卡及硬盘监控的方法。
DELL SAS 6/iR卡,全称LSI Logic SAS1068E,只支持RAID 0, RAID 1, RAID 1+0, 不支持RAID 5等高级RAID特性,不支持阵列卡电池。
DELL PERC PERC H700卡,全称LSI Logic MegaRAID SAS 2108,支持各种RAID级别及高级特性,可选配阵列卡电池。
DELL PERC H310 Mini卡 ,全称LSI Logic / Symbios Logic MegaRAID SAS 2008,支持常见RAID级别,不支持高级RAID特性,不支持阵列卡电池。
IBM ServeRAID M5014 SAS/SATA Controller卡,全称LSI Logic / Symbios Logic MegaRAID SAS 2108,支持各种RAID级别及高级特性,可选配阵列卡电池。
IBM ServeRAID-MR10i SAS/SATA Controller卡,全称LSI Logic / Symbios Logic MegaRAID SAS 1078,支持常见RAID级别,不支持高级RAID特性,可选配阵列卡电池,这个卡其实和DELL的PERC 6/i卡是一样的,都是基于LSI MegaRAID SAS 1078基础上OEM出来的。
hpacucli工具查看阵列、硬盘、电池信息,其实就只要一条指令:
hpacucli ctrl all show config detail — 查看阵列详细信息、配置
#hpacucli工具查看阵列、硬盘、电池信息,其实就只要一条指令:
# hpacucli ctrl all show config detail — 查看阵列详细信息、配置状态值 对应含义
Controller Status: OK 阵列卡状态
Firmware Version: 1.18 firmware版本,太低了建议升级,以提高稳定性及性能
Cache Board Present: True 是否配备了cache模块
Cache Status: OK cache模块状态
Cache Ratio: 100% Read / 0% Write cache策略,此处只有读cache,不用于写cache,因为没有bbu电池,见下方结果
Drive Write Cache: Disabled 关闭磁盘cache
Total Cache Size: 256 MB cache大小
Total Cache Memory Available: 208 MB 实际可用cache大小,和理论cache大小不一样,说明cache模块可能有问题
No-Battery Write Cache: Disabled 关闭FORCEWB策略
Battery/Capacitor Count: 0 阵列卡BBU电池数量为0,也就是没有BBU模块
Battery/Capacitor Status: Failed (Replace Batteries) 阵列卡BBU电池状态,这里显示是错误状态,需要及时更换
Array: A 第一个乌列阵列,编号从A开始,依次是A、B、C
Status: OK 物理阵列状态
Logical Drive: 1 第一个逻辑卷,编号从1开始
Fault Tolerance: RAID 5 第一个逻辑卷的阵列级别
Status: OK 第一个逻辑卷状态
Caching: Enabled 第一个逻辑卷是否启用了cache策略
physicaldrive 1I:1:1 第一块物理硬盘,编号从1开始
Status: OK 第一块物理硬盘状态
Firmware Revision: HPDA 第一块物理硬盘firmware,如果太低,也需要及时升级,HP的硬盘每个批次都有不同的firmware
参考链接 :
https://imysql.com/2014/09/11/pc-server-raid-controller-disk-health-monitoring.shtml
https://blog.csdn.net/cnbird2008/article/details/6968107
https://blog.51cto.com/cxj632840815/1339684
Dell服务器MegaCli命令只返回Exit Code: 0x00问题分析 :https://www.cnblogs.com/fjping0606/p/4885905.html