ceph集群单个数据盘的raid方式不同(单盘raid0、jbod、多盘raid0),所使用的服务器不同(惠普、戴尔等),因此在换盘时,如何能让管理系统识别这个新盘,所需要的操作也不同,通过改手册换盘,减去了底层手工格式化文件系统、启动osd等步骤;
2.1 服务器概况
厂商:Dell
型号:PowerEdge R720xd
系统盘:
2块hdd盘做raid1
数据盘:
hdd盘:单盘做raid0
2.2 更换系统盘
系统盘使用两个hdd盘做raid1的方式,坏了一个之后不影响系统盘的使用。并且可以直接换盘,raid信息不会丢失。
2.3 更换数据盘-HDD
容量盘使用单盘做raid0的方式,换盘后raid信息会丢失,需要重新做raid0;
2.3.1、更换硬盘
2.3.2、确认硬盘状态
/opt/MegaRAID/MegaCli/MegaCli64 -PDList -aALL
/opt/MegaRAID/MegaCli/MegaCli64 -LdPdInfo -aALL
查询坏盘:
/opt/MegaRAID/MegaCli/MegaCli64 -PDList -aALL --Nolog | grep -E 'Slot|Firmware state'/opt/MegaRAID/MegaCli/MegaCli64 -pdInfo -PhysDrv[32:2] -aALL
比如要更换的硬盘号为:[32:2]
2.3.3、在线配置raid0
1)在线做raid0
/opt/MegaRAID/MegaCli/MegaCli64 -CfgLdAdd -r0[32:2] WB Direct -a0
2)有cache的情况
出现报错:
“
FW error description:
The current operation is not allowed because the controller has data in cache for offline or missing virtual drives.
”
需要使用dell自带的OM-SrvAdmin工具配置
工具OM-SrvAdmin安装和操作方法
1、安装(软件安装包OM-SrvAdmin-Dell-Web-LX-8.4.0-2193.RHEL7.x86_64_A00.tar.gz在224.1的opt下)
yum install libcmpiCppImpl0 openwsman-server sblim-sfcb sblim-sfcc libwsman1 openwsman-client -y
yum install net-snmp-utils -y
tar -zxvf OM-SrvAdmin-Dell-Web-LX-8.4.0-2193.RHEL7.x86_64_A00.tar.gz
cd linux/supportscripts/
vim srvadmin-install.sh
(Maipo改为Source)
将Maipo改为适用我们系统版本的Source
安装:
./srvadmin-install.sh #进入选10,最后输入i安装
安装完成启动:
sh srvadmin-services.sh start
进入OM-SrvAdmin管理页面(https://$ip:1311/OMSALogin?msgStatus=null)
账号密码为操作系统的账号密码
清除cache后,可以重新做raid0;