一例IBM服务器Raid磁盘阵列故障

news/2024/11/26 1:23:03/

通常我们在服务器上做了硬件层面的Raid之后,用户拔掉任意一块硬盘,系统仍然能够正常工作。

不巧的是,某些情况下,由于疏忽大意,往往会造成意外的发生,今天就遇到了客户同时拔掉了奇偶校验的两块硬盘,而且是CMS的生产服务器,包括Oracle数据库【OMG!】

在ssh的终端直接抛出了一个io error后,整个Centos系统就崩溃了,不接受任何指令,包括reboot,

倒是tomcat竟然还能工作,这里小赞许一下,但好像servlet也不行了。

到机房直接断电重启,系统已经无法启动。服务器反复加载硬件,到硬盘这一步时,始终过不去,提示error。

按系统提示输入C键,进入Raid阵列管理,发现已经有两块磁盘Offline,badluck!

尝试将磁盘设置为Online,发现没有相关选项。

……经过IBM工程师一番折腾之后,操作系统总算恢复正常。但Oracle好像有点不太对头:

启动Oracle出现如下错误提示:

ORA-01113: file 3 needs media recovery

ORA-01110: data file 3: '/oracle/app/oradata/orcl/sysaux01.dbf'

按照提示要求执行:

sql >recovery datafile 3;

提示修复成功

但重启数据库后,在startup.log中又抛出如下错误:

ORA-00607: Internal error occurred while making a change to a data block
ORA-00600: internal error code, arguments: [4194], [49], [24], [], [], [], [],

看样子,Oracle在尝试回滚最近的数据时,遇到了麻烦。

OK,稀里糊涂搜索一通后,得到了一个相近的答案:

重建UNDO

SQL> startup mount
ORACLE instance started.
Total System Global Area  599785472 bytes
Fixed Size                  1220772 bytes
Variable Size             125833052 bytes
Database Buffers          465567744 bytes
Redo Buffers                7163904 bytes
Database mounted.

SQL> create undo tablespace undotbs02 datafile '/home/u01/app/oracle/oradata/orcl/undotbs02.dbf' size 100m
  2  ;
create undo tablespace undotbs02 datafile '/home/u01/app/oracle/oradata/orcl/undotbs02.dbf' size 100m
*
ERROR at line 1:
ORA-01109: database not open
SQL> select name from v$datafile;
NAME
--------------------------------------------------------------------------------
/home/u01/app/oracle/oradata/orcl/system01.dbf
/home/u01/app/oracle/oradata/orcl/undotbs01.dbf
/home/u01/app/oracle/oradata/orcl/sysaux01.dbf
/home/u01/app/oracle/oradata/orcl/users01.dbf
SQL> alter database datafile '/home/u01/app/oracle/oradata/orcl/undotbs01.dbf' offline drop;
Database altered.
SQL> alter database open;
Database altered.
SQL> archive log list;
Database log mode              No Archive Mode
Automatic archival             Disabled
Archive destination            USE_DB_RECOVERY_FILE_DEST
Oldest online log sequence     1056
Current log sequence           1058
SQL> create undo tablespace undotbs2 datafile '/home/u01/app/oracle/oradata/orcl/undotbs02.dbf' size 100m;
Tablespace created.
SQL> ALTER SYSTEM SET undo_tablespace='UNDOTBS2' ;
System altered.

通过以上设置,再次重启数据库,ok,一切恢复正常!

由此得出一个重要教训:服务器上的东西不要随便插入拔出

[此文在实际操作过程中发现日志中仍然存在警告,有异常,5个小时后,Oracle再次停掉]

【建议重新安装Oracle,Oracle修复过于复杂,除非有重要数据,不建议继续修复】


http://www.ppmy.cn/news/163992.html

相关文章

磁盘列阵技术介绍及其部署

文章目录 独立冗余磁盘列阵RAID0RAID1RAID5RAID1 0部署磁盘列阵 独立冗余磁盘列阵 RAID0 RAID0 技术是把多块 物理硬盘串联在一起, 组成一个大的卷组,并将数据一次写到各个物理硬盘。 RAID0 在读取速度上会有提升,成本低。但 如果有任意 一…

刀片服务器和磁盘阵列卡(RAID)技术

转自https://www.cnblogs.com/likehua/p/3682136.html http://blog.csdn.net/lishehe/article/details/19478387 近期客户需要更换服务器,客户把买好的服务器送来了,原本感觉很小的一个服务器,可当我看到的时候是一个大个的又长又宽&#xf…

IBM\浪潮\Dell\HP服务器raid(磁盘阵列)配置

1、IBM,浪潮使用LSI系列磁盘阵列卡的配置,服务器开机自检到logo画面后,下一步就会进入Raid卡自检过程,此时显示器上会出现Ctrl-H的字样,如图: LSI系列磁盘阵列卡raid 01、10配置参考:https://jingyan.baidu.com/articl…

网络爬虫技术在搜索引擎中的应用

网络爬虫技术在搜索引擎中扮演着非常重要的角色,主要应用在以下几个方面: 网页抓取:搜索引擎需要从互联网上抓取大量的网页,以建立自己的索引库。网络爬虫技术可以帮助搜索引擎快速、高效地抓取网页。 网页解析:搜索引…

硬盘结构及raid磁盘阵列

一、硬盘的结构(数据结构) 1、扇区:磁盘上的每个磁道被等分为若干个弧段,这些弧段便是硬盘的扇区(Sector),硬盘的第一个扇区,叫做引导扇区。 ①每个扇区大小一般为512字节。 ②磁盘存放数据的最小单位。 …

IBM磁盘阵列及文件系统的管理

一、几个基本概念 物理卷(PV):一个物理卷指一块硬盘 卷组(VG):卷组是可用物理硬盘的集合,可以逻辑地看成一块大硬盘 物理分区(PP):卷组中物理卷划分成固定大小…

24.RAID磁盘阵列

磁盘阵列称为独立冗余磁盘阵列。 磁盘阵列其实就是把多块独立的硬盘组合成一个容量巨大的硬盘组,利用个别硬盘提 供数据所产生加成效果提升整个硬盘系统效能,并通过存储冗余数据增加容错能力。 如果不组建硬盘阵列,你电脑里的两块硬盘是独立存…

【服务器数据恢复】IBM某型号服务器RAID5磁盘阵列数据恢复案例

服务器数据恢复环境: IBM某型号服务器; 5块SAS硬盘组成RAID5磁盘阵列; 存储划分为1个LUN和3个分区:第一个分区存放windows server系统,第二个分区存放SQL Server数据库,第三个分区存放备份文件。 服务器rai…