作者:Jeffrey Hunter
了解如何以低于 2,700 美元的费用在 Oracle Enterprise Linux 上安装并配置 Oracle RAC 11g 第 2 版开发集群。
本指南中的信息未经 Oracle 验证,且不受 Oracle 支持,您在使用时只能风险自负;本指南仅供教学使用。
2009 年 11 月更新
目录
- 简介
- Oracle RAC 11g 概述
- 共享存储概述
- iSCSI 技术
- 硬件及成本
- 安装 Linux 操作系统
- 安装 Oracle RAC 所需的 Linux 程序包
- 网络配置
- 集群时间同步服务
- 安装 Openfiler
- 使用 Openfiler 配置 iSCSI 卷
- 在 Oracle RAC 节点上配置 iSCSI 卷
- 创建任务角色划分操作系统权限组、用户和目录
- 使用 X 终端登录远程系统
- 为 Oracle 配置 Linux 服务器
- 配置 RAC 节点以便可以使用 SSH 进行远程访问(可选)
- 适用于这两个 Oracle RAC 节点的所有启动命令
- 安装并配置 ASMLib 2.0
- 下载 Oracle RAC 11g 第 2 版软件
- 集群的 Oracle Grid Infrastructure 的安装前任务
- 为集群安装 Oracle Grid Infrastructure
- 集群的 Oracle Grid Infrastructure 的安装后任务
- 为数据和快速恢复区创建 ASM 磁盘组
- 在 Oracle Real Application Clusters 中安装 Oracle Database 11g
- 安装 Oracle Database 11g Examples(以前的随附 CD)
- 创建 Oracle 集群数据库
- 数据库创建后任务(可选)
- 创建/更改表空间
- 验证 Oracle Grid Infrastructure 和数据库配置
- 启动/停止集群
- 故障排除
- 总结
- 致谢
|
1. 简介
熟悉 Oracle Real Application Clusters (RAC) 11g 技术的最有效方法之一是访问一个实际的 Oracle RAC 11g 集群。没有什么方法比直接体验它们能够更好地理解其优势了,这些优势包括容错、安全性、负载平衡和可伸缩性。
遗憾的是,对于很多商家而言,典型的生产级 RAC 配置所需的硬件投入使它们无法实现这一目标。一个小型的只有两个节点的集群可能花费 10,000 美元至 20,000 美元以上,此花费甚至不包括 RAC 生产环境的核心 — 共享存储。大多数情况下,这会是一个存储区域网 (SAN),起价通常为 10,000 美元。
对于那些没有大笔现金但希望熟悉 Oracle RAC 11g 的人们而言,本指南提供了一种低成本的替代方法来配置 Oracle RAC 11g 第 2 版系统,它使用现成的商用组件和可下载的软件,估计成本在 2,200 美元到 2,700 美元之间。该系统将由一个双节点集群组成,这两个节点均运行适用于 x86_64 的 Oracle Enterprise Linux (OEL) 第 5 版 Update 4、适用于 Linux x86_64 的 Oracle RAC 11g 第 2 版和 ASMLib 2.0。Oracle RAC 的所有共享磁盘存储将基于 iSCSI,iSCSI 使用在第三个节点(该节点在本文中称为网络存储服务器)上运行的 Openfiler 2.3 版 x86_64。
尽管本文应与 Red Hat Enterprise Linux 一同使用,但 Oracle Enterprise Linux(免费提供)也可满足需要(即使不能更为稳定),它包括 ASMLib 软件包(不包括 ASMLib 用户空间库,这个需要单独下载)。
本指南仅供教学使用,因此安装很简单,仅用于演示想法和概念。例如,本文中共享的 Oracle 集群件文件(OCR 和表决文件)以及所有物理数据库文件将仅安装在一个物理磁盘上,而实际上应在多个物理驱动器上配置这些文件。另外,每个 Linux 节点仅配置两个网络接口 — eth0 用于连接公共网络, eth1 用于 Oracle RAC 专用互连“和”连接网络存储服务器以便进行共享 iSCSI 访问。而在实现生产级 RAC 时,专用互连至少应是千兆位级(或以上)、有冗余路径,并且“仅”供 Oracle 用来传输 Cluster Manager 和 Cache Fusion 的相关数据。应在另一个冗余的千兆位网络上配置第三个专用网络接口(例如, eth2)以访问网络存储服务器 (Openfiler)。
Oracle 文档
尽管本指南提供了成功安装完整的 Oracle RAC 11g 系统的详细说明,但它绝不能替代 Oracle 官方文档(参见下面的列表)。除本指南外,用户还应参考以下 Oracle 文档,以便全面了解 Oracle RAC 11g 的其他配置选项、安装和管理。Oracle 的官方文档网站是 docs.oracle.com。
- Oracle Grid Infrastructure 安装指南 — 适用于 Linux 的 11g 第 2 版 (11.2)
- Clusterware 管理和部署指南 — 11g 第 2 版 (11.2)
- Oracle Real Application Clusters 安装指南 — 适用于 Linux 和 UNIX 的 11g 第 2 版 (11.2)
- Real Application Clusters 管理和部署指南 — 11g 第 2 版 (11.2)
- Oracle Database 两日速成和 Real Application Clusters 指南 — 11g 第 2 版 (11.2)
- Oracle 数据库存储管理员指南 — 11g 第 2 版 (11.2)
网络存储服务器
Openfiler 构建于 rPath Linux 之上,它是一个基于浏览器的免费网络存储管理实用程序,可在一个框架中提供基于文件的网络连接存储 (NAS) 和基于块的存储区域网 (SAN)。整个软件体系与许多开源应用程序(如 Apache、Samba、LVM2、ext3、Linux NFS 和 iSCSI Enterprise Target)相连接。Openfiler 将这些随处可见的技术组合到一个易于管理的小型管理解决方案中,该解决方案的前端是一个基于 Web 的功能强大的管理界面。
Openfiler 支持 CIFS、NFS、HTTP/DAV 和 FTP,但是,我们将仅使用它的 iSCSI 功能为 Oracle RAC 11g 所需的共享存储组件实现低成本的 SAN。操作系统和 Openfiler 应用程序将安装在一个内置 SATA 磁盘上。另一个内置 73GB 15K SCSI 硬盘将被配置为一个“卷组”,用于满足所有共享磁盘存储需求。Openfiler 服务器将配置为使用该卷组进行基于 iSCSI 的存储,并且将在我们的 Oracle RAC 11g 配置中使用该服务器存储 Oracle Grid Infrastructure 和 Oracle RAC 数据库所需的共享文件。
Oracle Grid Infrastructure 11g 第 2 版 (11.2)
在 Oracle Grid Infrastructure 11g 第 2 版 (11.2) 中,自动存储管理 (ASM) 和 Oracle Clusterware 软件一起打包到一个二进制版本中并安装到同一个主目录中,这个主目录称为 Grid Infrastructure 主目录。为了使用 Oracle RAC 11g 第 2 版,您必须安装 Grid Infrastructure。在安装程序的询问过程之后,会启动配置助手以配置 ASM 和 Oracle Clusterware。虽然这种组合的产品安装称为 Oracle Grid Infrastructure,但 Oracle Clusterware 和 Automatic Storage Manager 仍然是独立的产品。
在集群中的两个节点上安装并配置 Oracle Grid Infrastructure 后,下一步将是在两个 Oracle RAC 节点上安装 Oracle RAC 软件。
在本文中,我们在两个节点上使用可选的作业角色划分 配置来安装 Oracle Grid Infrastructure 和 RAC 软件。我们会为每个 Oracle 软件产品创建一个操作系统用户作为该产品的所有者 —“grid”作为 Oracle Grid Infrastructure 的所有者,“oracle”作为 Oracle RAC 软件的所有者。在本文中, grid 的用户是我们创建作为 Oracle Grid Infrastructure 二进制文件所有者的用户。该用户将是 Oracle Clusterware 和 Oracle 自动存储管理二进制文件的所有者。而 oracle 的用户是我们创建作为 Oracle 数据库二进制文件 (Oracle RAC) 所有者的用户。这两个 Oracle 软件所有者必须以 Oracle Inventory 组 (oinstall) 作为其主组,这样每个 Oracle 软件安装所有者都有权写入中央清单 (oraInventory),以便正确设置 OCR 和 Oracle Clusterware 资源的权限。Oracle RAC 软件所有者还必须以 OSDBA 组和可选的 OSOPER 组作为其辅助组。
自动存储管理和 Oracle Clusterware 文件
如上所述,自动存储管理 (ASM) 现在已与 Oracle Clusterware 完全集成在 Oracle Grid Infrastructure 中。Oracle ASM 和 Oracle Database 11g 第 2 版提供了较以前版本更为增强的存储解决方案。该解决方案能够在 ASM 上存储 Oracle Clusterware 文件,即 Oracle 集群注册表 (OCR) 和表决文件(VF,又称为表决磁盘)。这一特性使 ASM 能够提供一个统一的存储解决方案,无需使用第三方卷管理器或集群文件系统即可存储集群件和数据库的所有数据。
和数据库文件一样,Oracle Clusterware 文件也存储在 ASM 磁盘组中,从而使用 ASM 磁盘组的冗余配置。例如,一个常规冗余 配置的 ASM 磁盘组将保存一个双向镜像的 OCR。磁盘组中一个磁盘出现故障不会妨碍对 OCR 的访问。就高冗余 配置的 ASM 磁盘组(三向镜像)而言,两个独立的磁盘出现故障不会影响对 OCR 的访问。而采用外部冗余 配置,Oracle 不提供任何保护。
为了防止物理磁盘故障,Oracle 针对每个磁盘组只允许一个 OCR。在生产系统中配置 Oracle Clusterware 文件时,Oracle 建议使用常规或高冗余配置的 ASM 磁盘组。如果在操作系统级或硬件级已存在磁盘镜像,您可以使用外部冗余配置。
对表决文件的管理类似于 OCR。这些文件遵循 ASM 磁盘组的冗余配置,但是其管理方式不同于磁盘组中的常规 ASM 文件。每个表决磁盘放置在磁盘组的一个特定磁盘上。表决文件的磁盘及其在磁盘上的位置存储在 Oracle Clusterware 内部。
下面的示例说明,在使用本指南安装 Oracle Grid Infrastructure 后 ASM 如何存储 Oracle Clusterware 文件。要查看 OCR,请使用 ASMCMD:
[grid@racnode1 ~]$ asmcmd
ASMCMD> ls -l +CRS/racnode-cluster/OCRFILE
Type Redund Striped Time Sys Name
OCRFILE UNPROT COARSE NOV 22 12:00:00 Y REGISTRY.255.703024853
从以上示例可以看出,在列出 +CRS/racnode-cluster/OCRFILE 目录中的所有 ASM 文件后,只显示了 OCR (REGISTRY.255.703024853)。上面未列出表决文件,这是因为表决文件的管理方式不同于常规 ASM 文件。要找到 Oracle 集群件内表决文件的位置,使用如下的 crsctl query css votedisk 命令:
[grid@racnode1 ~]$ crsctl query css votedisk
## STATE File Universal Id File Name Disk group
-- ----- ----------------- --------- ---------1. ONLINE 4cbbd0de4c694f50bfd3857ebd8ad8c4 (ORCL:CRSVOL1) [CRS]
Located 1 voting disk(s).
如果您决定不使用 ASM 管理 OCR 和表决磁盘文件,Oracle Clusterware 仍然允许将这些文件存储在一个集群文件系统(如 Oracle Cluster File System 第 2 版 (OCFS2))或 NFS 系统中。请注意,除非现有系统正在进行升级,否则不再支持在原始设备或块设备上安装 Oracle Clusterware 文件。
此指南的以前版本使用 OCFS2 存储 OCR 和表决磁盘文件。本指南将在 ASM 上存储 OCR 和表决磁盘文件,具体是存储在一个名为 +CRS 的磁盘组中,该磁盘组使用外部冗余 配置,只有一个 OCR 位置和一个表决磁盘位置。ASM 磁盘组应在共享存储器上创建,大小至少为 2GB。
Oracle 物理数据库文件(数据、联机重做日志、控制文件、存档重做日志)将安装在 ASM 上一个名为 +RACDB_DATA 的 ASM 磁盘组中,而快速恢复区将在一个名为 +FRA 的 ASM 磁盘组上创建。
两个 Oracle RAC 节点和网络存储服务器配置如下:
节点 | |||||
节点名称 | 实例名称 | 数据库名称 | 处理器 | RAM | 操作系统 |
racnode1 | racdb1 | racdb. idevelopment. info | 1 个双核 Intel Xeon,3.00 GHz | 4GB | OEL 5.4 - (x86_64) |
racnode2 | racdb2 | 1 个双核 Intel Xeon,3.00 GHz | 4GB | OEL 5.4 - (x86_64) | |
openfiler1 | 2 个 Intel Xeon,3.00 GHz | 6GB | Openfiler 2.3 - (x86_64) | ||
网络配置 | |||||
节点名称 | 公共 IP 地址 | 专用 IP 地址 | 虚拟 IP 地址 | SCAN 名称 | SCAN IP 地址 |
racnode1 | 192.168.1.151 | 192.168.2.151 | 192.168.1.251 | racnode-cluster-scan | 192.168.1.187 |
racnode2 | 192.168.1.152 | 192.168.2.152 | 192.168.1.252 | ||
openfiler1 | 192.168.1.195 | 192.168.2.195 | |||
Oracle 软件组件 | |||||
软件组件 | 操作系统用户 | 主组 | 辅助组 | 主目录 | Oracle 基目录/Oracle 主目录 |
Grid Infrastructure | grid | oinstall | asmadmin、asmdba、asmoper | /home/grid | /u01/app/grid /u01/app/11.2.0/grid |
Oracle RAC | oracle | oinstall | dba、oper、asmdba | /home/oracle | /u01/app/oracle /u01/app/oracle/product/11.2.0/dbhome_1 |
存储组件 | |||||
存储组件 | 文件系统 | 卷大小 | ASM 卷组名 | ASM 冗余 | Openfiler 卷名 |
OCR/表决磁盘 | ASM | 2GB | +CRS | External | racdb-crs1 |
数据库文件 | ASM | 32GB | +RACDB_DATA | External | racdb-data1 |
快速恢复区 | ASM | 32GB | +FRA | External | racdb-fra1 |
本文仅作为绝对不可替代的文档。此处唯一的例外是供应商硬件的选择(即,计算机、网络设备和内置/外置硬盘驱动器)。确保您从供应商处购买的硬件在 Enterprise Linux 5 和 Openfiler 2.3(最终版本)上受支持。
如果您要寻找一个基于 Oracle Enterprise Linux 5.3 和 iSCSI 利用 Oracle RAC 10g 第 2 版的示例,请单击此处。
2. Oracle RAC 11g 概述
在介绍构建 RAC 集群的详细信息之前,首先阐明集群的定义将很有帮助。集群是一组两个或多个互连的计算机或服务器,对最终用户和应用程序来说,它们就像是一台服务器,通常共享同一组物理磁盘。集群的主要优势在于提供了一个高可用的框架,在该框架中,一个节点(例如,运行一个 Oracle 实例的数据库服务器)出现故障不会中断整个应用程序。如果其中一个服务器出现故障,其他正常运行的(一个或多个)服务器可以接管故障服务器的负载,应用程序继续正常运行,就像什么都没有发生。
实际上,集群计算机的概念在几十年前就出现了。第一个成功的集群产品由 DataPoint 在 1977 年开发完成,该产品名为 ARCnet。ARCnet 产品在实验室的学术环境中获得了很大成功,但未能真正投放到商业市场。直到 20 世纪 80 年代,Digital Equipment Corporation (DEC) 才发布了针对 VAX/VMS 操作系统的 VAX 集群产品。
随着针对 Digital VAX 集群产品的 Oracle 6 发布,Oracle 成为在数据库级别支持集群的第一个商业数据库。但是不久之后,Oracle 意识到还需要一个更高效、可伸缩性更强的分布式锁管理器 (DLM),因为 VAX/VMS 集群产品中的锁管理器不太适合数据库应用程序。Oracle 决定为 VAX/VMS 集群产品设计并编写自己的 DLM,以提供数据库所需的细粒度块级锁定。Oracle 自己的 DLM 包含在 Oracle 6.2 中,这导致诞生了 Oracle Parallel Server (OPS) — 第一个运行并行服务器的数据库。
OPS 在 Oracle 7 中得到了扩展,不仅支持 VAX/VMS 集群产品,还支持大多数 UNIX 环境。该框架不仅要求供应商提供的集群件运行良好,还要适用于复杂的环境,以设置并管理所涉及的多个给定层。在 Oracle 8 中,Oracle 引入了一个集成到 Oracle 内核中的通用锁管理器。在更高版本的 Oracle 中,这称为集成分布式锁管理器 (IDLM),依赖于称为操作系统依赖 (OSD) 层的附加层。这个新模型为 Oracle 铺平了道路,使其不仅拥有自己的 DLM,还可以在未来版本中创建自己的集群件产品。
随 Oracle9i 一同推出的 Oracle Real Application Clusters (RAC) 是 Oracle Parallel Server 的后续版本。由于使用了相同的 IDLM,Oracle 9i 仍然可以依赖于外部集群件,但它是包含自己的集群件产品(称为 Cluster Ready Services (CRS))的第一个版本。在 Oracle 9i 中,CRS 只能用于 Windows 和 Linux。到了 Oracle 10g 第 1 版,Oracle 的集群件产品可用于所有操作系统,成为了 Oracle RAC 所需的集群技术。随着 Oracle 数据库 10g 第 2 版 (10.2) 的发布,Cluster Ready Services 被重命名为 Oracle Clusterware。如果使用 Oracle 10g 或更高版本,Oracle Clusterware 是大多数运行 Oracle RAC 的平台所需的唯一集群件(不包括 Tru 集群,在这种情况下,您需要供应商集群件)。您仍然可以使用其他供应商的集群件(如果该集群件通过了认证),但是请记住,Oracle RAC 仍然需要 Oracle Clusterware,因为它与数据库软件完全集成。本指南使用 Oracle Clusterware,该集群件从 11g 第 2 版 (11.2) 开始就是 Oracle Grid Infrastructure 的一个组件了。
与 OPS 一样,Oracle RAC 允许多个实例同时访问同一个数据库(存储)。通过允许系统进行扩展,RAC 提供了容错、负载平衡和性能优势。同时,由于所有实例都访问同一个数据库,因此一个节点出现故障不会导致无法访问数据库。
Oracle RAC 的核心是共享磁盘子系统。集群中的每个实例都必须能够访问集群中所有其他实例的所有数据、重做日志文件、控制文件和参数文件。为了使所有实例都能访问数据库,数据磁盘必须全局可用。每个实例都有自己的、可在本地读写的重做日志文件和 UNDO 表空间。集群中的其他实例必须能够访问这些文件(只读),以便在系统出现故障时恢复该实例。一个实例的重做日志文件只能由该实例自己写入,其他实例只能在系统故障期间读取该实例。另一方面,UNDO 可以在正常数据库操作(例如,CR 构建)期间随时读取。
Oracle RAC 与 OPS 之间的最大区别在于使用了缓存融合技术。使用 OPS 时,从一个实例到另一个实例的数据请求需要首先将数据写到磁盘,然后请求实例才能读取该数据(获得必需的锁之后)。此过程称为磁盘 ping。而使用缓存融合,数据沿着使用复杂锁定算法的高速互连链路传递。
并非所有数据库集群解决方案都使用共享存储。一些供应商使用联合集群 方法,在这种方法中,数据分布在多台计算机中,而不是由所有计算机共享。但是,对于 Oracle RAC,多个实例使用一组相同的磁盘存储数据。Oracle 的集群方法利用了集群中所有节点的集体处理能力,同时提供了故障切换安全性。
Dell、IBM 和 HP 等供应商提供了预先配置的面向生产环境的 Oracle RAC 解决方案。但是,本文将重点讨论如何使用 Linux 服务器和低成本的共享磁盘解决方案 iSCSI 整合您自己的 Oracle RAC 11g 环境以进行开发和测试。
有关 Oracle RAC 的更多背景知识,请访问 OTN 上的 Oracle RAC 产品中心。
3. 共享存储概述
现在,光纤通道是最流行的共享存储解决方案之一。前面曾提到过,光纤通道是一种高速串行传输接口,用于在点到点 (FC-P2P)、仲裁环路 (FC-AL) 或交换式拓扑结构 (FC-SW) 中连接系统与存储设备。光纤通道支持的协议包括 SCSI 和 IP。光纤通道配置最多可支持 127 个节点,每个方向上最高可实现每秒 2.12 Gb 的吞吐量,预期可达 4.25 Gbps。
但是,光纤通道的价格很昂贵。单是光纤通道交换机的起价就可能需要约 1,000 美元。这还不包括光纤通道存储阵列和高端驱动器,一个 36GB 驱动器的价格可达 300 美元左右。典型的光纤通道安装包括用于服务器的光纤通道卡。基本安装的费用为大约 10,000 美元,还不包括构成集群的服务器的成本。
光纤通道的一种较为便宜的替代方法是 SCSI。SCSI 技术提供了可接受的共享存储性能。但对于那些习惯了基于 GPL 的 Linux 价格的管理员和开发人员来说,即使是 SCSI(一个双节点集群的价格在 2,000 美元到 5,000 美元左右)也可能超出预算。
另一种流行的解决方案是基于 NAS 的 Sun NFS(网络文件系统)。只有在您使用网络设备或类似的设备时,它才可以用于共享存储。具体来说就是,您需要拥有能够保证在 NFS 上进行直接 I/O、将 TCP 作为传输协议并且读/写块大小为 32K 的服务器。有关可用于 Oracle RAC 的受支持的网络连接存储 (NAS) 设备,请参见 Oracle Metalink 上的 Certify 页面。其中一个主要缺陷限制了使用 NFS 和 NAS 进行数据库存储的优势,即,性能降低和复杂的配置要求。标准的 NFS 客户端软件(使用操作系统提供的 NFS 驱动程序的客户端系统)没有针对 Oracle 数据库文件 I/O 访问模式进行优化。随着 Oracle 11g 的推出,一个称为 Direct NFS Client 的新特性将 NFS 客户端功能直接集成到 Oracle 软件中。通过该集成,Oracle 可以优化 Oracle 软件与 NFS 服务器之间的 I/O 路径,从而显著提高性能。Direct NFS Client 可以为数据库负载简化(在许多情况下可以自动化)NFS 客户端配置的性能优化。要了解有关 Direct NFS Client 的更多信息,请参阅标题为“Oracle 数据库 11g Direct NFS Client ”的 Oracle 白皮书。
本文将采用的共享存储基于 iSCSI 技术,使用网络存储服务器(随 Openfiler 安装)。该解决方案提供了一个低成本的光纤通道替代方案,只用于测试和教学目的。考虑到方案中使用低端硬件,不应将其用于生产环境。
4. iSCSI 技术
多年以来,光纤通道存储区域网 (FC SAN) 是构建基于网络的存储解决方案所使用的唯一技术。基于以前的一组 ANSI 协议(称为光纤分布式数据接口 (FDDI)),开发了光纤通道以在存储网络上移动 SCSI 命令。
FC SAN 的优势包括提高了性能、磁盘利用率、可用性以及可伸缩性等,但最重要的是支持服务器集群!但是,FC SAN 现在仍受三个主要缺点的限制。首先是价格。尽管构建 FC SAN 的成本在近几年有所下降,但进入成本对于 IT 预算有限的小公司来说仍然是高的惊人。第二个缺点是硬件组件不兼容。采用 FC SAN 之后,许多产品制造商对光纤通道规范的解释各不相同,从而导致许多互连问题。如果从公共制造商购买光纤通道组件,这通常不是一个问题。第三个缺点是光纤通道网络不是以太网!它需要一种不同的网络技术,并要求数据中心人员具备另外一组技能。
随着千兆位以太网的普及以及对降低成本的需要,基于 iSCSI 的存储系统逐渐成为光纤通道的有力竞争对手。现在,iSCSI SAN 仍然是 FC SAN 的最大竞争者。
2003 年 2 月 11 日,经过 Internet 工程任务组 (IETF) 的批准,Internet 小型计算机系统接口(一般称为 iSCSI)成为一个基于 Internet 协议 (IP) 的存储网络标准,用于建立和管理基于 IP 的存储设备、主机和客户端之间的连接。iSCSI 是 SCSI-3 规范框架中定义的数据传输协议,它与光纤通道的类似之处在于它也负责在存储网络上运送块级数据。块级通信意味着数据以“块”的形式在主机和客户端之间传输。数据库服务器依赖此类通讯(而不是大多数 NAS 系统使用的文件级通讯)来工作。与 FC SAN 一样,iSCSI SAN 是一个专用于存储的单独物理网络,但其组件与典型 IP 网络 (LAN) 中的组件基本相同。
尽管 iSCSI 拥有光明的前景,但早期的批评很快指出了其在性能方面的内在不足。iSCSI 的优势是能够利用大家熟悉的 IP 网络作为传输机制。但是,TCP/IP 协议非常复杂并且占用过多的 CPU 资源。而使用 iSCSI,大部分对数据进行的处理(TCP 和 iSCSI)都由软件执行,比完全通过硬件处理的光纤通道慢得多。将每个 SCSI 命令映射到等价 iSCSI 事务所带来的开销过大。对许多公司来说,解决方案是取消 iSCSI 软件启动器,投资能够从服务器 CPU 中卸载 TCP/IP 和 iSCSI 处理的专用卡。这些专用卡有时称为 iSCSI 主机总线适配器 (HBA) 或 TCP 卸载引擎 (TOE) 卡。还要考虑到目前 10 Gb 以太网是主流!
与其他新技术一样,iSCSI 具有一组自己的缩略语和术语。对于本文来说,用户只需要了解 iSCSI 启动器与 iSCSI 目标之间的区别即可。
iSCSI 启动器
从本质上说,iSCSI 启动器是一个客户端设备,它连接到服务器(在本例中是 iSCSI 目标)提供的某一服务,并发起对该服务的请求。iSCSI 启动器软件需要安装在每个 Oracle RAC 节点(racnode1 和 racnode2)上。
iSCSI 启动器可以用软件实现,也可以用硬件实现。软件 iSCSI 启动器可用于大部分主要操作系统平台。对于本文,我们将使用 iscsi-initiator-utils RPM 中提供的免费 Linux Open-iSCSI 软件驱动程序。iSCSI 软件启动器通常与标准网络接口卡 (NIC)(大多数情况下是千兆位以太网卡)配合使用。硬件启动器是一个 iSCSI HBA(或 TCP 卸载引擎 (TOE) 卡),它本质上只是一个专用以太网卡,其上的 SCSI ASIC 可以从系统 CPU 内卸载所有工作(TCP 和 SCSI 命令)。iSCSI HBA 可以从许多供应商处购买,包括 Adaptec、Alacritech、Intel 和 QLogic。
iSCSI 目标
iSCSI 目标是 iSCSI 网络的“服务器”组件。它通常是一个存储设备,包含您所需的信息并响应来自(一个或多个)启动器的请求。对于本文,节点 openfiler1 将是 iSCSI 目标。
因此,根据有关 iSCSI 的所有这些讨论,是否意味着光纤通道很快就会消失?可能不会。多年以来,光纤通道凭借其极快的速度、灵活性和强健的可靠性,为自己的能力提供了有力的证明。对高性能存储、大型复杂连接以及任务关键可靠性有严格要求的客户将毫不犹豫地继续选择光纤通道。
在结束本节内容之前,我认为应该提供一个列表,对各种类型的磁盘接口和网络技术的速度进行一番比较。对于每种接口,我提供了以每秒千位 (kb)、千字节 (KB)、兆位 (Mb)、兆字节 (MB)、千兆位 (Gb) 以及千兆字节 (GB) 为单位的最大传输速率,较常用的以灰色突出显示。
磁盘接口/网络/总线 | 速度 | |||||
Kb | KB | Mb | MB | Gb | GB | |
串行 | 115 | 14.375 | 0.115 | 0.014 | ||
并行(标准) | 920 | 115 | 0.92 | 0.115 | ||
10Base-T 以太网 | 10 | 1.25 | ||||
IEEE 802.11b 无线 Wi-Fi(2.4 GHz 频带) | 11 | 1.375 | ||||
USB 1.1 | 12 | 1.5 | ||||
并行 (ECP/EPP) | 24 | 3 | ||||
SCSI-1 | 40 | 5 | ||||
IEEE 802.11g 无线 WLAN(2.4 GHz 频带) | 54 | 6.75 | ||||
SCSI-2(快速 SCSI/快速窄带 SCSI) | 80 | 10 | ||||
100Base-T 以太网(高速以太网) | 100 | 12.5 | ||||
ATA/100(并行) | 100 | 12.5 | ||||
IDE | 133.6 | 16.7 | ||||
快速宽带 SCSI(宽带 SCSI) | 160 | 20 | ||||
Ultra SCSI(SCSI-3 / Fast-20 / Ultra 窄带) | 160 | 20 | ||||
Ultra IDE | 264 | 33 | ||||
宽带 Ultra SCSI(快速宽带 20) | 320 | 40 | ||||
Ultra2 SCSI | 320 | 40 | ||||
FireWire 400 — (IEEE1394a) | 400 | 50 | ||||
USB 2.0 | 480 | 60 | ||||
宽带 Ultra2 SCSI | 640 | 80 | ||||
Ultra3 SCSI | 640 | 80 | ||||
FireWire 800 — (IEEE1394b) | 800 | 100 | ||||
千兆位以太网 | 1000 | 125 | 1 | |||
PCI —(33 MHz / 32 位) | 1064 | 133 | 1.064 | |||
串行 ATA I — (SATA I) | 1200 | 150 | 1.2 | |||
宽带 Ultra3 SCSI | 1280 | 160 | 1.28 | |||
Ultra160 SCSI | 1280 | 160 | 1.28 | |||
PCI —(33 MHz / 64 位) | 2128 | 266 | 2.128 | |||
PCI —(66 MHz / 32 位) | 2128 | 266 | 2.128 | |||
AGP 1x —(66 MHz / 32 位) | 2128 | 266 | 2.128 | |||
串行 ATA II — (SATA II) | 2400 | 300 | 2.4 | |||
Ultra320 SCSI | 2560 | 320 | 2.56 | |||
FC-AL 光纤通道 | 3200 | 400 | 3.2 | |||
PCI-Express x1 —(双向) | 4000 | 500 | 4 | |||
PCI —(66 MHz / 64 位) | 4256 | 532 | 4.256 | |||
AGP 2x —(133 MHz / 32 位) | 4264 | 533 | 4.264 | |||
串行 ATA III — (SATA III) | 4800 | 600 | 4.8 | |||
PCI-X —(100 MHz / 64 位) | 6400 | 800 | 6.4 | |||
PCI-X —(133 MHz / 64 位) | 1064 | 8.512 | 1 | |||
AGP 4x —(266 MHz / 32 位) | 1066 | 8.528 | 1 | |||
10G 以太网 — (IEEE 802.3ae) | 1250 | 10 | 1.25 | |||
PCI-Express x4 —(双向) | 2000 | 16 | 2 | |||
AGP 8x —(533 MHz / 32 位) | 2133 | 17.064 | 2.1 | |||
PCI-Express x8 —(双向) | 4000 | 32 | 4 | |||
PCI-Express x16 —(双向) | 8000 | 64 | 8 |
5. 硬件及成本
用于构建示例 Oracle RAC 11g 环境的硬件包括三个 Linux 服务器(两个 Oracle RAC 节点和一个网络存储服务器),以及可以在许多本地计算机商店或通过互联网购买到的组件。
下面,我们将开始安装过程。既然我们已经讨论了将在本示例中使用的硬件,下面我们对连接好所有硬件组件后的环境进行概念性的了解(单击下图查看大图像):
图 1:体系结构
在开始详细说明安装过程之前,请注意本文中的大部分任务需要在两个 Oracle RAC 节点(racnode1 和 racnode2)上执行。我将在每节开始处指出是应在这两个 Oracle RAC 节点上还是在网络存储服务器 (openfiler1) 上执行该任务。
6. 安装 Linux 操作系统
在集群中的两个 Oracle RAC 节点上执行以下安装步骤。
本节总结了用于安装 Linux 操作系统的各个屏幕。本指南与适用于 x86_64 的 Oracle Enterprise Linux 第 5 版 Update 4 配合使用,并且遵循 Oracle 的如下建议:执行“默认 RPM”安装类型以确保拥有成功进行 Oracle RDBMS 安装所需的 Linux 操作系统程序包。
在两个 Oracle RAC 节点上安装 Oracle Enterprise Linux 之前,应已安装好两个 NIC 接口卡,这两个接口卡将分别用于公共网络和专用网络。
根据您的硬件体系结构,下载适用于 x86 或 x86_64 的 Oracle Enterprise Linux 第 5 版 Update 4 的以下 ISO 映像。
针对 Oracle Enterprise Linux 的 Oracle E-Delivery 网站32 位 (x86) 安装
- V17787-01.zip (582 MB)
- V17789-01.zip (612 MB)
- V17790-01.zip (620 MB)
- V17791-01.zip (619 MB)
- V17792-01.zip (267 MB)
下载 Oracle Enterprise Linux 操作系统之后,解压缩每个文件。您将获得以下 ISO 映像,需要将其刻录到 CD 上:
- Enterprise-R5-U4-Server-i386-disc1.iso
- Enterprise-R5-U4-Server-i386-disc2.iso
- Enterprise-R5-U4-Server-i386-disc3.iso
- Enterprise-R5-U4-Server-i386-disc4.iso
- Enterprise-R5-U4-Server-i386-disc5.iso
注:如果 Linux RAC 节点安装了 DVD,您可能会发现使用如下的单个 DVD 映像更方便:
- V17793-01.zip (2.7 GB)
解压缩该单个 DVD 映像文件后将其刻录到一张 DVD 中:
- Enterprise-R5-U4-Server-i386-dvd.iso
64 位 (x86_64) 安装
- V17795-01.zip (580 MB)
- V17796-01.zip (615 MB)
- V17797-01.zip (605 MB)
- V17798-01.zip (616 MB)
- V17799-01.zip (597 MB)
- V17800-01.zip (198 MB)
下载 Oracle Enterprise Linux 操作系统之后,解压缩每个文件。您将获得以下 ISO 映像,需要将其刻录到 CD 上:
- Enterprise-R5-U4-Server-x86_64-disc1.iso
- Enterprise-R5-U4-Server-x86_64-disc2.iso
- Enterprise-R5-U4-Server-x86_64-disc3.iso
- Enterprise-R5-U4-Server-x86_64-disc4.iso
- Enterprise-R5-U4-Server-x86_64-disc5.iso
- Enterprise-R5-U4-Server-x86_64-disc6.iso
注:如果 Linux RAC 节点安装了 DVD,您可能会发现使用如下的单个 DVD 映像更为方便:
- V17794-01.zip (3.2 GB)
解压缩该单个 DVD 映像文件后将其刻录到一张 DVD 中:
- Enterprise-R5-U4-Server-x86_64-dvd.iso
如果您将以上 ISO 文件下载到 MS Windows 计算机,可以使用多种方法将这些映像(ISO 文件)刻录到一张 CD/DVD 上。您可能很熟悉这个过程,并且已经拥有合适的软件,可以将映像刻录到 CD/DVD。如果您不熟悉这个过程,并且没有将映像刻录到 CD/DVD 所需的软件,这里提供了两个软件程序包(实际上有许多个)供您使用:
- UltraISO
- Magic ISO Maker
下载 Oracle Enterprise Linux 映像(ISO 文件)并将其刻录到 CD/DVD 后,将 OEL 1 号盘插入第一个服务器(在本示例中是 racnode1),打开电源,然后按照以下说明回应安装屏幕的提示。在第一个节点上安装完 Linux 后,在第二个节点上执行相同的 Linux 安装,但将节点名 racnode1 替换为 racnode2 并设定另一个合适的 IP 地址。
引导屏幕
第一个屏幕是 Oracle Enterprise Linux 引导屏幕。在 boot:提示符处按 [Enter] 键启动安装过程。
介质测试
当要求测试 CD 介质时,用 Tab 键切换到 [Skip] 并按 [Enter] 键。如果有错误,介质刻录软件应该已经向我们发出警告。在几秒钟后,安装程序将会检测视频卡、显示器和鼠标。然后安装程序进入 GUI 模式。
欢迎使用 Oracle Enterprise Linux
在欢迎屏幕上,单击 [Next] 继续。
语言/键盘选项
接下来的两个屏幕提示您进行语言和键盘设置。请为您的配置作出合适的选择。
检测以前的安装
注意,如果安装程序检测到以前版本的 Oracle Enterprise Linux,它将询问您是“Install Enterprise Linux”还是“Upgrade an existing Installation”。始终选择“Install Enterprise Linux”。
磁盘分区设置
选中 [Remove all partitions on selected drives and create default layout],选中 [Review and modify partitioning layout] 选项。单击 [Next] 继续。
此时会显示一个对话窗口,询问您是否真的要删除所有 Linux 分区。单击 [Yes] 回复这一警告。
分区
随后安装程序将允许您查看(如果需要还可以修改)它自动选择的磁盘分区。对于大多数自动布局,安装程序将为 /boot 分配 100MB 空间,为交换分区分配 RAM 的双倍数量(系统 RAM <= 2,048MB 时)或 RAM 的同等数量(系统 RAM > 2,048MB 时),而将剩余空间分配给根 (/) 分区。从 RHEL 4 开始,安装程序将创建与刚才提到的相同的磁盘配置,但将使用逻辑卷管理器 (LVM) 创建它们。例如,它将第一个硬盘驱动器(我的配置使用 /dev/sda)划分为两个分区 — 一个用于 /boot 分区 (/dev/sda1),而磁盘的剩余部分专用于 LVM 指定的 VolGroup00 (/dev/sda2)。然后,将 LVM 卷组 (VolGroup00) 划分为两个 LVM 分区 — 一个用于根文件系统 (/),另一个用于交换分区。
在分区阶段,主要是要确保为 Oracle 分配了足够的交换空间(可用 RAM 的倍数)。下面是 Oracle 的最小交换空间要求:
可用 RAM | 所需交换空间 |
介于 1,024MB 和 2,048MB 之间 | RAM 大小的 1.5 倍 |
介于 2,049MB 和 8,192MB 之间 | 与 RAM 大小相同 |
超过 8,192MB | RAM 大小的 0.75 倍 |
就本安装而言,我将接受所有自动选用的大小。(包括 5,952MB 的交换空间,因为我安装了 4GB 的 RAM。)
如果出于任何原因,自动布局无法配置足够数量的交换空间,您可以通过此屏幕轻松地进行更改。要增加交换分区的大小,单击 [Edit] 编辑卷组 VolGroup00。这将显示“Edit LVM Volume Group:VolGroup00”对话框。首先,单击 [Edit] 进行编辑,减少根文件系统 (/) 的大小(减少的数量是您要添加到交换分区的数量)。例如,要为交换分区添加 512MB 的空间,您需要将根文件系统的大小减少 512MB(即,36,032MB - 512MB = 35,520MB)。现在,将您从根文件系统减少的空间 (512MB) 添加到交换分区。完成后,单击“Edit LVM Volume Group:VolGroup00”对话框中的 [OK]。
如果您对磁盘布局满意,单击 [Next] 继续。
引导加载程序配置
安装程序默认情况下将使用 GRUB 引导加载程序。要使用 GRUB 引导加载程序,接受所有默认值并单击 [Next] 继续。
网络配置
在开始安装操作系统之前,我已确认在每个 Linux 计算机上安装了两个 NIC 接口(卡)。本屏幕应该已经成功地检测到每个网络设备。由于我们要在该计算机上安装 Oracle 数据库,因此需要对网络配置进行一些更改。当然,您在此处的设置取决于您的网络配置。关键的一点是永远不要使用 DHCP 配置该计算机,因为该机算机将用作驻留 Oracle 数据库服务器的主机。您需要使用静态 IP 地址配置该计算机。您还需要使用实际主机名配置服务器。
首先,确保将每个网络设备设置为 [Active on boot]。默认情况下,安装程序可能选择不激活 eth1。
接下来,单击 [Edit],按照以下方法对 eth0 和 eth1 进行编辑。验证已选中“Enable IPv4 support”选项。单击选中“Manual configuration”单选按钮可取消选中“Dynamic IP configuration (DHCP)”选项,然后为您的环境配置一个静态 IP 地址和网络掩码。单击取消选中“Enable IPv6 support”选项。您可能要为本指南中的 eth0 和 eth1 使用不同的 IP 地址,这没有问题。可以将 eth1(互连)置于不同于 eth0(公共网络)的子网中:
eth0:
- 选中 [Enable IPv4 support] 选项
- 取消选中 [Dynamic IP configuration (DHCP)] 选项 —(选择人工配置)
IPv4 地址:192.168.1.151
前缀(网络掩码):255.255.255.0
- 取消选中 [Enable IPv6 support] 选项
eth1:
- 选中 [Enable IPv4 support] 选项
- 取消选中 [Dynamic IP configuration (DHCP)] 选项 —(选择人工配置)
IPv4 地址:192.168.2.151
前缀(网络掩码):255.255.255.0
- 取消选中 [Enable IPv6 support] 选项
接着,手动设置主机名。我对第一个节点使用“racnode1”,对第二个节点使用“racnode2”。然后提供您的网关和 DNS 服务器,最后关闭该对话框。
时区选择
为您的环境选择适当的时区,然后单击 [Next] 继续。
设置根口令
选择一个根口令,然后单击 [Next] 继续。
程序包安装默认值
默认情况下,Oracle Enterprise Linux 将安装一台典型服务器所需的大部分软件。但成功安装 Oracle 软件还需要若干其他程序包 (RPM)。运行安装程序时,您可以选择“Customize software”添加 RPM 分组,如“Development Libraries”或“Legacy Library Support”。添加这样的 RPM 分组不成问题。然而,取消选择任何“默认的 RPM”分组或单个的 RPM 可能会导致 Oracle Grid Infrastructure 和 Oracle RAC 安装尝试失败。
对于本文,选中 [Customize now] 单选按钮,然后单击 [Next] 继续。
您可以在这里选择要安装的程序包。Oracle 软件需要的大部分程序包都集中在“程序包组”中(即 Application -> Editors)。由于这些节点上将驻留 Oracle Grid Infrastructure 和 Oracle RAC 软件,请验证至少选择安装以下程序包组。注意,对于许多 Linux 程序包组,并不是所有与该组关联的程序包都被选择进行安装。(选择一个程序包组之后,请注意“Optional packages”按钮。)因此,尽管选择了安装该程序包组,但 Oracle 需要的某些程序包还是没有安装。实际上,Oracle 需要的某些程序包不属于任何 可用的程序包组(例如 libaio-devel)。不要担心。下一节将提供适用于 Oracle Enterprise Linux 5 的 Oracle Grid Infrastructure 11g 第 2 版和 Oracle RAC 11g 第 2 版所需程序包的完整列表。安装操作系统之后,需要从 Oracle Enterprise Linux CD 手动安装这些程序包。现在,安装以下程序包组:
- Desktop Environments
- GNOME Desktop Environment
- Applications
- Editors
- Graphical Internet
- Text-based Internet
- Development
- Development Libraries
- Development Tools
- Legacy Software Development
- Servers
- Server Configuration Tools
- Base System
- Administration Tools
- Base
- Java
- Legacy Software Support
- System Tools
- X Window System
除了上述程序包外,还可选择您希望为此节点安装的任何其他程序包,请记住,不要取消选择任何“默认”的 RPM 程序包。选择要安装的程序包之后,单击 [Next] 继续。
准备安装
该屏幕本质上是一个确认屏幕。单击 [Next] 开始安装。如果您使用 CD 安装 Oracle Enterprise Linux,在安装过程中,系统会根据您选择安装的程序包来要求您更换 CD。
恭喜
大功告成。您已经在第一个节点 (racnode1) 上成功安装了 Oracle Enterprise Linux。安装程序将从 CD-ROM 驱动器中弹出 CD/DVD。取出 CD/DVD,单击 [Reboot] 重新引导系统。
安装后向导欢迎屏幕
当系统第一次引导进入 Oracle Enterprise Linux 时,将为您显示另一个 Welcome 屏幕,进入“Post Installation Wizard”。安装后向导允许您进行最终的 O/S 配置设置。在“Welcome”屏幕上,单击 [Forward] 继续。
许可协议
阅读许可协议。选择“Yes, I agree to the License Agreement”,然后单击 [Forward] 继续。
防火墙
在该屏幕上,确保选中 [Disabled] 选项,然后单击 [Forward] 继续。
系统将显示一个警告对话框,提示您未设置防火墙。显示该对话框之后,单击 [Yes] 继续。
SELinux
在 SELinux 屏幕上,选中 [Disabled] 选项,然后单击 [Forward] 继续。
系统将显示一个警告对话框,提示您更改 SELinux 设置需要重新引导系统以便重新标记整个文件系统。显示该对话框之后,单击 [Yes] 确认在第一次引导(安装后向导)完成后将重新引导系统。
Kdump
接受 Kdump 屏幕上的默认设置(禁用),然后单击 [Forward] 继续。
日期和时间设置
如果需要,调整日期和时间设置,然后单击 [Forward] 继续。
创建用户
如果需要,创建其他(非 oracle)操作系统用户帐户,然后单击 [Forward] 继续。对于本文,我不会创建任何其他操作系统帐户。在本指南稍后我将创建“grid”和“oracle”用户帐户。
如果您选择不定义任何其他操作系统用户帐户,单击 [Continue] 确认警告对话框。
声卡
只有当向导检测到声卡时,才会出现该屏幕。在声卡屏幕上,单击 [Forward] 继续。
其他 CD
在“Additional CDs”屏幕上,单击 [Finish] 继续。
重新引导系统
由于我们更改了 SELinux 选项(更改为 disabled),系统将提示重新引导系统。单击 [OK] 重新引导系统以便正常使用。
登录屏幕
重新引导计算机之后,将为您显示登录屏幕。使用“root”用户帐户和在安装期间提供的口令登录。
在第二个节点上进行相同的安装
在第一个节点上安装完 Linux 后,在第二个节点 (racnode2) 上重复上述步骤。确保计算机名和网络进行了正确配置。在我的安装中, racnode2 的配置如下:
首先,确保将每个网络设备设置为 [Active on boot]。安装程序可能选择不激活 eth1。
接下来,单击 [Edit],按照以下方法对 eth0 和 eth1 进行编辑。验证已选中“Enable IPv4 support”选项。单击选中“Manual configuration”单选按钮可取消选中“Dynamic IP configuration (DHCP)”选项,然后为您的环境配置一个静态 IP 地址和网络掩码。单击取消选中“Enable IPv6 support”选项。您可能要为本指南中的 eth0 和 eth1 使用不同的 IP 地址,这没有问题。可以将 eth1(互连)置于不同于 eth0(公共网络)的子网中:
eth0:
- 选中 [Enable IPv4 support] 选项
- 取消选中 [Dynamic IP configuration (DHCP)] 选项 —(选择人工配置)
IPv4 地址:192.168.1.152
前缀(网络掩码):255.255.255.0
- 取消选中 [Enable IPv6 support] 选项
eth1:
- 选中 [Enable IPv4 support] 选项
- 取消选中 [Dynamic IP configuration (DHCP)] 选项 —(选择人工配置)
IPv4 地址:192.168.2.152
前缀(网络掩码):255.255.255.0
- 取消选中 [Enable IPv6 support] 选项
接着,手动设置您的主机名。我对第二个节点使用“racnode2”。然后提供您的网关和 DNS 服务器,最后关闭该对话框。
7. 安装 Oracle RAC 所需的 Linux 程序包
在集群中的两个 Oracle RAC 节点上安装以下必需的 Linux 程序包。
安装 Enterprise Linux 之后,下一步是验证并安装 Oracle Clusterware 和 Oracle RAC 所需的所有程序包 (RPM)。Oracle Universal Installer (OUI) 将在安装期间在计算机上执行检查,以检验是否满足相应的操作系统程序包要求。要确保这些检查成功完成,请在开始安装 Oracle 之前查看本节中说明的软件要求。
尽管许多 Oracle 必需的程序包已经在 Enterprise Linux 安装期间安装,但还缺少一些程序包,因为它们在程序包组中被视为可选,或者根本不存在于任何程序包组中!
本节中列出的程序包(或更高版本)是 Oracle Enterprise Linux 5 平台上运行的 Oracle Grid Infrastructure 11g 第 2 版和 Oracle RAC 11g 第 2 版所必需的。
32 位 (x86) 安装
- binutils-2.17.50.0.6
- compat-libstdc++-33-3.2.3
- elfutils-libelf-0.125
- elfutils-libelf-devel-0.125
- elfutils-libelf-devel-static-0.125
- gcc-4.1.2
- gcc-c++-4.1.2
- glibc-2.5-24
- glibc-common-2.5
- glibc-devel-2.52
- glibc-headers-2.5
- kernel-headers-2.6.18
- ksh-20060214
- libaio-0.3.106
- libaio-devel-0.3.106
- libgcc-4.1.2
- libgomp-4.1.2
- libstdc++-4.1.2
- libstdc++-devel-4.1.2
- make-3.81
- sysstat-7.0.2
- unixODBC-2.2.11
- unixODBC-devel-2.2.11
上面列出的每个程序包都可以在 Oracle Enterprise Linux 5 - (x86) CD 的 1 号 CD、2 号 CD 和 3 号 CD 中找到。尽管可以查询每个单独的程序包以确定缺少并需要安装哪个程序包,但更简单的方法是针对这三个 CD 运行 rpm -Uvh PackageName 命令,如下所示。对于已经存在并且是最新版本的程序包,RPM 命令将忽略安装,并在控制台上打印警告消息,表明该程序包已经安装。
# From Enterprise Linux 5.4 (x86)- [CD #1]
mkdir -p /media/cdrommount -r /dev/cdrom /media/cdrom
cd /media/cdrom/Server
rpm -Uvh binutils-2.*
rpm -Uvh elfutils-libelf-0.*rpm -Uvh glibc-2.*
rpm -Uvh glibc-common-2.*
rpm -Uvh kernel-headers-2.*
rpm -Uvh ksh-2*
rpm -Uvh libaio-0.*rpm -Uvh libgcc-4.*
rpm -Uvh libstdc++-4.*
rpm -Uvh make-3.*
cd /
eject# From Enterprise Linux 5.4 (x86) - [CD #2]
mount -r /dev/cdrom /media/cdrom
cd /media/cdrom/Server
rpm -Uvh elfutils-libelf-devel-*
rpm -Uvh gcc-4.*
rpm -Uvh gcc-c++-4.*
rpm -Uvh glibc-devel-2.*
rpm -Uvh glibc-headers-2.*
rpm -Uvh libgomp-4.*
rpm -Uvh libstdc++-devel-4.*
rpm -Uvh unixODBC-2.*
cd /
eject# From Enterprise Linux 5.4 (x86) - [CD #3]
mount -r /dev/cdrom /media/cdrom
cd /media/cdrom/Server
rpm -Uvh compat-libstdc++-33*
rpm -Uvh libaio-devel-0.*
rpm -Uvh sysstat-7.*
rpm -Uvh unixODBC-devel-2.*
cd /
eject
64 位 (x86_64) 安装
- binutils-2.17.50.0.6
- compat-libstdc++-33-3.2.3
- compat-libstdc++-33-3.2.3(32 位)
- elfutils-libelf-0.125
- elfutils-libelf-devel-0.125
- elfutils-libelf-devel-static-0.125
- gcc-4.1.2
- gcc-c++-4.1.2
- glibc-2.5-24
- glibc-2.5-24(32 位)
- glibc-common-2.5
- glibc-devel-2.5
- glibc-devel-2.5(32 位)
- glibc-headers-2.5
- ksh-20060214
- libaio-0.3.106
- libaio-0.3.106(32 位)
- libaio-devel-0.3.106
- libaio-devel-0.3.106(32 位)
- libgcc-4.1.2
- libgcc-4.1.2(32 位)
- libstdc++-4.1.2
- libstdc++-4.1.2(32 位)
- libstdc++-devel 4.1.2
- make-3.81
- sysstat-7.0.2
- unixODBC-2.2.11
- unixODBC-2.2.11(32 位)
- unixODBC-devel-2.2.11
- unixODBC-devel-2.2.11(32 位)
上面列出的每个程序包都可以在 Oracle Enterprise Linux 5 - (x86_64) CD 的 1 号 CD、2 号 CD、3 号 CD 和 4 号 CD 中找到。尽管可以查询每个单独的程序包以确定缺少并需要安装哪个程序包,但更简单的方法是针对这四个 CD 运行 rpm -Uvh PackageName 命令,如下所示。对于已经存在并且是最新版本的程序包,RPM 命令将忽略安装,并在控制台上打印警告消息,表明该程序包已经安装。
# From Enterprise Linux 5.4 (x86_64)- [CD #1]
mkdir -p /media/cdrom
mount -r /dev/cdrom /media/cdrom
cd /media/cdrom/Server
rpm -Uvh binutils-2.*
rpm -Uvh elfutils-libelf-0.*
rpm -Uvh glibc-2.*
rpm -Uvh glibc-common-2.*
rpm -Uvh ksh-2*rpm -Uvh libaio-0.*
rpm -Uvh libgcc-4.*
rpm -Uvh libstdc++-4.*
rpm -Uvh make-3.*
cd /eject# From Enterprise Linux 5.4 (x86_64) - [CD #2]
mount -r /dev/cdrom /media/cdrom
cd /media/cdrom/Server
rpm -Uvh elfutils-libelf-devel-*
rpm -Uvh gcc-4.*
rpm -Uvh gcc-c++-4.*
rpm -Uvh glibc-devel-2.*
rpm -Uvh glibc-headers-2.*
rpm -Uvh libstdc++-devel-4.*
rpm -Uvh unixODBC-2.*
cd /
eject# From Enterprise Linux 5.4 (x86_64) - [CD #3]
mount -r /dev/cdrom /media/cdromcd /media/cdrom/Server
rpm -Uvh compat-libstdc++-33*
rpm -Uvh libaio-devel-0.*
rpm -Uvh unixODBC-devel-2.*
cd /
eject# From Enterprise Linux 5.4 (x86_64) - [CD #4]
mount -r /dev/cdrom /media/cdrom
cd /media/cdrom/Server
rpm -Uvh sysstat-7.*
cd /
eject
8. 网络配置
在集群中的两个 Oracle RAC 节点上执行下列网络配置。
尽管我们在 Linux 安装期间进行了一些网络配置,但不要跳过此节,这很重要,因为此节包含了重要的检查步骤,可以检查您是否拥有集群安装的 Oracle Grid Infrastructure 所需的网络硬件和互联网协议 (IP) 地址。
网络硬件要求
以下为该网络配置的硬件要求列表:
- 每个 Oracle RAC 节点至少必须有两个网络适配器(即网络接口卡 (NIC)):一个用于公共网络接口,另一个用于专用网络接口(互连)。要对公共网络或专用网络使用多个 NIC,Oracle 建议采用 NIC 绑定。对公共网络和专用网络使用不同的绑定(即,对公共网络使用 bond0,对专用网络使用 bond1),这是因为在安装过程中,每个接口要么定义为公共接口,要么定义为专用接口。本文不讨论 NIC 绑定。
- 每个网络中网络适配器的相关公共接口名称在所有节点上都应相同,网络适配器的相关专用接口名称在所有节点上都应相同。
- 对于公共网络,每个网络适配器必须支持 TCP/IP。
- 对于专用网络,互连必须支持用户数据报协议 (UDP),使用支持 TCP/IP(最小要求为 1 Gb 以太网)的高速网络适配器和交换机。
- 对于专用网络,所有指定互连接口的端点在网络上必须完全可达。每个节点均应连接到所有的专用网络接口。可以使用 ping 命令测试一个互连接口是否可达。
- 在 Oracle Grid Infrastructure 的安装过程中,系统都会要求您标识 OUI 在您的集群节点上检测到的每个网络接口计划使用方式。必须将每个接口标识为 public interface、private interface 或 not used,并且必须对 Oracle Clusterware 和 Oracle RAC 使用相同的专用接口。
192.168.2.151 racnode1-priv 192.168.2.152 racnode2-priv
- 在使用 iSCSI 进行网络存储的生产环境中,我们强烈建议使用 TCP/IP 卸载引擎 (TOE) 卡配置第三个网络接口(如 eth2)作为冗余接口来处理这种存储流量。为简单起见,本文中的配置是让 RAC 专用互连接口 (eth1) 所属的网络同时承载 iSCSI 网络存储流量。在同一网络接口上同时处理 Oracle RAC 的 iSCSI 存储流量和缓存融合流量使我们的测试系统成本低廉,但永远不要考虑在生产环境中使用该方法。
分配 IP 地址
记得我们说过,每个节点至少需要配置两个网络接口,一个使用专用 IP 地址,另一个使用公共 IP 地址。在 Oracle Clusterware 11g 第 2 版之前,网络管理员需要手动分配所有的 IP 地址,要使用静态 IP 地址 — 绝不使用 DHCP。这会包括节点的公共 IP 地址、RAC 互连地址、虚拟 IP 地址 (VIP),以及 11g 第 2 版中新增的单客户端访问名称 (SCAN) IP 地址。实际上,在我以前的所有文章中,我都会强调绝不要使用 DHCP 来分配任何这些 IP 地址。在 11g 第 2 版中,您现在可以选择通过以下两种方法为每个 Oracle RAC 节点分配 IP 地址 — 使用 DHCP 的网格命名服务 (GNS),或者使用 DNS 手动分配静态 IP 地址的传统方法。
网格命名服务 (GNS)
从 Oracle Clusterware 11g 第 2 版开始,引入了另一种分配 IP 地址的方法,即网格命名服务 (GNS)。该方法允许使用 DHCP 分配所有专用互连地址以及大多数 VIP 地址。GNS 和 DHCP 是 Oracle 的新的网格即插即用 (GPnP) 特性的关键要素,如 Oracle 所述,该特性使我们无需配置每个节点的数据,也不必具体地添加和删除节点。通过实现对集群网络需求的自我管理,GNS 实现了动态 网格基础架构。与手动定义静态 IP 地址相比,使用 GNS 配置 IP 地址确实有其优势并且更为灵活,但代价是增加了复杂性,该方法所需的一些组件未在这个构建经济型 Oracle RAC 的指南中定义。例如,为了在集群中启用 GNS,需要在公共网络上有一个 DHCP 服务器,我认为这个 DHCP 服务器超出了本文的讨论范围。
要了解 GNS 的更多优势及其配置方法,请参见适用于 Linux 的 Oracle Grid Infrastructure 11g 第 2 版 (11.2) 安装指南 。
手动分配静态 IP 地址 —(DNS 方法)
如果选择不使用 GNS,在 Oracle Clusterware 11g 第 2 版中仍可手动定义静态 IP 地址,本文将使用此方法分配所有需要的 Oracle Clusterware 联网组件(节点的公共 IP 地址、RAC 互连地址、虚拟 IP 地址以及 SCAN IP 地址)。
您会注意到本节的标题包含了“DNS 方法”这样的字眼。Oracle 建议在开始安装 Oracle Grid Infrastructure之前,在域名服务器 (DNS) 中手动配置静态 IP 地址。然而,在构个经济型 Oracle RAC 时,您并非总是可以访问 DNS 服务器。在 11g 第 2 版之前,这不是一个很大的障碍,因为可以在所有节点的 host 文件 (/etc/hosts) 中定义每个 IP 地址而不必使用 DNS。这包括节点的公共 IP 地址、RAC 互连地址和虚拟 IP 地址 (VIP)。
然而,事情在 Oracle Grid Infrastructure 11g 第 2 版中有了些许变化。
让我们从 RAC 专用互连开始。在 Oracle Grid Infrastructure 的安装过程中无需再为互连提供 IP 地址或专用名称(即 racnode1-priv 或 racnode2-priv)。现在,Oracle Clusterware 为安装期间定义为专用接口的接口(如 eth1)分配互连地址,并将该地址分配给用作专用子网的那个子网(本文中为 192.168.2.0)。如果需要针对互连进行名称解析,可在 hosts 文件或 DNS 上配置专用 IP 名称。实际上,在本指南中,我会继续在每个节点包括一个专用名称和 IP 地址以用于 RAC 互连。这在专用网络上提供了自我文档编制的方法和一组端点,可供故障排除之用:
192.168.2.151 racnode1-priv
192.168.2.152 racnode2-priv
在 11g 第 2 版中,节点的公共 IP 地址和虚拟 IP 地址 (VIP) 保持不变。Oracle 建议定义每个节点的名称和 IP 地址(将来要通过 DNS 进行解析)并将该定义包括每个节点的 hosts 文件中。对于 Oracle Grid Infrastructure 的当前版本和以前版本,Oracle Clusterware 毫无疑问可以仅用一个 hosts 文件来解析节点的公共 IP 地址和 VIP:
192.168.1.151 racnode1
192.168.1.251 racnode1-vip
192.168.1.152 racnode2
192.168.1.252 racnode2-vip
单客户端访问名称 (SCAN) 虚拟 IP 是 11g 第 2 版的一个新特性,看起来该特性引发了很多讨论!必须在 GNS 或 DNS 中配置 SCAN 以便循环解析为三个地址(建议的数量)或至少一个地址。如果您选择不使用 GNS,Oracle 会告诉您,SCAN 必须通过 DNS 来解析而不是通过 hosts 文件来解析。如果不能通过 DNS(或 GNS)解析 SCAN,Oracle Grid Infrastructure 安装过程中的集群验证实用程序检查将失败。如果您不能访问 DNS,我在配置 SCAN 而不使用 DNS 一节提供了一种简单的变通方法。该方法需要在安装 Oracle Grid Infrastructure 之前修改 nslookup 实用程序。
集群的单客户端访问名称 (SCAN)
如果您曾经通过添加新节点来扩展 Oracle RAC 集群(或者通过删除节点来缩小 RAC 集群),您就会了解这种痛苦 — 遍历所有客户端,更新每个客户端的 SQL*Net 或 JDBC 配置以反映这个新增或删除的节点!为解决此问题,Oracle 11g 第 2 版引入了一个新特性,即单客户端访问名称(简称为 SCAN)。SCAN 这个新特性为客户端提供了单一的主机名,用于访问集群中运行的 Oracle 数据库。如果您在集群中添加或删除节点,使用 SCAN 的客户端无需更改自己的 TNS 配置。无论集群包含哪些节点,SCAN 资源及其关联的 IP 地址提供了一个稳定的名称供客户端进行连接使用。在 Oracle Grid Infrastructure 安装过程的询问阶段,系统会要求您提供主机名和最多三个 IP 地址以便用于 SCAN 资源。为了获得较高的可用性和可伸缩性,Oracle 建议您对 SCAN 名称进行配置,以便解析为三个 IP 地址。SCAN 必须至少解析为一个地址。
SCAN 虚拟 IP 名称类似于节点的虚拟 IP 地址所使用的名称,如 racnode1-vip。然而,与虚拟 IP 不同的是,SCAN 与整个集群相关联,而不是与一个节点相关联,它可与多个 IP 地址相关联,而不是只与一个地址相关联。注意,SCAN 地址、虚拟 IP 地址和公共 IP 地址必须属于同一子网。
应该将 SCAN 配置为可由集群中的网格命名服务 (GNS) 进行解析,或由域名服务 (DNS) 解析进行解析。
在本文中,我会将 SCAN 配置为使用 DNS 方法仅解析为一个手动配置的静态 IP 地址(但不在 DNS 中对其进行实际定义):
192.168.1.187 racnode-cluster-scan
配置公共网络和专用网络
在我们的双节点示例中,需要在两个节点上配置网络,以访问公共网络及其专用互连。
在 Enterprise Linux 中配置网络设置的最简单方法是使用“Network Configuration”程序。Network Configuration 是一个 GUI 应用程序,可以从命令行以“root”用户帐户进行启动,如下所示:
[root@racnode1 ~]# /usr/bin/system-config-network &
使用 Network Configuration 应用程序,您需要配置两个 NIC 设备以及 /etc/hosts 文件。您可以使用 Network Configuration GUI 完成这两个任务。注意,两个节点的 /etc/hosts 设置相同,而且我删除了与 IPv6 有关的所有项。例如:
::1 localhost6.localdomain6 localhost6
我们的示例 Oracle RAC 配置将使用以下网络设置:
Oracle RAC 节点 1 — (racnode1) | ||||
设备 | IP 地址 | 子网 | 网关 | 用途 |
eth0 | 192.168.1.151 | 255.255.255.0 | 192.168.1.1 | 将 racnode1 连接到公共网络 |
eth1 | 192.168.2.151 | 255.255.255.0 | 将 racnode1(互连)连接到 racnode2 (racnode2-priv) | |
/etc/hosts | ||||
# Do not remove the following line, or various programs # that require network functionality will fail. 127.0.0.1 localhost.localdomain localhost
# Public Network - (eth0)
192.168.1.151
1racnode1
192.168.1.152
1racnode2 # Private Interconnect - (eth1)
192.168.2.151 racnode1-priv
192.168.2.152 racnode2-priv # Public Virtual IP (VIP) addresses - (eth0:1)
192.168.1.251 racnode1-vip
192.168.1.252 racnode2-vip # Single Client Access Name (SCAN)
192.168.1.187 racnode-cluster-scan # Private Storage Network for Openfiler - (eth1)
192.168.1.195 openfiler1
192.168.2.195 openfiler1-priv # Miscellaneous Nodes 192.168.1.1 router 192.168.1.105 packmule 192.168.1.106 melody 192.168.1.121 domo 192.168.1.122 switch1 192.168.1.125 oemprod 192.168.1.245 accesspoint |
Oracle RAC 节点 2 — (racnode2) | ||||
设备 | IP 地址 | 子网 | 网关 | 用途 |
eth0 | 192.168.1.152 | 255.255.255.0 | 192.168.1.1 | 将 racnode2 连接到公共网络 |
eth1 | 192.168.2.152 | 255.255.255.0 | 将 racnode2(互连)连接到 racnode1 (racnode1-priv) | |
/etc/hosts | ||||
# Do not remove the following line, or various programs # that require network functionality will fail. 127.0.0.1 localhost.localdomain localhost
# Public Network - (eth0)
192.168.1.151 racnode1
192.168.1.152 racnode2 # Private Interconnect - (eth1)
192.168.2.151 racnode1-priv
192.168.2.152 racnode2-priv # Public Virtual IP (VIP) addresses - (eth0:1)
192.168.1.251 racnode1-vip
192.168.1.252 racnode2-vip # Single Client Access Name (SCAN)
192.168.1.187 racnode-cluster-scan # Private Storage Network for Openfiler - (eth1)
192.168.1.195 openfiler1
192.168.2.195 openfiler1-priv # Miscellaneous Nodes 192.168.1.1 router 192.168.1.105 packmule 192.168.1.106 melody 192.168.1.121 domo 192.168.1.122 switch1 192.168.1.125 oemprod 192.168.1.245 accesspoint |
以下屏幕截图只显示了 Oracle RAC 节点 1 (racnode1)。确保对两个 Oracle RAC 节点进行了所有适当的网络设置。
图 2:Network Configuration 屏幕,节点 1 (racnode1)
图 3:Ethernet Device 屏幕,eth0 (racnode1)
图 4:Ethernet Device 屏幕,eth1 (racnode1)
图 5:Network Configuration 屏幕,/etc/hosts (racnode1)
配置网络之后,可以使用 ifconfig 命令验证一切是否正常。以下示例来自于 racnode1:
[root@racnode1 ~]# /sbin/ifconfig -a
eth0 Link encap:Ethernet HWaddr 00:14:6C:76:5C:71inet addr:192.168.1.151 Bcast:192.168.1.255 Mask:255.255.255.0inet6 addr: fe80::214:6cff:fe76:5c71/64 Scope:LinkUP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1RX packets:759780 errors:0 dropped:0 overruns:0 frame:0TX packets:771948 errors:0 dropped:0 overruns:0 carrier:0collisions:0 txqueuelen:1000RX bytes:672708275 (641.5 MiB) TX bytes:727861314 (694.1 MiB)Interrupt:177 Base address:0xcf00eth1 Link encap:Ethernet HWaddr 00:0E:0C:64:D1:E5inet addr:192.168.2.151 Bcast:192.168.2.255 Mask:255.255.255.0inet6 addr: fe80::20e:cff:fe64:d1e5/64 Scope:LinkUP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1RX packets:120 errors:0 dropped:0 overruns:0 frame:0TX packets:48 errors:0 dropped:0 overruns:0 carrier:0collisions:0 txqueuelen:1000RX bytes:24544 (23.9 KiB) TX bytes:8634 (8.4 KiB)Base address:0xddc0 Memory:fe9c0000-fe9e0000lo Link encap:Local Loopbackinet addr:127.0.0.1 Mask:255.0.0.0inet6 addr: ::1/128 Scope:HostUP LOOPBACK RUNNING MTU:16436 Metric:1RX packets:3191 errors:0 dropped:0 overruns:0 frame:0TX packets:3191 errors:0 dropped:0 overruns:0 carrier:0collisions:0 txqueuelen:0RX bytes:4296868 (4.0 MiB) TX bytes:4296868 (4.0 MiB)sit0 Link encap:IPv6-in-IPv4NOARP MTU:1480 Metric:1RX packets:0 errors:0 dropped:0 overruns:0 frame:0TX packets:0 errors:0 dropped:0 overruns:0 carrier:0collisions:0 txqueuelen:0RX bytes:0 (0.0 b) TX bytes:0 (0.0 b)
确保 RAC 节点名没有出现在环回地址中
确保 /etc/hosts 文件的环回地址中不包含节点名(racnode1 或 racnode2)。如果计算机名出现在环回地址条目中,如下所示:
127.0.0.1 racnode1 localhost.localdomain localhost
需要将其删除,如下所示:
127.0.0.1 localhost.localdomain localhost
如果 RAC 节点名出现在环回地址中,您在 RAC 安装期间将收到以下错误消息:
ORA-00603: ORACLE server session terminated by fatal error
或者
ORA-29702: error occurred in Cluster Group Service operation
检查并关闭 UDP ICMP 拒绝
在 Linux 安装期间,我曾说过不配置防火墙选项。默认情况下,安装程序会选中配置防火墙的选项。这使我吃了好几次苦头,因此我要反复确认未配置防火墙选项,并确保 udp ICMP 过滤功能已关闭。
如果防火墙阻止或拒绝了 UDP ICMP,Oracle Clusterware 软件将在运行几分钟之后崩溃。如果 Oracle Clusterware 进程出现故障,您的 <计算机名>_evmocr.log
文件中将出现类似以下的内容:
08/29/2005 22:17:19
oac_init:2: Could not connect to server, clsc retcode = 9
08/29/2005 22:17:19
a_init:12!: Client init unsuccessful : [32]
ibctx:1:ERROR: INVALID FORMAT
proprinit:problem reading the bootblock or superbloc 22
如果遇到此类错误,解决方法是删除 UDP ICMP (iptables) 拒绝规则,或者只需关闭防火墙选项。之后,Oracle Clusterware 软件将开始正常工作而不会崩溃。以下命令应以 root
用户帐户的身份执行:
- 检查以确保关闭了防火墙选项。如果防火墙选项已停用(如下面的示例所示),则不必继续执行下面的步骤。
[root@racnode1 ~]# /etc/rc.d/init.d/iptables status Firewall is stopped.
- 如果防火墙选项已启用,您首先需要手动禁用 UDP ICMP 拒绝:
[root@racnode1 ~]# /etc/rc.d/init.d/iptables stop Flushing firewall rules: [ OK ] Setting chains to policy ACCEPT: filter [ OK ] Unloading iptables modules: [ OK ]
- 然后,针对下一次服务器重新引导关闭 UDP ICMP 拒绝(应该始终被关闭):
[root@racnode1 ~]# chkconfig iptables off
9. 集群时间同步服务
在集群中的两个 Oracle RAC 节点上执行以下集群时间同步服务配置。
Oracle Clusterware 11g 第 2 版及更高版本要求在部署了 Oracle RAC 的集群的所有节点上实现时间同步。Oracle 提供了两种方法来实现时间同步:一种方法是配置了网络时间协议 (NTP) 的操作系统,另一种方法是新的 Oracle 集群时间同步服务 (CTSS)。Oracle 集群时间同步服务 (ctssd) 旨在为那些 Oracle RAC 数据库无法访问 NTP 服务的组织提供服务。
对 NTP 的配置不在本文的讨论范围内,因此我们选择集群时间同步服务作为网络时间协议。
配置集群时间同步服务 — (CTSS)
如果您想使用集群时间同步服务在集群中提供同步服务,需要卸载网络时间协议 (NTP) 及其配置。
要停用 NTP 服务,必须停止当前的 ntpd 服务,从初始化序列中禁用该服务,并删除 ntp.conf 文件。要在 Oracle Enterprise Linux 上完成这些步骤,以 root 用户身份在两个 Oracle RAC 节点上运行以下命令:
[root@racnode1 ~]# /sbin/service ntpd stop
[root@racnode1 ~]# chkconfig ntpd off
[root@racnode1 ~]# mv /etc/ntp.conf /etc/ntp.conf.original
还要删除以下文件:
[root@racnode1 ~]# rm /var/run/ntpd.pid
此文件保存了 NTP 后台程序的 pid。
当安装程序发现 NTP 协议处于非活动状态时,安装集群时间同步服务将以活动模式自动进行安装并通过所有节点的时间。如果发现配置了 NTP,则以观察者模式 启动集群时间同步服务,Oracle Clusterware 不会在集群中进行活动的时间同步。
在安装后,要确认 ctssd 处于活动状态,请作为网格安装所有者 (grid) 输入以下命令:
[grid@racnode1 ~]$ crsctl check ctss
CRS-4701: The Cluster Time Synchronization Service is in Active mode.
CRS-4702: Offset (in msec): 0
配置网络时间协议 —(仅当不按如上所述使用 CTSS 时)
注:请注意,本指南将使用集群时间同步服务实现集群中的两个 Oracle RAC 节点的时间同步。提供此节仅出于说明目的,此节内容可供已设置为其域中使用 NTP 的组织使用。
如果您正在使用 NTP,并且愿意继续使用它而不是集群时间同步服务,那么您需要修改 NTP 初始化文件,在其中设置 -x 标志,这样可避免向后调整时间。完成此任务后,重启网络时间协议后台程序。
为了在 Oracle Enterprise Linux、Red Hat Linux 和 Asianux 系统上完成此任务,编辑 /etc/sysconfig/ntpd 文件,添加 -x 标志,如下例所示:
# Drop root to id 'ntp:ntp' by default.
OPTIONS="-x -u ntp:ntp -p /var/run/ntpd.pid"
# Set to 'yes' to sync hw clock after successful ntpdate
SYNC_HWCLOCK=no
# Additional options for ntpdate
NTPDATE_OPTIONS=""
然后,重启 NTP 服务。
# /sbin/service ntp restart
在 SUSE 系统上,修改配置文件 /etc/sysconfig/ntp,在其中进行以下设置:
NTPD_OPTIONS="-x -u ntp"
用以下命令重启后台程序:
# service ntp restart
10. 安装 Openfiler
在网络存储服务器 (openfiler1) 上执行以下安装。
在两个 Oracle RAC 节点上进行网络配置之后,下一步是将 Openfiler 软件安装到网络存储服务器 (openfiler1)。本文稍后会将网络存储服务器配置为 iSCSI 存储设备,以满足 Oracle Clusterware 和 Oracle RAC 的所有共享存储需求。
Openfiler 构建于 rPath Linux 之上,它是一个基于浏览器的免费网络存储管理实用程序,可在一个框架中提供基于文件的网络连接存储 (NAS) 和基于块的存储区域网 (SAN)。整个软件体系与许多开源应用程序(如 Apache、Samba、LVM2、ext3、Linux NFS 和 iSCSI Enterprise Target)相连接。Openfiler 将这些随处可见的技术组合到一个易于管理的小型管理解决方案中,该解决方案的前端是一个基于 Web 的功能强大的管理界面。
Openfiler 支持 CIFS、NFS、HTTP/DAV 和 FTP,但是,我们将仅使用它的 iSCSI 功能为 Oracle RAC 11g 所需的共享存储组件实现低成本的 SAN。操作系统和 Openfiler 应用程序将安装在一个内置 SATA 磁盘上。另一个内置 73GB 15K SCSI 硬盘将被配置为一个“卷组”,用于满足所有共享磁盘存储需求。Openfiler 服务器将配置为使用该卷组进行基于 iSCSI 的存储,并且将在我们的 Oracle RAC 11g 配置中使用该卷组存储 Oracle Clusterware 和 Oracle RAC 数据库所需的共享文件。
请注意,只要网络存储服务器 (Openfiler) 能够识别并具有足够的空间,任何类型的硬盘(内置或外置)都可用于数据库存储。例如,我已在 500GB 内置 SATA 磁盘上建立了一个额外的分区用于 iSCSI 目标,但决定在此例中使用速度更快的 SCSI 磁盘。
要了解有关 Openfiler 的更多信息,请访问其网站 http://www.openfiler.com/
下载 Openfiler
根据您的硬件体系结构,使用以下链接下载适用于 x86 或 x86_64 的 Openfiler NAS/SAN Appliance 2.3 版(最终版)。本指南使用 x86_64。下载 Openfiler 之后,需要将 ISO 映像刻录到 CD。
32 位 (x86) 安装
- openfiler-2.3-x86-disc1.iso (322 MB)
64 位 (x86_64) 安装
- openfiler-2.3-x86_64-disc1.iso (336 MB)
如果您将以上 ISO 文件下载到 MS Windows 计算机,可以使用多种方法将这些映像(ISO 文件)刻录到 CD。您可能很熟悉这个过程,甚至已经拥有合适的软件,可以将映像刻录到 CD。如果您不熟悉这个过程,并且没有将映像刻录到 CD 所需的软件,这里提供了两个软件程序包(实际上有许多个):
- UltraISO
- Magic ISO Maker
安装 Openfiler
本节概述了用于安装 Openfiler 软件的各个屏幕。在本文中,我选择了使用所有默认选项安装 Openfiler。所需的唯一手动更改是为了配置本地网络设置。
安装完成之后,服务器将重新引导以确保启动并识别所需的所有组件、服务和驱动程序。重新引导之后,Openfiler 服务器将会发现所有外置硬盘驱动器(若已连接)。
有关更详细的安装说明,请访问 http://www.openfiler.com/learn/。但是,我建议使用下面提供的说明对该 Oracle RAC 11g 进行配置。
将 Openfiler 软件安装到网络存储服务器之前,应该先安装两个 NIC 接口(卡),连接并打开所有外置硬盘驱动器(如果您要使用外置硬盘驱动器)。
在下载并将 Openfiler ISO 映像(ISO 文件)刻录到 CD 之后,将该 CD 插入网络存储服务器(在本例中是 openfiler1),打开电源,并按照以下说明来回应安装屏幕的提示。
引导屏幕
第一个屏幕是 Openfiler 引导屏幕。在 boot:提示符处按 [Enter] 键启动安装过程。
介质测试
当要求测试 CD 介质时,用 Tab 键切换到 [Skip] 并按 [Enter] 键。如果有错误,介质刻录软件应该已经向我们发出警告。在几秒钟后,安装程序将会检测视频卡、显示器和鼠标。然后安装程序进入 GUI 模式。
欢迎使用 Openfiler NSA
在该欢迎屏幕上,单击 [Next] 继续。
键盘配置
下一个屏幕将提示您进行键盘设置。为您的配置作出合适的选择。
磁盘分区设置
下一个屏幕将询问是使用“Automatic Partitioning”还是“Manual Partitioning with Disk Druid”进行磁盘分区。虽然 Openfiler 官方文档建议使用手动分区,但我选择使用“自动分区”,因为我的示例配置较为简单。
选择 [Automatically partition] 并单击 [Next] 继续。
自动分区
如果以前在本机上安装了 Linux,则下一屏幕将询问您是要“删除”还是“保留”旧分区。选择 [Remove all partitions on this system] 选项。就我的示例配置而言,我选择了仅使用 500GB SATA 内置硬盘驱动器 [sda] 来进行操作系统和 Openfiler 应用程序的安装。我取消了对 73GB SCSI 内置硬盘驱动器的选择,因为在下一节中该磁盘将专门用于创建单个“卷组”,该卷组将用于 Oracle Clusterware 和 Oracle RAC 的所有基于 iSCSI 的共享磁盘存储之需。
我还选中了 [Review (and modify if needed) the partitions created] 复选框。单击 [Next] 继续。
随后会显示一个对话窗口,询问您是否真的要删除所有分区。单击 [Yes] 回复这一警告。
分区
随后安装程序将允许您查看(如果需要还可以更改)它为您在上一屏中选择的硬盘自动选择的磁盘分区。在绝大多数情况下,安装程序将为 /boot 分配 100MB,为交换分区分配足够量的空间,而将剩余空间分配给这个(这些)磁盘的根 (/) 分区。在本示例中,我对安装程序为 /dev/sda 建议的分区感到满意。
安装程序还将显示它所发现的任何其他内置硬盘。对于我的示例配置,安装程序发现了 73GB SCSI 内置硬盘作为 /dev/sdb。现在,我将“删除”此驱动器上的任何及所有分区(只有一个分区,/dev/sdb1)。在下一节,我将为该特定硬盘创建所需分区。
网络配置
在启动 Openfiler 安装之前,我已确认在网络存储服务器上安装了两个 NIC 接口(卡)。本屏幕应该已经成功地检测到每个网络设备。
首先,确保将每个网络设备设置为 [Active on boot]。默认情况下,安装程序可能选择不激活 eth1。
接下来,单击 [Edit],按照以下方法对 eth0 和 eth1 进行编辑。您可能要为 eth0 和 eth1 使用不同的 IP 地址,没有问题。但是,您必须将 eth1(存储网络)配置为与 racnode1 和 racnode2 上的 eth1 位于同一子网中:
eth0:
- 取消选中 [Configure using DHCP] 选项
- 选中 [Activate on boot]
- IP 地址:192.168.1.195
- 子网掩码:255.255.255.0
eth1:
- 取消选中 [Configure using DHCP] 选项
- 选中 [Activate on boot]
- IP 地址:192.168.2.195
- 子网掩码:255.255.255.0
接着,手动设置您的主机名。我使用的主机名是“openfiler1”。然后提供您的网关和 DNS 服务器,最后关闭该对话框。
时区选择
下一个屏幕将允许您配置时区信息。为您的位置作出合适的选择。
设置根口令
选择一个根口令,然后单击 [Next] 继续。
准备安装
该屏幕本质上是一个确认屏幕。单击 [Next] 开始安装。
恭喜
大功告成。您已经成功地在网络存储服务器上安装了 Openfiler。安装程序将从 CD-ROM 驱动器中弹出 CD。取出 CD,单击 [Reboot] 重新引导系统。
如果在重新引导后一切都已成功,您现在应该看到文本登录屏幕和用于管理 Openfiler 服务器的 URL。
在 Openfiler 服务器上修改 /etc/hosts 文件
虽然并非必要,但我通常会将 /etc/hosts 文件的内容从一个 Oracle RAC 节点复制到新的 Openfiler 服务器。在测试集群网络时,这可以实现方便的名称解析。
11. 使用 Openfiler 配置 iSCSI 卷
在网络存储服务器 (openfiler1) 上执行以下配置任务。
可以使用 Openfiler Storage Control Center(一个基于浏览器的工具,通过端口 446 上的 https 连接实现)执行 Openfiler 管理。例如:
https://openfiler1.idevelopment.info:446/
从 Openfiler Storage Control Center 的主页,以管理员身份登录。Openfiler 的默认管理员登录凭证为:
- Username: openfiler
- Password: password
管理员看到的第一个页面是 [Status] / [System Information] 屏幕。
要将 Openfiler 用作 iSCSI 存储服务器,我们需要执行六个主要任务:设置 iSCSI 服务、配置网络访问、指定物理存储器并对其分区、创建新的卷组、创建所有逻辑卷,最后,为每个逻辑卷创建新的 iSCSI 目标。
服务
要控制服务,我们使用 Openfiler Storage Control Center 并转到 [Services] / [Manage Services]:
要启用 iSCSI 服务,单击“iSCSI target server”服务名称后面的“Enable”链接。之后,“iSCSI target server”状态应变为“Enabled”。
ietd 程序将实现 iSCSI Enterprise Target 软件的用户级部分,以便在 Linux 上构建 iSCSI 存储系统。启用 iSCSI target 之后,我们应该能够通过 SSH 登录到 Openfiler 服务器,并且可看到 iscsi-target 服务正在运行:
[root@openfiler1 ~]# service iscsi-target status
ietd (pid 14243) is running...
网络访问配置
下一步是配置 Openfiler 中的网络访问,指定需要通过存储(专用)网络访问 iSCSI 卷的两个 Oracle RAC 节点(racnode1 和 racnode2)。注意,本节稍后将会创建 iSCSI 卷。另请注意,本步骤并不实际授予两个 Oracle RAC 节点访问 iSCSI 逻辑卷所需的相应权限。授予权限的操作将在本节稍后通过对每个新逻辑卷更新 ACL 来进行。
如同上一节,我们使用 Openfiler Storage Control Center 并转到 [System] / [Network Setup] 来完成网络访问配置。通过页面底部的“Network Access Configuration”部分,管理员可以设置网络和/或主机以允许其访问 Openfiler appliance 导出的资源。就本文而言,我们希望单独添加两个 Oracle RAC 节点,而不是允许整个 192.168.2.0 网络访问 Openfiler 资源。
输入每个 Oracle RAC 节点时,请注意“Name”域只是一个逻辑名称,仅供参考。根据输入节点的惯例,我仅使用了为该 IP 地址定义的节点名称。接下来,在“Network/Host”域中输入实际节点时,始终使用其 IP 地址,即使其主机名已经在 /etc/hosts 文件或 DNS 中定义。最后,在我们的 C 类网络中输入实际主机时,使用子网掩码 255.255.255.255。
记住,您要为集群中的每个 RAC 节点输入专用 网络 (eth1) 的 IP 地址,这一点很重要。
下图显示了添加两个 Oracle RAC 节点后的结果:
图 7:为 Oracle RAC 节点配置 Openfiler 网络访问
物理存储
在本节中,我们将创建三个 iSCSI 卷,以供集群中的两个 Oracle RAC 节点用作共享存储。这将在连接到 Openfiler 服务器的内置 73GB 15K SCSI 硬盘驱动器上执行多个步骤。
存储设备(如内置 IDE/SATA/SCSI/SAS 磁盘、存储阵列、外置 USB 驱动器、外置 FireWire 驱动器或者任何其他存储设备)可以连接到 Openfiler 服务器,并供客户端使用。如果在操作系统级发现了这些设备,就可以使用 Openfiler Storage Control Center 设置和管理所有这些存储设备。
在本例中,我们有一个 73GB 的内置 SCSI 硬盘驱动器用于满足共享存储之需。在 Openfiler 服务器上,该驱动器显示为 /dev/sdb (MAXTOR ATLAS15K2_73SCA)。要看到该驱动器并启动 iSCSI 卷的创建过程,请从 Openfiler Storage Control Center 转到 [Volumes] / [Block Devices]:
图 8:Openfiler 物理存储 — 块设备管理
对物理磁盘进行分区
我们要执行的第一步是在 /dev/sdb 内置硬盘上创建一个主分区。单击 /dev/sdb 链接,我们会看到“Edit”或“Create”选项,分别用于编辑和创建分区。由于我们将创建一个跨整个磁盘的主分区,因此可以将大多数选项保留为默认设置,唯一的修改是将“Partition Type”由“Extended partition”更改为“Physical volume”。下面是我为了在 /dev/sdb 上创建主分区而指定的值:
模式:Primary
分区类型:Physical volume
开始柱面:1
结束柱面:8924现在,大小将显示 68.36 GB。要接受该设置,单击“Create”按钮。这将在我们的内置硬盘上生成一个新的分区 (/dev/sdb1):
图 9:对物理卷进行分区
卷组管理
下一步是创建卷组。我们将创建一个名为 racdbvg 的卷组,其中包含新创建的主分区。
从 Openfiler Storage Control Center 中转到 [Volumes] / [Volume Groups]。我们将看到所有现有的卷组,或者什么也看不到(我们的情况就是这样)。在 Volume Group Management 屏幕中,输入新卷组的名称 (racdbvg),单击 /dev/sdb1 前面的复选框以选中该分区,最后单击“Add volume group”按钮。之后,我们会看到一个列表,其中显示出我们新创建的这个名为“racdbvg”的卷组:
图 10:创建了新卷组
逻辑卷
现在,我们可以在新创建的卷组 (racdbvg) 中创建三个逻辑卷。
从 Openfiler Storage Control Center 中转到 [Volumes] / [Add Volume]。我们将看到新创建的卷组 (racdbvg) 及其块存储统计信息。该屏幕底部还提供了一个选项,用于在选定的卷组中创建一个新卷 —(在“racdbvg”中创建一个卷)。使用该屏幕创建以下三个逻辑 (iSCSI) 卷。在创建每个逻辑卷之后,应用程序将转至“Manage Volumes”屏幕。然后,您需要单击后退到“Add Volume”选项卡以创建下一个逻辑卷,直至三个 iSCSI 卷全部创建完毕:
iSCSI / 逻辑卷 卷名 卷描述 所需空间 (MB) 文件系统类型 racdb-crs1
racdb - ASM CRS Volume 1 2,208 iSCSI racdb-data1
racdb - ASM Data Volume 1 33,888 iSCSI racdb-fra1
racdb - ASM FRA Volume 1 33,888 iSCSI 实际上,我们已经创建了三个 iSCSI 磁盘,现在可以将它们呈现给网络上的 iSCSI 客户端(racnode1 和 racnode2)。“Manage Volumes”屏幕应如下所示:
图 11:新的 iSCSI 逻辑卷
iSCSI 目标
现在,我们有了三个 iSCSI 逻辑卷。但是,为了使 iSCSI 客户端可以访问这些逻辑卷,首先需要为这三个卷中的每个卷创建一个 iSCSI 目标。每个 iSCSI 逻辑卷将映射 到一个特定的 iSCSI 目标,并将为两个 Oracle RAC 节点授予对该目标的相应网络访问权限。对于本文,在 iSCSI 逻辑卷和 iSCSI 目标之间将会有一一映射的关系。
创建和配置 iSCSI 目标的过程包括三步:创建一个唯一的目标 IQN(实质上是新的 iSCSI 目标的通用名称),将上一节中创建的一个 iSCSI 逻辑卷映射到新创建的 iSCSI 目标,最后,授予两个 Oracle RAC 节点访问该新 iSCSI 目标的权限。请注意,需要对上一节中创建的三个 iSCSI 逻辑卷中的每个卷都执行一次此过程。
对于本文,下表列出了新的 iSCSI 目标名称(目标 IQN)及其将映射到的 iSCSI 逻辑卷:
iSCSI 目标/逻辑卷映射 | ||
目标 IQN | iSCSI 卷名 | 卷描述 |
iqn.2006-01.com.openfiler:racdb.crs1 | racdb-crs1 | racdb - ASM CRS Volume 1 |
iqn.2006-01.com.openfiler:racdb.data1 | racdb-data1 | racdb - ASM Data Volume 1 |
iqn.2006-01.com.openfiler:racdb.fra1 | racdb-fra1 | racdb - ASM FRA Volume 1 |
现在我们来创建三个新的 iSCSI 目标 — 为每个 iSCSI 逻辑卷创建一个。下面举例说明通过创建 Oracle Clusterware/racdb-crs1 目标 ( iqn.2006-01.com.openfiler:racdb.crs1
) 来创建新的 iSCSI 目标时所需执行的三个步骤。这个三步过程需要对上表中列出的三个新 iSCSI 目标中的每一个都重复执行一遍。
创建新目标 IQN
从 Openfiler Storage Control Center 中转到 [Volumes] / [iSCSI Targets]。确保选择了灰色子选项卡“Target Configuration”。您可在此选项卡页中创建一个新的 iSCSI 目标。系统会自动生成一个默认值,作为新 iSCSI 目标的名称(常称为“目标 IQN”)。目标 IQN 的一个示例是“iqn.2006-01.com.openfiler:tsn.ae4683b67fd3
”:
图 12:创建新的 iSCSI 目标:默认目标 IQN
我喜欢用更具含义的字串来替换这个默认目标 IQN 最后一段。对于第一个 iSCSI 目标(Oracle Clusterware/racdb-crs1),我将这样来修改默认的目标 IQN:将字符串“tsn.ae4683b67fd3
”替换为“racdb.crs1
”,如下面的图 13 所示:
对新的目标 IQN 满意之后,单击“Add”按钮。这将会创建一个新的 iSCSI 目标,然后会出现一个页面,您可以在该页面中修改新 iSCSI 目标的一系列设置。对于本文,无需更改新 iSCSI 目标的任何设置。
LUN 映射
创建新的 iSCSI 目标之后,下一步是将相应的 iSCSI 逻辑卷映射到该目标。在“Target Configuration”子选项卡下,验证在“Select iSCSI Target”部分中选择了正确的 iSCSI 目标。如果不是这样,使用下拉菜单选择正确的 iSCSI 目标,然后单击“Change”按钮。
接下来,单击名为“LUN Mapping”的灰色子选项卡(在“Target Configuration”子选项卡旁)。找到相应的 iSCSI 逻辑卷(本例中为 /dev/racdbvg/racdb-crs1),然后单击“Map”按钮。无需更改此页面中的任何设置。对卷 /dev/racdbvg/racdb-crs1 单击“Map”按钮后,您的屏幕应如图 14 所示:
网络 ACL
需要先授予 iSCSI 客户端相应的权限,它才能访问新创建的 iSCSI 目标。在前面,我们已通过 Openfiler 对两个主机(Oracle RAC 节点)进行网络访问配置。这两个节点需要通过存储(专用)网络访问新的 iSCSI 目标。现在,我们需要授予这两个 Oracle RAC 节点访问新 iSCSI 目标的权限。
单击名为“Network ACL”的灰色子选项卡(在“LUN Mapping”子选项卡旁)。对当前的 iSCSI 目标,将两个主机的“Access”值由“Deny”更改为“Allow”,然后单击“Update”按钮。
返回到创建新的目标 IQN 一节,对其余两个 ISCSI 逻辑卷执行这三个任务,同时替换“iSCSI 目标/逻辑卷映射”表中找到的值。
12. 在 Oracle RAC 节点上配置 iSCSI 卷
在集群中的两个 Oracle RAC 节点上配置 iSCSI 启动器。而创建分区只应在 RAC 集群的一个节点上执行。
iSCSI 客户端可以是提供 iSCSI 支持(驱动程序)的任何系统(Linux、Unix、MS Windows、Apple Mac 等)。在我们的示例中,客户端是两个 Linux 服务器(racnode1 和 racnode2),它们运行的是 Oracle Enterprise Linux 5.4。
在本节中,我们将在两个 Oracle RAC 节点上配置 iSCSI 软件启动器。Oracle Enterprise Linux 5.4 包括 Open-iSCSI iSCSI 软件启动器,该软件启动器位于 iscsi-initiator-utils RPM 中。这是对早期版本 Oracle Enterprise Linux (4.x) 的一个更改,这些早期版本中包含作为 Linux-iSCSI 项目的一部分而开发的 Linux iscsi-sfnet 软件驱动程序。所有 iSCSI 管理任务(如发现和登录)将使用 Open-iSCSI 中包含的命令行接口 iscsiadm。
iSCSI 软件启动器将配置为自动登录网络存储服务器 (openfiler1),并发现 上一节中创建的 iSCSI 卷。之后,我们将逐步使用 udev 为发现的每个 iSCSI 目标名称创建永久性本地 SCSI 设备名称(即 /dev/iscsi/crs1
)。拥有一致的本地 SCSI 设备名称及其映射到的 iSCSI 目标,有助于在配置 ASM 时能够区分三个卷。但是,在此之前,我们首先必须安装 iSCSI 启动器软件。
注:本指南使用 ASMLib 2.0,它是 Oracle Database 的自动存储管理 (ASM) 特性的一个支持库。ASMLib 将用于对本指南中所使用的所有 iSCSI 卷进行标记。默认情况下,ASMLib 已为 ASM 使用的存储设备提供了永久性路径和权限。有了该特性后,无需用存储设备路径和权限更新 udev 或 devlabel 文件。就本文来说,实际上我仍然选择使用 udev 为发现的每个 SCSI 目标名称创建永久性本地 SCSI 设备名称。这提供了一种自我文档编制的方法,有助于快速确定每个卷的名称和位置。
安装 iSCSI(启动器)服务
就 Oracle Enterprise Linux 5.4 来说,默认情况下不会安装 Open-iSCSI iSCSI 软件启动器。该软件包含在 1 号 CD 上的 iscsi-initiator-utils 程序包中。要确定该程序包是否已安装(大多数情况下没有安装),在两个 Oracle RAC 节点上执行以下命令:
[root@racnode1 ~]# rpm -qa --queryformat "%{NAME}-%{VERSION}-%{RELEASE} (%{ARCH})\n"| grep iscsi-initiator-utils
如果 iscsi-initiator-utils 程序包未安装,将 1 号 CD 加载到每个 Oracle RAC 节点中并执行以下命令:
[root@racnode1 ~]# mount -r /dev/cdrom /media/cdrom
[root@racnode1 ~]# cd /media/cdrom/Server
[root@racnode1 ~]# rpm -Uvh iscsi-initiator-utils-*
[root@racnode1 ~]# cd /
[root@racnode1 ~]# eject
确认 iscsi-initiator-utils 程序包现在已安装:
[root@racnode1 ~]# rpm -qa --queryformat "%{NAME}-%{VERSION}-%{RELEASE} (%{ARCH})\n"| grep iscsi-initiator-utils
iscsi-initiator-utils-6.2.0.871-0.10.el5 (x86_64)
配置 iSCSI(启动器)服务
验证 iscsi-initiator-utils 程序包已经安装到两个 Oracle RAC 节点之后,启动 iscsid 服务,并使其在系统引导时自动启动。我们还将配置 iscsi 服务在系统启动时自动启动,自动登录到所需的 iSCSI 目标。
[root@racnode1 ~]# service iscsid start
Turning off network shutdown. Starting iSCSI daemon: [ OK ][ OK ]
[root@racnode1 ~]# chkconfig iscsid on
[root@racnode1 ~]# chkconfig iscsi on
现在 iSCSI 服务已经启动,下面使用 iscsiadm 命令行接口发现网络存储服务器上的所有可用目标。这应该在两个 Oracle RAC 节点上执行,以检验配置是否正常工作:
[root@racnode1 ~]# iscsiadm -m discovery -t sendtargets -p openfiler1-priv
192.168.2.195:3260,1 iqn.2006-01.com.openfiler:racdb.crs1
192.168.2.195:3260,1 iqn.2006-01.com.openfiler:racdb.fra1
192.168.2.195:3260,1 iqn.2006-01.com.openfiler:racdb.data1
手动登录到 iSCSI 目标
此时,iSCSI 启动器服务已经启动,每个 Oracle RAC 节点都能够从网络存储服务器中发现可用目标。下一步是手动登录每个可用目标,这可以使用 iscsiadm 命令行接口完成。这需要在两个 Oracle RAC 节点上运行。注意,我必须指定网络存储服务器的 IP 地址而非其主机名 (openfiler1-priv) — 我认为必须这么做,因为上述发现使用 IP 地址显示目标。
[root@racnode1 ~]# iscsiadm -m node -T iqn.2006-01.com.openfiler:racdb.crs1
-p 192.168.2.195 -l
[root@racnode1 ~]# iscsiadm -m node -T iqn.2006-01.com.openfiler:racdb.data1
-p 192.168.2.195 -l
[root@racnode1 ~]# iscsiadm -m node -T iqn.2006-01.com.openfiler:racdb.fra1
-p 192.168.2.195 -l
配置自动登录
下一步是确保在计算机引导(或 iSCSI 启动器服务启动/重启)时,客户端将自动登录到上面列出的每个目标。如同上面描述的手动登录过程,在两个 Oracle RAC 节点上执行以下命令:
[root@racnode1 ~]# iscsiadm -m node -T iqn.2006-01.com.openfiler:racdb.crs1
-p 192.168.2.195 --op update -n node.startup -v automatic
[root@racnode1 ~]# iscsiadm -m node -T iqn.2006-01.com.openfiler:racdb.data1
-p 192.168.2.195 --op update -n node.startup -v automatic
[root@racnode1 ~]# iscsiadm -m node -T iqn.2006-01.com.openfiler:racdb.fra1
-p 192.168.2.195 --op update -n node.startup -v automatic
创建永久性本地 SCSI 设备名称
在本节中,我们将逐步为每个 iSCSI 目标名称创建永久性本地 SCSI 设备名称。我们将使用 udev 来完成该任务。拥有一致的本地 SCSI 设备名称及其映射到的 iSCSI 目标,有助于在配置 ASM 时能够区分三个卷。尽管并未严格要求这么做(因为我们将对所有卷使用 ASMLib 2.0),这提供了一种自我文档编制的方法,有助于快速确定每个 iSCSI 卷的名称和位置。
如果任一 Oracle RAC 节点引导并且 iSCSI 启动器服务启动,它会以一种随机的方式自动登录到配置的每个目标,并将这些目标映射到下一个可用的本地 SCSI 设备名称。例如,目标 iqn.2006-01.com.openfiler:racdb.crs1 可能会映射到 /dev/sdb。实际上,我可以通过查看 /dev/disk/by-path 目录来确定所有目标的当前映射:
[root@racnode1 ~]# (cd /dev/disk/by-path; ls -l *openfiler* | awk '{FS=" ";
print $9 " " $10 " " $11}')
ip-192.168.2.195:3260-iscsi-iqn.2006-01.com.openfiler:racdb.crs1-lun-0 -> ../../sdb
ip-192.168.2.195:3260-iscsi-iqn.2006-01.com.openfiler:racdb.data1-lun-0 -> ../../sdd
ip-192.168.2.195:3260-iscsi-iqn.2006-01.com.openfiler:racdb.fra1-lun-0 -> ../../sdc
使用上述 ls 命令的输出结果,我们可以建立以下当前映射:
iSCSI 目标名称到本地 SCSI 设备名称的当前映射 | |
iSCSI 目标名称 | SCSI 设备名称 |
iqn.2006-01.com.openfiler:racdb.crs1 | /dev/sdb |
iqn.2006-01.com.openfiler:racdb.data1 | /dev/sdd |
iqn.2006-01.com.openfiler:racdb.fra1 | /dev/sdc |
但是,每次重新引导 Oracle RAC 节点时,该映射都可能有所不同。例如,重新引导之后,可能会决定将 iSCSI 目标 iqn.2006-01.com.openfiler:racdb.crs1 映射到本地 SCSI 设备 /dev/sdc。由于您无法预测重新引导后的 iSCSI 目标映射,依赖于使用本地 SCSI 设备名称是不现实的。
我们需要的是可引用的一致的设备名称(即 /dev/iscsi/crs1),该设备名称在重新引导后将始终指向相应的 iSCSI 目标。这就是引入名为 udev 的动态设备管理 工具的原因。 udev 提供了一个动态设备目录,使用一组可配置的规则通过符号链接指向实际设备。当 udev 收到设备事件(例如,客户端登录到 iSCSI 目标)时,就会根据 sysfs 中提供的可用设备属性匹配其配置好的规则以便识别设备。匹配规则可以提供其他设备信息或指定设备节点名和多个符号链接名,并指示 udev 运行其他程序(例如,一个 SHELL 脚本)作为设备事件处理过程的一部分。
第一步是创建一个新的规则文件。该文件将命名为 /etc/udev/rules.d/55-openiscsi.rules,并且只包含一行用于接收我们感兴趣事件的名称=值对。它还将定义一个调出 SHELL 脚本 (/etc/udev/scripts/iscsidev.sh),用于处理事件。
在两个 Oracle RAC 节点上创建以下规则文件 /etc/udev/rules.d/55-openiscsi.rules:
..............................................
# /etc/udev/rules.d/55-openiscsi.rules
KERNEL=="sd*", BUS=="scsi", PROGRAM="/etc/udev/scripts/iscsidev.sh %b",
SYMLINK+="iscsi/%c/part%n"
..............................................
现在,我们需要创建在接收该事件时将调用的 UNIX SHELL 脚本。我们首先在两个 Oracle RAC 节点上创建一个单独的目录,用于存储 udev 脚本:
[root@racnode1 ~]# mkdir -p /etc/udev/scripts
接下来,在两个 Oracle RAC 节点上创建 UNIX shell 脚本 /etc/udev/scripts/iscsidev.sh:
..............................................
#!/bin/sh# FILE: /etc/udev/scripts/iscsidev.shBUS=${1}
HOST=${BUS%%:*}[ -e /sys/class/iscsi_host ] || exit 1
file="/sys/class/iscsi_host/host${HOST}/device/session*/iscsi_session*/
targetname"
target_name=$(cat ${file})
# This is not an open-scsi drive
if [ -z "${target_name}" ]; thenexit 1
fi# Check if QNAP drive
check_qnap_target_name=${target_name%%:*}
if [ $check_qnap_target_name = "iqn.2004-04.com.qnap" ]; thentarget_name=`echo "${target_name%.*}"`
fiecho "${target_name##*.}"
..............................................
创建 UNIX SHELL 脚本后,将其更改为可执行文件:
[root@racnode1 ~]# chmod 755 /etc/udev/scripts/iscsidev.sh
既然已经配置了 udev,下面将在两个 Oracle RAC 节点上重新启动 iSCSI 服务:
[root@racnode1 ~]# service iscsi stop
Logging out of session [sid: 6, target: iqn.2006-01.com.openfiler:racdb.crs1, portal: 192.168.2.195,3260]
Logging out of session [sid: 7, target: iqn.2006-01.com.openfiler:racdb.fra1, portal: 192.168.2.195,3260]
Logging out of session [sid: 8, target: iqn.2006-01.com.openfiler:racdb.data1, portal: 192.168.2.195,3260]
Logout of [sid: 6, target: iqn.2006-01.com.openfiler:racdb.crs1, portal: 192.168.2.195,3260]: successful
Logout of [sid: 7, target: iqn.2006-01.com.openfiler:racdb.fra1, portal: 192.168.2.195,3260]: successful
Logout of [sid: 8, target: iqn.2006-01.com.openfiler:racdb.data1, portal: 192.168.2.195,3260]: successful
Stopping iSCSI daemon: [ OK ][root@racnode1 ~]# service iscsi start
iscsid dead but pid file exists
Turning off network shutdown. Starting iSCSI daemon: [ OK ][ OK ]
Setting up iSCSI targets: Logging in to [iface: default, target: iqn.2006-01.com.openfiler:racdb.crs1, portal: 192.168.2.195,3260]
Logging in to [iface: default, target: iqn.2006-01.com.openfiler:racdb.fra1, portal: 192.168.2.195,3260]
Logging in to [iface: default, target: iqn.2006-01.com.openfiler:racdb.data1, portal: 192.168.2.195,3260]
Login to [iface: default, target: iqn.2006-01.com.openfiler:racdb.crs1, portal: 192.168.2.195,3260]: successful
Login to [iface: default, target: iqn.2006-01.com.openfiler:racdb.fra1, portal: 192.168.2.195,3260]: successful
Login to [iface: default, target: iqn.2006-01.com.openfiler:racdb.data1, portal: 192.168.2.195,3260]: successful [ OK ]
下面,我们来看一下我们的辛勤工作是否得到了回报:
[root@racnode1 ~]# ls -l /dev/iscsi/*
/dev/iscsi/crs1:
total 0
lrwxrwxrwx 1 root root 9 Nov 3 18:13 part -> ../../sdc/dev/iscsi/data1:
total 0
lrwxrwxrwx 1 root root 9 Nov 3 18:13 part -> ../../sde/dev/iscsi/fra1:
total 0
lrwxrwxrwx 1 root root 9 Nov 3 18:13 part -> ../../sdd
上面的清单显示, udev 所做的工作正是我们所期待的!现在,我们拥有了一组一致的本地设备名称,可用于引用 iSCSI 目标。例如,我们可以安全地认为设备名称 /dev/iscsi/crs1/part 将始终引用 iSCSI 目标 iqn.2006-01.com.openfiler:racdb.crs1。现在,我们拥有了一致的 iSCSI 目标名称到本地设备名称的映射,如下表所示:
iSCSI 目标名称到本地设备名称的映射 | |
iSCSI 目标名称 | 本地设备名称 |
iqn.2006-01.com.openfiler:racdb.crs1 | /dev/iscsi/crs1/part |
iqn.2006-01.com.openfiler:racdb.data1 | /dev/iscsi/data1/part |
iqn.2006-01.com.openfiler:racdb.fra1 | /dev/iscsi/fra1/part |
在 iSCSI 卷上创建分区
现在,我们需要在每个 iSCSI 卷上创建一个占用整个卷大小的主分区。正如本文前面提到的,我将使用自动存储管理 (ASM) 存储 Oracle 集群件所需的共享文件、物理数据库文件(数据/索引文件、联机重做日志文件和控制文件),以及集群数据库的快速恢复区 (FRA)。
Oracle Clusterware 共享文件(OCR 和表决磁盘)将存储在一个名为 +CRS 的使用外部冗余 配置的 ASM 磁盘组中。集群数据库的物理数据库文件将存储在一个名为 +RACDB_DATA 的也使用外部冗余配置的 ASM 磁盘组中。最后,快速恢复区(RMAN 备份和存档重做日志文件)将存储于一个名为 +FRA 的使用外部冗余配置的第三个 ASM 磁盘组中。
下表列出了将要创建的三个 ASM 磁盘组及其将包含的 iSCSI 卷:
Oracle 共享驱动器配置 | ||||||
文件类型 | ASM 磁盘组名称 | iSCSI 目标(短)名称 | ASM 冗余 | 大小 | ASMLib 卷名 | |
OCR 和表决磁盘 | +CRS | crs1 | External | 2GB | ORCL:CRSVOL1 | |
Oracle 数据库文件 | +RACDB_DATA | data1 | External | 32GB | ORCL:DATAVOL1 | |
Oracle 快速恢复区 | +FRA | fra1 | External | 32GB | ORCL:FRAVOL1 |
如上表所示,我们需要在每个 iSCSI 卷(共三个)上创建一个 Linux 主分区。 fdisk 命令在 Linux 中用于创建(和删除)分区。对于每个 iSCSI 卷(共三个),您都可以在创建主分区时使用默认值,因为默认操作是使用整个磁盘。您可以放心地忽略任何指示设备未包含有效 DOS 分区(或 Sun、SGI 或 OSF 磁盘标签)的警告。
在本例中,我将在 racnode1 上运行 fdisk 命令,使用上一节中通过 udev 创建的本地设备名称在每个 iSCSI 目标上创建一个主分区:
- /dev/iscsi/crs1/part
- /dev/iscsi/data1/part
- /dev/iscsi/fra1/part
注:要在每个 iSCSI 卷上创建单个分区,只能从 Oracle RAC 集群中的一个节点上进行!(如 racnode1)
# ---------------------------------------[root@racnode1 ~]# fdisk /dev/iscsi/crs1/part
Command (m for help): nCommand actione extendedp primary partition (1-4)
p
Partition number (1-4): 1
First cylinder (1-1012, default 1): 1
Last cylinder or +size or +sizeM or +sizeK (1-1012, default 1012): 1012Command (m for help): pDisk /dev/iscsi/crs1/part: 2315 MB, 2315255808 bytes
72 heads, 62 sectors/track, 1012 cylinders
Units = cylinders of 4464 * 512 = 2285568 bytesDevice Boot Start End Blocks Id System
/dev/iscsi/crs1/part1 1 1012 2258753 83 LinuxCommand (m for help): w
The partition table has been altered!Calling ioctl() to re-read partition table.
Syncing disks.# ---------------------------------------[root@racnode1 ~]# fdisk /dev/iscsi/data1/part
Command (m for help): n
Command actione extendedp primary partition (1-4)
p
Partition number (1-4): 1
First cylinder (1-33888, default 1): 1
Last cylinder or +size or +sizeM or +sizeK (1-33888, default 33888): 33888Command (m for help): pDisk /dev/iscsi/data1/part: 35.5 GB, 35534143488 bytes
64 heads, 32 sectors/track, 33888 cylinders
Units = cylinders of 2048 * 512 = 1048576 bytesDevice Boot Start End Blocks Id System
/dev/iscsi/data1/part1 1 33888 34701296 83 Linux
Command (m for help): w
The partition table has been altered!Calling ioctl() to re-read partition table.
Syncing disks.# ---------------------------------------[root@racnode1 ~]# fdisk /dev/iscsi/fra1/part
Command (m for help): n
Command actione extendedp primary partition (1-4)
p
Partition number (1-4): 1
First cylinder (1-33888, default 1): 1
Last cylinder or +size or +sizeM or +sizeK (1-33888, default 33888): 33888Command (m for help): pDisk /dev/iscsi/fra1/part: 35.5 GB, 35534143488 bytes
64 heads, 32 sectors/track, 33888 cylinders
Units = cylinders of 2048 * 512 = 1048576 bytesDevice Boot Start End Blocks Id System
/dev/iscsi/fra1/part1 1 33888 34701296 83 LinuxCommand (m for help): w
The partition table has been altered!Calling ioctl() to re-read partition table.Syncing disks.
验证新分区
在 racnode1 上创建所有需要的分区之后,现在应使用以下命令以“root”用户帐户从 Oracle RAC 集群的所有其余节点 (racnode2) 将分区更改通知给内核。注意,Openfiler 发现的 iSCSI 目标名称和本地 SCSI 设备名称的映射在两个 Oracle RAC 节点上将有所不同。不用担心,这不会导致任何问题,因为我们将使用 udev 在上一节中创建的本地设备名称而不是其他的本地 SCSI 设备名称。
在 racnode2 上运行以下命令:
[root@racnode2 ~]# partprobe[root@racnode2 ~]# fdisk -lDisk /dev/sda: 160.0 GB, 160000000000 bytes
255 heads, 63 sectors/track, 19452 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytesDevice Boot Start End Blocks Id System
/dev/sda1 * 1 13 104391 83 Linux
/dev/sda2 14 19452 156143767+ 8e Linux LVMDisk /dev/sdb: 35.5 GB, 35534143488 bytes
64 heads, 32 sectors/track, 33888 cylinders
Units = cylinders of 2048 * 512 = 1048576 bytesDevice Boot Start End Blocks Id System
/dev/sdb1 1 33888 34701296 83 LinuxDisk /dev/sdc: 35.5 GB, 35534143488 bytes
64 heads, 32 sectors/track, 33888 cylinders
Units = cylinders of 2048 * 512 = 1048576 bytesDevice Boot Start End Blocks Id System
/dev/sdc1 1 33888 34701296 83 LinuxDisk /dev/sdd: 2315 MB, 2315255808 bytes
72 heads, 62 sectors/track, 1012 cylinders
Units = cylinders of 4464 * 512 = 2285568 bytesDevice Boot Start End Blocks Id System
/dev/sdd1 1 1012 2258753 83 Linux
最后,您应该在两个 Oracle RAC 节点上运行以下命令,以验证 udev 为每个新分区创建了新的符号链接:
[root@racnode2 ~]# (cd /dev/disk/by-path; ls -l *openfiler* | awk '{FS=" "; print $9 " " $10 " " $11}')
ip-192.168.2.195:3260-iscsi-iqn.2006-01.com.openfiler:racdb.crs1-lun-0 -> ../../sdd
ip-192.168.2.195:3260-iscsi-iqn.2006-01.com.openfiler:racdb.crs1-lun-0-part1 -> ../../sdd1
ip-192.168.2.195:3260-iscsi-iqn.2006-01.com.openfiler:racdb.data1-lun-0 -> ../../sdc
ip-192.168.2.195:3260-iscsi-iqn.2006-01.com.openfiler:racdb.data1-lun-0-part1 -> ../../sdc1
ip-192.168.2.195:3260-iscsi-iqn.2006-01.com.openfiler:racdb.fra1-lun-0 -> ../../sdb
ip-192.168.2.195:3260-iscsi-iqn.2006-01.com.openfiler:racdb.fra1-lun-0-part1 -> ../../sdb1
上面的清单显示, udev 确实为每个新分区创建了新的设备名称。在本指南稍后,当我们为 ASMlib 配置卷时,将使用这些新的设备名称。
- /dev/iscsi/crs1/part1
- /dev/iscsi/data1/part1
- /dev/iscsi/fra1/part1
在集群的两个 Oracle RAC 节点上针对 grid 和 oracle 用户执行以下用户、组和目录配置并设置 shell 限制的任务。
本节介绍如何使用 任务角色划分 配置来创建操作系统用户和组以安装所有 Oracle 软件。本节所使用的命令应在两个 Oracle RAC 节点上以 root 用户身份执行,从而创建组、用户和目录。请注意,组 ID 和用户 ID 在集群的两个 Oracle RAC 节点上应保持一致。检查以确保每个集群成员节点上都存在您要使用的组 ID 和用户 ID,确认每个网格基础架构的集群安装所有者的主组拥有相同的名称和组 ID,具体在本指南中为 oinstall (GID 1000)。
Oracle 的任务角色划分权限配置是这样一种配置,将对 Oracle Grid Infrastructure 安装的管理访问权限赋予给一些操作系统组和用户,从而将这类权限从涉及其他 Oracle 安装(例如,Oracle Database 软件)的其他管理用户和组中划分出来。管理访问权限由各个操作系统组授予,而安装权限由每个 Oracle 安装的各个安装所有者授予。
我们会为每个 Oracle 软件产品创建一个操作系统用户作为该产品的所有者 —“grid”作为 Oracle Grid Infrastructure 的所有者,“oracle”作为 Oracle RAC 软件的所有者。在本文中,grid 的用户是我们创建作为 Oracle Grid Infrastructure 二进制文件所有者的用户。该用户将是 Oracle Clusterware 和 Oracle 自动存储管理二进制文件的所有者。而 oracle 的用户是我们创建作为 Oracle 数据库二进制文件 (Oracle RAC) 所有者的用户。这两个 Oracle 软件所有者必须以 Oracle Inventory 组 (oinstall) 作为其主组,这样每个 Oracle 软件安装所有者都有权写入中央清单 (oraInventory),以便正确设置 OCR 和 Oracle Clusterware 资源的权限。Oracle RAC 软件所有者还必须以 OSDBA 组和可选的 OSOPER 组作为其辅助组。
此类配置是可选的,但是对于需要通过划分各个管理用户的负责区域来限制用户对 Oracle 软件的访问的组织来说,Oracle 强烈建议采用这样的配置。例如,一个小型组织可能只分配操作系统用户权限,这样就可以只使用一个管理用户和一个组,该用户和组通过操作系统认证之后会具有存储层和数据库层上的所有系统权限。就此类配置来说,您可以指定 oracle 用户为所有 Oracle 软件(Grid Infrastructure 和 Oracle Database 软件)的唯一安装所有者,并指定 oinstall 为唯一组,授予其成员 Oracle Clusterware、自动存储管理及服务器上所有 Oracle 数据库的所有系统权限,及其作为安装所有者的所有权限。然而,其他组织有一些专门的系统角色来负责 Oracle 软件的安装,如系统管理员、网络管理员或存储管理员。这些不同的管理员用户可对系统进行配置以便为集群安装的 Oracle Grid Infrastructure 作准备,并完成所有需要操作系统 root 权限的配置任务。在成功完成 Grid Infrastructure 的安装与配置后,系统管理员应只需提供配置信息并授予数据库管理员在 Oracle RAC 安装期间以 root 用户身份运行脚本的权限。
我们将创建以下 O/S 组:
描述 | OS 组名 | 分配给该组的 OS 用户 | Oracle 权限 | Oracle 组名 |
Oracle 清单和软件所有者 | oinstall | grid、oracle | ||
Oracle 自动存储管理组 | asmadmin | grid | SYSASM | OSASM |
ASM 数据库管理员组 | asmdba | grid、oracle | ASM 的 SYSDBA | OSDBA for ASM |
ASM 操作员组 | asmoper | grid | ASM 的 SYSOPER | OSOPER for ASM |
数据库管理员 | dba | oracle | SYSDBA | OSDBA |
数据库操作员 | oper | oracle | SYSOPER | OSOPER |
- Oracle 清单组(一般为 oinstall)
OINSTALL 组的成员被视为 Oracle 软件的“所有者”,拥有对 Oracle 中央清单 (oraInventory) 的写入权限。在一个 Linux 系统上首次安装 Oracle 软件时,OUI 会创建 /etc/oraInst.loc 文件。该文件指定 Oracle 清单组的名称(默认为 oinstall)以及 Oracle 中央清单目录的路径。
如果不存在 oraInventory 组,默认情况下,安装程序会将集群的网格基础架构的安装所有者的主组列为 oraInventory 组。确保所有计划的 Oracle 软件安装所有者都使用此组作为主组。就本指南来说,必须将 grid 和 oracle 安装所有者配置为以 oinstall 作为其主组。
- Oracle 自动存储管理组(一般为 asmadmin)
此组为必需组。如果想让 Oracle ASM 管理员和 Oracle Database 管理员分属不同的管理权限组,可单独创建此组。在 Oracle 文档中,OSASM 组是其成员被授予权限的操作系统组,在代码示例中,专门创建了一个组来授予此权限,此组名为 asmadmin。
OSASM 组的成员可通过操作系统身份验证使用 SQL 以 SYSASM 身份连接到一个 Oracle ASM 实例。SYSASM 权限是在 Oracle ASM 11g 第 1 版 (11.1) 中引入的,现在,在 Oracle ASM 11g 第 2 版 (11.2) 中,该权限已从 SYSDBA 权限中完全分离出来。SYSASM 权限不再提供对 RDBMS 实例的访问权限。用 SYSASM 权限代替 SYSDBA 权限来提供存储层的系统权限,这使得 ASM 管理和数据库管理之间有了清晰的责任划分,有助于防止使用相同存储的不同数据库无意间覆盖其他数据库的文件。SYSASM 权限允许执行挂载和卸载磁盘组及其他存储管理任务。
- ASM 数据库管理员组(OSDBA for ASM,一般为 asmdba)
ASM 数据库管理员组(OSDBA for ASM)的成员是 SYSASM 权限的一个子集,拥有对 Oracle ASM 管理的文件的读写权限。Grid Infrastructure 安装所有者 (grid) 和所有 Oracle Database 软件所有者 (oracle) 必须是该组的成员,而所有有权访问 Oracle ASM 管理的文件并且具有数据库的 OSDBA 成员关系的用户必须是 ASM 的 OSDBA 组的成员。
- ASM 操作员组(OSOPER for ASM,一般为 asmoper)
-
该组为可选组。如果需要单独一组具有有限的 Oracle ASM 实例管理权限(ASM 的 SYSOPER 权限,包括启动和停止 Oracle ASM 实例的权限)的操作系统用户,则创建该组。默认情况下,OSASM 组的成员将拥有 ASM 的 SYSOPER 权限所授予的所有权限。
要使用 ASM 操作员组创建 ASM 管理员组(该组拥有的权限比默认的 asmadmin 组要少),安装 Grid Infrastructure 软件时必须选择 Advanced 安装类型。这种情况下,OUI 会提示您指定该组的名称。在本指南中,该组为 asmoper。
如果要拥有一个 OSOPER for ASM 组,则集群的 Grid Infrastructure 软件所有者 (grid) 必须为此组的一个成员。
- 数据库管理员(OSDBA,一般为 dba)
OSDBA 组的成员可通过操作系统身份验证使用 SQL 以 SYSDBA 身份连接到一个 Oracle 实例。该组的成员可执行关键的数据库管理任务,如创建数据库、启动和关闭实例。该组的默认名称为 dba。SYSDBA 系统权限甚至在数据库未打开时也允许访问数据库实例。对此权限的控制完全超出了数据库本身的范围。
不要混淆 SYSDBA 系统权限与数据库角色 DBA。DBA 角色不包括 SYSDBA 或 SYSOPER 系统权限。
- 数据库操作员组(OSOPER,一般为 oper)
OSOPER 组的成员可通过操作系统身份验证使用 SQL 以 SYSOPER 身份连接到一个 Oracle 实例。这个可选组的成员拥有一组有限的数据库管理权限,如管理和运行备份。该组的默认名称为 oper。SYSOPER 系统权限甚至在数据库未打开时也允许访问数据库实例。对此权限的控制完全超出了数据库本身的范围。要使用该组,选择 Advanced 安装类型来安装 Oracle 数据库软件。
为 Grid Infrastructure 创建组和用户
在本节中,我们首先在两个 Oracle RAC 节点上为 Grid Infrastructure 创建推荐的操作系统组和用户:
[root@racnode1 ~]# groupadd -g 1000 oinstall
[root@racnode1 ~]# groupadd -g 1200 asmadmin
[root@racnode1 ~]# groupadd -g 1201 asmdba
[root@racnode1 ~]# groupadd -g 1202 asmoper
[root@racnode1 ~]# useradd -m -u 1100 -g oinstall -G asmadmin,asmdba,asmoper -d
/home/grid -s /bin/bash -c "Grid Infrastructure Owner" grid [root@racnode1 ~]# id grid uid=1100(grid) gid=1000(oinstall)
groups=1000(oinstall), 1200(asmadmin), 1201(asmdba),1202(asmoper)
设置 grid 帐户的口令:
[root@racnode1 ~]# passwd grid
Changing password for user grid.
New UNIX password:xxxxxxxxxxx
Retype new UNIX password:xxxxxxxxxxx
passwd: all authentication tokens updated successfully.
为 grid 用户帐户创建登录脚本
以 grid 用户帐户分别登录到两个 Oracle RAC 节点并创建以下登录脚本 (.bash_profile):
注: 在为每个 Oracle RAC 节点设置 Oracle 环境变量时,确保为每个 RAC 节点指定唯一的 Oracle SID。对于此示例,我使用:
- racnode1:ORACLE_SID=+ASM1
- racnode2:ORACLE_SID=+ASM2
[root@racnode1 ~]# su - grid
# ---------------------------------------------------
# .bash_profile
# ---------------------------------------------------
# OS User: grid
# Application: Oracle Grid Infrastructure
# Version: Oracle 11g release 2
# ---------------------------------------------------# Get the aliases and functions
if [ -f ~/.bashrc ]; then. ~/.bashrc
fialias ls="ls -FA"# ---------------------------------------------------
# ORACLE_SID
# ---------------------------------------------------
# Specifies the Oracle system identifier (SID)
# for the Automatic Storage Management (ASM)instance
# running on this node.
# Each RAC node must have a unique ORACLE_SID.
# (i.e. +ASM1, +ASM2,...)
# ---------------------------------------------------
ORACLE_SID=+ASM1; export ORACLE_SID# ---------------------------------------------------
# JAVA_HOME
# ---------------------------------------------------
# Specifies the directory of the Java SDK and Runtime
# Environment.
# ---------------------------------------------------
JAVA_HOME=/usr/local/java; export JAVA_HOME# ---------------------------------------------------
# ORACLE_BASE
# ---------------------------------------------------
# Specifies the base of the Oracle directory structure
# for Optimal Flexible Architecture (OFA) compliant
# installations. The Oracle base directory for the
# grid installation owner is the location where
# diagnostic and administrative logs, and other logs
# associated with Oracle ASM and Oracle Clusterware
# are stored.
# ---------------------------------------------------
ORACLE_BASE=/u01/app/grid; export ORACLE_BASE# ---------------------------------------------------
# ORACLE_HOME
# ---------------------------------------------------
# Specifies the directory containing the Oracle
# Grid Infrastructure software. For grid
# infrastructure for a cluster installations, the Grid
# home must not be placed under one of the Oracle base
# directories, or under Oracle home directories of
# Oracle Database installation owners, or in the home
# directory of an installation owner. During
# installation, ownership of the path to the Grid
# home is changed to root. This change causes
# permission errors for other installations.
# ---------------------------------------------------
ORACLE_HOME=/u01/app/11.2.0/grid; export ORACLE_HOME# ---------------------------------------------------
# ORACLE_PATH
# ---------------------------------------------------
# Specifies the search path for files used by Oracle
# applications such as SQL*Plus. If the full path to
# the file is not specified, or if the file is not
# in the current directory, the Oracle application
# uses ORACLE_PATH to locate the file.
# This variable is used by SQL*Plus, Forms and Menu.
# ---------------------------------------------------
ORACLE_PATH=/u01/app/oracle/common/oracle/sql; export ORACLE_PATH# ---------------------------------------------------
# SQLPATH
# ---------------------------------------------------
# Specifies the directory or list of directories that
# SQL*Plus searches for a login.sql file.
# ---------------------------------------------------
# SQLPATH=/u01/app/common/oracle/sql; export SQLPATH# ---------------------------------------------------
# ORACLE_TERM
# ---------------------------------------------------
# Defines a terminal definition. If not set, it
# defaults to the value of your TERM environment
# variable. Used by all character mode products.
# ---------------------------------------------------
ORACLE_TERM=xterm; export ORACLE_TERM# ---------------------------------------------------
# NLS_DATE_FORMAT
# ---------------------------------------------------
# Specifies the default date format to use with the
# TO_CHAR and TO_DATE functions. The default value of
# this parameter is determined by NLS_TERRITORY. The
# value of this parameter can be any valid date
# format mask, and the value must be surrounded by
# double quotation marks. For example:
# # NLS_DATE_FORMAT = "MM/DD/YYYY"
# # ---------------------------------------------------
NLS_DATE_FORMAT="DD-MON-YYYY HH24:MI:SS"; export NLS_DATE_FORMAT# ---------------------------------------------------
# TNS_ADMIN
# ---------------------------------------------------
# Specifies the directory containing the Oracle Net
# Services configuration files like listener.ora,
# tnsnames.ora, and sqlnet.ora.
# ---------------------------------------------------
TNS_ADMIN=$ORACLE_HOME/network/admin; export TNS_ADMIN# ---------------------------------------------------
# ORA_NLS11
# ---------------------------------------------------
# Specifies the directory where the language,
# territory, character set, and linguistic definition
# files are stored.
# ---------------------------------------------------
ORA_NLS11=$ORACLE_HOME/nls/data; export ORA_NLS11# ---------------------------------------------------
# PATH
# ---------------------------------------------------
# Used by the shell to locate executable programs;
# must include the $ORACLE_HOME/bin directory.
# ---------------------------------------------------
PATH=.:${JAVA_HOME}/bin:${PATH}:$HOME/bin:$ORACLE_HOME/bin
PATH=${PATH}:/usr/bin:/bin:/usr/bin/X11:/usr/local/bin
PATH=${PATH}:/u01/app/common/oracle/bin
export PATH# ---------------------------------------------------
# LD_LIBRARY_PATH
# ---------------------------------------------------
# Specifies the list of directories that the shared
# library loader searches to locate shared object
# libraries at runtime.
# ---------------------------------------------------
LD_LIBRARY_PATH=$ORACLE_HOME/lib
LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:$ORACLE_HOME/oracm/lib
LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:/lib:/usr/lib:/usr/local/lib
export LD_LIBRARY_PATH# ---------------------------------------------------
# CLASSPATH
# ---------------------------------------------------
# Specifies the directory or list of directories that
# contain compiled Java classes.
# ---------------------------------------------------
CLASSPATH=$ORACLE_HOME/JRE
CLASSPATH=${CLASSPATH}:$ORACLE_HOME/jlib
CLASSPATH=${CLASSPATH}:$ORACLE_HOME/rdbms/jlib
CLASSPATH=${CLASSPATH}:$ORACLE_HOME/network/jlib
export CLASSPATH# ---------------------------------------------------
# THREADS_FLAG
# ---------------------------------------------------
# All the tools in the JDK use green threads as a
# default. To specify that native threads should be
# used, set the THREADS_FLAG environment variable to
# "native". You can revert to the use of green
# threads by setting THREADS_FLAG to the value
# "green".
# ---------------------------------------------------
THREADS_FLAG=native; export THREADS_FLAG# ---------------------------------------------------
# TEMP, TMP, and TMPDIR
# ---------------------------------------------------
# Specify the default directories for temporary
# files; if set, tools that create temporary files
# create them in one of these directories.
# ---------------------------------------------------
export TEMP=/tmp
export TMPDIR=/tmp# ---------------------------------------------------
# UMASK
# ---------------------------------------------------
# Set the default file mode creation mask
# (umask) to 022 to ensure that the user performing
# the Oracle software installation creates files
# with 644 permissions.
# ---------------------------------------------------
umask 022 |
为 Oracle 数据库软件创建组和用户
接下来,我们在两个 Oracle RAC 节点上为 Oracle 数据库软件创建推荐的操作系统组和用户:
[root@racnode1 ~]# groupadd -g 1300 dba
[root@racnode1 ~]# groupadd -g 1301 oper
[root@racnode1 ~]# useradd -m -u 1101 -g oinstall -G dba,oper,asmdba -d
/home/oracle -s /bin/bash -c "Oracle Software Owner" oracle[root@racnode1 ~]# id oracle
uid=1101(oracle)
gid=1000(oinstall)
groups=1000(oinstall),1201(asmdba),1300(dba),1301(oper)
设置 oracle 帐户的口令:
[root@racnode1 ~]# passwd oracle
Changing password for user oracle.
New UNIX password:
xxxxxxxxxxx
Retype new UNIX password:
xxxxxxxxxxx
passwd: all authentication tokens updated successfully.
为 oracle 用户帐户创建登录脚本
以 oracle 用户帐户分别登录到两个 Oracle RAC 节点并创建以下登录脚本 (.bash_profile):
注: 在为每个 Oracle RAC 节点设置 Oracle 环境变量时,确保为每个 RAC 节点指定唯一的 Oracle SID。对于此示例,我使用:
- racnode1:ORACLE_SID=racdb1
- racnode2:ORACLE_SID=racdb2
[root@racnode1 ~]# su - oracle
# ---------------------------------------------------
# .bash_profile
# ---------------------------------------------------
# OS User: oracle
# Application: Oracle Database Software Owner
# Version: Oracle 11g release 2
# ---------------------------------------------------# Get the aliases and functions
if [ -f ~/.bashrc ]; then. ~/.bashrc
fialias ls="ls -FA"# ---------------------------------------------------
# ORACLE_SID
# ---------------------------------------------------
# Specifies the Oracle system identifier (SID) for
# the Oracle instance running on this node.
# Each RAC node must have a unique ORACLE_SID.
# (i.e. racdb1, racdb2,...)
# ---------------------------------------------------
ORACLE_SID=racdb1; export ORACLE_SID# ---------------------------------------------------
# ORACLE_UNQNAME
# ---------------------------------------------------
# In previous releases of Oracle Database, you were
# required to set environment variables for
# ORACLE_HOME and ORACLE_SID to start, stop, and
# check the status of Enterprise Manager. With
# Oracle Database 11g release 2 (11.2) and later, you
# need to set the environment variables ORACLE_HOME
# and ORACLE_UNQNAME to use Enterprise Manager.
# Set ORACLE_UNQNAME equal to the database unique
# name.
# ---------------------------------------------------
ORACLE_UNQNAME=racdb; export ORACLE_UNQNAME# ---------------------------------------------------
# JAVA_HOME
# ---------------------------------------------------
# Specifies the directory of the Java SDK and Runtime
# Environment.
# ---------------------------------------------------
JAVA_HOME=/usr/local/java; export JAVA_HOME# ---------------------------------------------------
# ORACLE_BASE
# ---------------------------------------------------
# Specifies the base of the Oracle directory structure
# for Optimal Flexible Architecture (OFA) compliant
# database software installations.
# ---------------------------------------------------
ORACLE_BASE=/u01/app/oracle; export ORACLE_BASE# ---------------------------------------------------
# ORACLE_HOME
# ---------------------------------------------------
# Specifies the directory containing the Oracle
# Database software.
# ---------------------------------------------------
ORACLE_HOME=$ORACLE_BASE/product/11.2.0/dbhome_1; export ORACLE_HOME# ---------------------------------------------------
# ORACLE_PATH
# ---------------------------------------------------
# Specifies the search path for files used by Oracle
# applications such as SQL*Plus. If the full path to
# the file is not specified, or if the file is not
# in the current directory, the Oracle application
# uses ORACLE_PATH to locate the file.
# This variable is used by SQL*Plus, Forms and Menu.
# ---------------------------------------------------
ORACLE_PATH=/u01/app/common/oracle/sql; export ORACLE_PATH# ---------------------------------------------------
# SQLPATH
# ---------------------------------------------------
# Specifies the directory or list of directories that
# SQL*Plus searches for a login.sql file.
# ---------------------------------------------------
# SQLPATH=/u01/app/common/oracle/sql; export SQLPATH# ---------------------------------------------------
# ORACLE_TERM
# ---------------------------------------------------
# Defines a terminal definition. If not set, it
# defaults to the value of your TERM environment
# variable. Used by all character mode products.
# ---------------------------------------------------
ORACLE_TERM=xterm; export ORACLE_TERM# ---------------------------------------------------
# NLS_DATE_FORMAT
# ---------------------------------------------------
# Specifies the default date format to use with the
# TO_CHAR and TO_DATE functions. The default value of
# this parameter is determined by NLS_TERRITORY. The
# value of this parameter can be any valid date
# format mask, and the value must be surrounded by
# double quotation marks. For example:
# # NLS_DATE_FORMAT = "MM/DD/YYYY"
# # ---------------------------------------------------
NLS_DATE_FORMAT="DD-MON-YYYY HH24:MI:SS"; export NLS_DATE_FORMAT# ---------------------------------------------------
# TNS_ADMIN
# ---------------------------------------------------
# Specifies the directory containing the Oracle Net
# Services configuration files like listener.ora,
# tnsnames.ora, and sqlnet.ora.
# ---------------------------------------------------
TNS_ADMIN=$ORACLE_HOME/network/admin; export TNS_ADMIN# ---------------------------------------------------
# ORA_NLS11
# ---------------------------------------------------
# Specifies the directory where the language,
# territory, character set, and linguistic definition
# files are stored.
# ---------------------------------------------------
ORA_NLS11=$ORACLE_HOME/nls/data; export ORA_NLS11# ---------------------------------------------------
# PATH
# ---------------------------------------------------
# Used by the shell to locate executable programs;
# must include the $ORACLE_HOME/bin directory.
# ---------------------------------------------------
PATH=.:${JAVA_HOME}/bin:${PATH}:$HOME/bin:$ORACLE_HOME/bin
PATH=${PATH}:/usr/bin:/bin:/usr/bin/X11:/usr/local/bin
PATH=${PATH}:/u01/app/common/oracle/bin
export PATH# ---------------------------------------------------
# LD_LIBRARY_PATH
# ---------------------------------------------------
# Specifies the list of directories that the shared
# library loader searches to locate shared object
# libraries at runtime.
# ---------------------------------------------------
LD_LIBRARY_PATH=$ORACLE_HOME/lib
LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:$ORACLE_HOME/oracm/lib
LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:/lib:/usr/lib:/usr/local/lib
export LD_LIBRARY_PATH# ---------------------------------------------------
# CLASSPATH
# ---------------------------------------------------
# Specifies the directory or list of directories that
# contain compiled Java classes.
# ---------------------------------------------------
CLASSPATH=$ORACLE_HOME/JRE
CLASSPATH=${CLASSPATH}:$ORACLE_HOME/jlib
CLASSPATH=${CLASSPATH}:$ORACLE_HOME/rdbms/jlib
CLASSPATH=${CLASSPATH}:$ORACLE_HOME/network/jlib
export CLASSPATH# ---------------------------------------------------
# THREADS_FLAG
# ---------------------------------------------------
# All the tools in the JDK use green threads as a
# default. To specify that native threads should be
# used, set the THREADS_FLAG environment variable to
# "native". You can revert to the use of green
# threads by setting THREADS_FLAG to the value
# "green".
# ---------------------------------------------------
THREADS_FLAG=native; export THREADS_FLAG# ---------------------------------------------------
# TEMP, TMP, and TMPDIR
# ---------------------------------------------------
# Specify the default directories for temporary
# files; if set, tools that create temporary files
# create them in one of these directories.
# ---------------------------------------------------
export TEMP=/tmp
export TMPDIR=/tmp# ---------------------------------------------------
# UMASK
# ---------------------------------------------------
# Set the default file mode creation mask
# (umask) to 022 to ensure that the user performing
# the Oracle software installation creates files
# with 644 permissions.
# ---------------------------------------------------
umask 022 |
验证用户 nobody 存在
安装软件之前,执行以下过程,以验证在两个 Oracle RAC 节点上存在用户 nobody:
- 要确定该用户是否存在,输入以下命令:
# id nobody uid=99(nobody) gid=99(nobody) groups=99(nobody)
如果该命令显示了 nobody 用户的信息,则无需创建该用户。
- 如果用户 nobody 不存在,则输入以下命令进行创建:
# /usr/sbin/useradd nobody
- 在集群中的所有其他 Oracle RAC 节点上重复此过程。
创建 Oracle 基目录路径
最后一步是配置 Oracle 基路径,要遵循最佳灵活体系结构 (OFA) 的结构及正确的权限。需要以 root 用户身份在集群的两个 Oracle RAC 节点上完成此任务。
本指南假设在根文件系统中创建 /u01 目录。请注意,这样做是为了简便起见,不建议将其作为通用做法。通常会将 /u01 目录作为配置了硬件或软件镜像功能的单独文件系统供应。
[root@racnode1 ~]# mkdir -p /u01/app/grid
[root@racnode1 ~]# mkdir -p /u01/app/11.2.0/grid
[root@racnode1 ~]# chown -R grid:oinstall /u01
[root@racnode1 ~]# mkdir -p /u01/app/oracle
[root@racnode1 ~]# chown oracle:oinstall /u01/app/oracle
[root@racnode1 ~]# chmod -R 775 /u01
本节结束时,两个 Oracle RAC 节点应具有以下配置:
- Oracle 中央清单组,即 oraInventory 组 (oinstall),其成员以中央清单组作为主组,拥有对 oraInventory 目录的写入权限。
- 单独的 OSASM 组 (asmadmin),其成员拥有 SYSASM 权限,可以管理 Oracle Clusterware 和 Oracle ASM。
- 单独的 ASM OSDBA 组 (asmdba),其成员包括 grid 和 oracle,拥有对 Oracle ASM 的访问权限。
- 单独的 ASM OSOPER 组 (asmoper),其成员包括 grid,拥有有限的 Oracle ASM 管理员权限(包括启动和停止 Oracle ASM 实例的权限)。
- 集群的 Oracle 网格安装所有者 (grid),该用户以 oraInventory 组作为其主组,以 OSASM (asmadmin)、OSDBA for ASM (asmdba) 和 OSOPER for ASM (asmoper) 组作为其辅助组。
- 单独的 OSDBA 组 (dba),其成员拥有 SYSDBA 权限,可以管理 Oracle 数据库。
- 单独的 OSOPER 组 (oper),其成员包括 oracle,拥有有限的 Oracle 数据库管理员权限。
- Oracle 数据库软件所有者 (oracle),该用户以 oraInventory 组作为其主组,以 OSDBA (dba)、OSOPER (oper) 和 OSDBA for ASM 组 (asmdba) 作为其辅助组。
- 符合 OFA 的挂载点 /u01,在安装之前,其所有者为 grid:oinstall。
- 网格的 Oracle 基目录 /u01/app/grid,其所有者为 grid:oinstall,权限设置为 775,在安装过程中其权限设置更改为 755。网格安装所有者的 Oracle 基目录是存放 Oracle ASM 诊断和管理日志文件的位置。
- 网格主目录 /u01/app/11.2.0/grid,其所有者为 grid:oinstall,权限设置为 775 (drwxdrwxr-x)。这些权限为安装所需,在安装过程中会更改为 root:oinstall 和 755 权限设置 (drwxr-xr-x)。
- 在安装过程中,OUI 在路径 /u01/app/oraInventory 下创建 Oracle 清单目录。此路径的所有者一直为 grid:oinstall,使其他 Oracle 软件所有者可以写入中央清单。
- Oracle 基目录 /u01/app/oracle,其所有者为 oracle:oinstall,权限设置为 775。
为 Oracle 软件安装用户设置资源限制
要改善 Linux 系统上的软件性能,必须对 Oracle 软件所有者用户(grid、oracle)增加以下资源限制:
Shell 限制 | limits.conf 中的条目 | 硬限制 |
打开文件描述符的最大数 | nofile | 65536 |
可用于单个用户的最大进程数 | nproc | 16384 |
进程堆栈段的最大大小 | stack | 10240 |
要进行这些更改,以 root 用户身份运行以下命令:
- 在每个 Oracle RAC 节点上,在 /etc/security/limits.conf 文件中添加以下几行代码(下面的示例显示软件帐户所有者 oracle 和 grid):
[root@racnode1 ~]# cat >> /etc/security/limits.conf <<EOF grid soft nproc 2047 grid hard nproc 16384 grid soft nofile 1024 grid hard nofile 65536 oracle soft nproc 2047 oracle hard nproc 16384 oracle soft nofile 1024 oracle hard nofile 65536 EOF
- 在每个 Oracle RAC 节点上,在 /etc/pam.d/login 文件中添加或编辑下面一行内容(如果不存在此行):
[root@racnode1 ~]# cat >> /etc/pam.d/login <<EOF session required pam_limits.so EOF
- 根据您的 shell 环境,对默认的 shell 启动文件进行以下更改,以便更改所有 Oracle 安装所有者的 ulimit 设置(注意这里的示例显示 oracle 和 grid 用户):
对于 Bourne、Bash 或 Korn shell,通过运行以下命令将以下行添加到 /etc/profile 文件:
[root@racnode1 ~]# cat >> /etc/profile <<EOF if [ \$USER = "oracle" ] || [ \$USER = "grid" ]; then if [ \$SHELL = "/bin/ksh" ]; thenulimit -p 16384ulimit -n 65536elseulimit -u 16384 -n 65536fiumask 022 fi EOF
对于 C shell(csh 或 tcsh),通过运行以下命令将以下行添加到 /etc/csh.login 文件:
[root@racnode1 ~]# cat >> /etc/csh.login <<EOF if ( \$USER == "oracle" || \$USER == "grid" ) then limit maxproc 16384limit descriptors 65536 endif EOF
14. 使用 X 终端登录远程系统
为了安装操作系统并执行多项配置任务,本指南需要可以访问所有计算机(Oracle RAC 节点和 Openfiler)的控制台。管理少量服务器时,为了访问其控制台,将每台服务器与自己的显示器、键盘和鼠标相连可能行得通。但是,随着需要管理的服务器数量越来越多,这一解决方案变得难以实施。更实际的解决方案是配置一台专用计算机,该计算机包括一个显示器、键盘和鼠标,可以直接访问每台计算机的控制台。使用一台键盘、视频和鼠标切换设备(常称作 KVM 切换设备)可以实现该解决方案。
安装了 Linux 操作系统后,为了安装并配置 Oracle RAC,需要几个应用程序,这几个程序使用图形用户界面 (GUI) 并且需要使用 X11 显示服务器。这些 GUI 应用程序(常称为 X 应用程序)中最为有名的是 Oracle Universal Installer (OUI),尽管其他程序如 Virtual IP Configuration Assistant (VIPCA) 也需要使用 X11 显示服务器。
由于我编写此文时所基于的系统使用了 KVM 切换设备,所以我能够切换到每个节点,并且可依靠本机上的 Linux X11 显示服务器来显示 X 应用程序。
如果您不是直接登录到节点的图形控制台,而是使用某个远程客户端(如 SSH、PuTTY 或 Telnet)连接到节点,则对于任何 X 应用程序,均需在该客户端上安装一个 X11 显示服务器。例如,您要从一个 Windows 工作站远程终端连接到 racnode1,需要在该 Windows 客户端上安装一个 X11 显示服务器(如 Xming)。如果您打算从安装有 X11 显示服务器的 Windows 工作站或另一个系统安装 Oracle Grid Infrastructure 和 Oracle RAC 软件,执行以下操作:
- 在客户端工作站上启动 X11 显示服务器软件。
- 配置 X 服务器软件的安全设置以允许远程主机在本地系统上显示 X 应用程序。
- 从客户端工作站登录到您要以集群软件所有者 grid)或 Oracle RAC 软件所有者 (oracle) 在其上安装 Oracle Grid Infrastructure 软件的服务器。
- 以软件所有者(grid、oracle)的身份设置 DISPLAY 环境:
[root@racnode1 ~]# su - grid [grid@racnode1 ~]$ DISPLAY=<your local workstation>:0.0 [grid@racnode1 ~]$ export DISPLAY [grid@racnode1 ~]$ # TEST X CONFIGURATION BY RUNNING xterm [grid@racnode1 ~]$ xterm &
图 16:在 Windows 上测试 X11 显示服务器,从节点 1 (racnode1) 运行 xterm
15. 为 Oracle 配置 Linux 服务器
在集群中的两个 Oracle RAC 节点上执行以下配置过程。
每次引导算机时,都需要在集群中的两个 Oracle RAC 节点上定义本节讨论的内核参数。本节提供了设置 Oracle 必需的那些内核参数的信息。第 17 节(“用于两个 Oracle RAC 节点的所有启动命令”)中说明了如何将这些参数置于启动脚本 (/etc/sysctl.conf) 中。
概述
本节主要介绍如何配置两台 Oracle RAC Linux 服务器 — 使每台服务器作好准备,以便在 Oracle Enterprise Linux 5 平台上安装 Oracle 11g 第 2 版 Grid Infrastructure 和 Oracle RAC 11g 第 2 版。具体任务包括:验证是否有足够的内存和交换空间、设置共享内存和信号、设置文件句柄的最大数量、设置 IP 本地端口范围,最后说明如何激活系统的所有内核参数。
有多种方法来配置这些参数。就本文而言,我将通过把所有设置值置于 /etc/sysctl.conf 文件中以使所有更改永久有效(通过重新引导)。
内存和交换空间考虑事项
RHEL/OEL 的最小 RAM 要求为:1.5 GB 用于集群的 Grid Infrastructure,或 2.5 GB 用于集群的 Grid Infrastructure 和 Oracle RAC。在本指南中,每个 Oracle RAC 节点上将运行 Oracle Grid Infrastructure 和 Oracle RAC,因此每台服务器至少需要 2.5 GB RAM。本文中使用的每个 RAC 节点配备了 4 GB 的物理 RAM。
所需的最小交换空间为 1.5 GB。对于 RAM 等于或小于 2 GB 的系统, Oracle 建议您将交换空间设置为 RAM 容量的 1.5 倍。对于 RAM 在 2 GB 到 16 GB 之间的系统,请使用与 RAM 同等大小的交换空间。对于 RAM 大于 16 GB 的系统,请使用 16 GB 的交换空间。
- 要检查已拥有的内存容量,键入以下命令:
[root@racnode1 ~]# cat /proc/meminfo | grep MemTotal MemTotal: 4038564 kB
- 要检查已分配的交换容量,键入以下命令:
[root@racnode1 ~]# cat /proc/meminfo | grep SwapTotal SwapTotal: 6094840 kB
- 如果内存少于 4GB(介于 RAM 与 SWAP 之间),您可以通过创建临时交换文件添加临时交换空间。这样,您就不必使用原始设备甚至更为彻底地重建系统了。
以 root 身份创建一个用作额外交换空间的文件,假设大小为 500MB:
# dd if=/dev/zero of=tempswap bs=1k count=500000现在我们应更改文件的权限:
# chmod 600 tempswap最后我们将该“分区”格式化为交换分区,并将其添加到交换空间:
# mke2fs tempswap
# mkswap tempswap
# swapon tempswap
配置内核参数
本节中出现的内核参数只是用于 Oracle 文档的建议值。对于生产数据库系统,Oracle 建议您对这些值进行调整,以优化系统性能。
在两个 Oracle RAC 节点上,验证本节所述的内核参数的设置值大于或等于推荐值。另请注意,在设置四个信号值时,需要在同一行中输入全部四个值。
配置内核参数
RHEL/OEL 5 上的 Oracle Database 11g 第 2 版需要如下所示的内核参数设置。给出的值都是最小值,因此如果您的系统使用更大的值,则不要更改。
kernel.shmmax = 4294967295
kernel.shmall = 2097152
kernel.shmmni = 4096
kernel.sem = 250 32000 100 128
fs.file-max = 6815744
net.ipv4.ip_local_port_range = 9000 65500
net.core.rmem_default=262144
net.core.rmem_max=4194304
net.core.wmem_default=262144
net.core.wmem_max=1048576
fs.aio-max-nr=1048576
RHEL/OEL 5 已经配置了为以下内核参数定义的默认值:
kernel.shmall
kernel.shmmax
如果这些默认值等于或大于必需值,则使用这些默认值。
本文假定采用 Oracle Enterprise Linux 5 的全新安装,则已经设置了许多必需的内核参数(见上面)。如果是这样,您以 root 用户身份登录后,只需将以下内容命令复制/粘贴到两个 Oracle RAC 节点中:
[root@racnode1 ~]# cat >> /etc/sysctl.conf <<EOF# Controls the maximum number of shared memory segments system wide
kernel.shmmni = 4096# Sets the following semaphore values:
# SEMMSL_value SEMMNS_value SEMOPM_value SEMMNI_value
kernel.sem = 250 32000 100 128# Sets the maximum number of file-handles that the Linux kernel will allocate
fs.file-max = 6815744# Defines the local port range that is used by TCP and UDP
# traffic to choose the local port
net.ipv4.ip_local_port_range = 9000 65500# Default setting in bytes of the socket "receive" buffer which
# may be set by using the SO_RCVBUF socket option
net.core.rmem_default=262144# Maximum setting in bytes of the socket "receive" buffer which
# may be set by using the SO_RCVBUF socket option
net.core.rmem_max=4194304# Default setting in bytes of the socket "send" buffer which
# may be set by using the SO_SNDBUF socket option
net.core.wmem_default=262144# Maximum setting in bytes of the socket "send" buffer which
# may be set by using the SO_SNDBUF socket option
net.core.wmem_max=1048576# Maximum number of allowable concurrent asynchronous I/O requests requests
fs.aio-max-nr=1048576
EOF
激活系统的所有内核参数
上述命令将所需的内核参数插入到 /etc/sysctl.conf 启动文件中,这样每次系统重启时这些参数保持不变。Linux 允许在系统当前已启动并运行时修改这些内核参数,所以无需在更改内核参数后重启系统。要在当前运行的系统中激活新的内核参数值,在集群中的两个 Oracle RAC 节点上,以 root 用户身份运行以下命令:
[root@racnode1 ~]# sysctl -p
net.ipv4.ip_forward = 0
net.ipv4.conf.default.rp_filter = 1
net.ipv4.conf.default.accept_source_route = 0
kernel.sysrq = 0
kernel.core_uses_pid = 1
net.ipv4.tcp_syncookies = 1
kernel.msgmnb = 65536
kernel.msgmax = 65536
kernel.shmmax = 68719476736
kernel.shmall = 4294967296
kernel.shmmni = 4096
kernel.sem = 250 32000 100 128
fs.file-max = 6815744
net.ipv4.ip_local_port_range = 9000 65500
net.core.rmem_default = 262144
net.core.rmem_max = 4194304
net.core.wmem_default = 262144
net.core.wmem_max = 1048576
fs.aio-max-nr = 1048576
通过在集群中的两个 Oracle RAC 节点上运行以下命令来验证新的内核参数值:
[root@racnode1 ~]# /sbin/sysctl -a | grep shm
vm.hugetlb_shm_group = 0
kernel.shmmni = 4096
kernel.shmall = 4294967296
kernel.shmmax = 68719476736 [root@racnode1 ~]# /sbin/sysctl -a | grep sem
kernel.sem = 250 32000 100 128 [root@racnode1 ~]# /sbin/sysctl -a | grep file-max
fs.file-max = 6815744 [root@racnode1 ~]# /sbin/sysctl -a | grep ip_local_port_range
net.ipv4.ip_local_port_range = 9000 65500 [root@racnode1 ~]# /sbin/sysctl -a | grep 'core\.[rw]mem'
net.core.rmem_default = 262144
net.core.wmem_default = 262144
net.core.rmem_max = 4194304
net.core.wmem_max = 1048576
16. 配置 RAC 节点以便可以使用 SSH 进行远程访问(可选)
在两个 Oracle RAC 节点上执行以下可选过程,以便手动配置“grid”和“oracle”用户在两个集群成员节点之间无口令的 SSH 连接。
本文档这一节的一个最大好处是,此节是完全可选的!这并不是说没必要在 Oracle RAC 节点之间配置安全 Shell (SSH) 连接。相反,Oracle Universal Installer (OUI) 在软件安装过程中会使用安全 shell 工具 ssh 和 scp 命令对集群的其他节点运行远程命令并将文件复制到集群的其他节点上。Oracle 软件安装过程中必须对 SSH 进行配置,这些命令才不会要求输入口令。运行 SSH 命令而不要求输入口令,这种能力有时称作 用户等效性。
本文这一节之所以是可选的,是因为 11g 第 2 版中的 OUI 界面包含了一个新的特性,该特性可以在 Oracle 软件的实际安装阶段为执行该安装的用户帐户自动配置 SSH。OUI 执行的自动配置会在集群的所有成员节点间创建无口令的 SSH 连接。Oracle 建议,只要有可能就使用自动配置过程。
除了在安装 Oracle 软件时使用 SSH 外,在软件安装之后,配置助手、Oracle Enterprise Manager、OPatch 以及其他执行从本地节点到远程节点的配置操作的特性也会使用 SSH。
注:Oracle Clusterware 11g 第 2 版及更高版本不再支持使用口令短语配置 SSH。Oracle 11g 第 2 版及更高版本需要无口令的 SSH。
由于本指南用 grid 作为 Oracle Grid Infrastructure 软件所有者,用 oracle 作为 Oracle RAC 软件所有者,因此必须为这两个用户帐户配置无口令的 SSH。
注:如果没有 SSH,安装程序会尝试使用 rsh 和 rcp 命令取代 ssh 和 scp。不过,在大多数 Linux 系统上,这些服务在默认情况下处于禁用状态。本文不讨论 RSH 的使用。
验证已安装 SSH 软件
Linux 发布版本支持的 SSH 版本为 OpenSSH。Linux 发布版本的最低安装应包括 OpenSSH。要确认安装了 SSH 程序包,在两个 Oracle RAC 节点上运行以下命令:
[root@racnode1 ~]# rpm -qa --queryformat "%{NAME}-%{VERSION}-%{RELEASE}
(%{ARCH})\n"| grep ssh
openssh-askpass-4.3p2-36.el5 (x86_64)
openssh-clients-4.3p2-36.el5 (x86_64)
openssh-4.3p2-36.el5 (x86_64)
openssh-server-4.3p2-36.el5 (x86_64)
如果看不到 SSH 程序包列表,则为您的 Linux 发布版本安装这些程序包。例如,将 1 号 CD 装到每个 Oracle RAC 节点中,执行以下命令安装 OpenSSH 程序包:
[root@racnode1 ~]# mount -r /dev/cdrom /media/cdrom
[root@racnode1 ~]# cd /media/cdrom/Server
[root@racnode1 ~]# rpm -Uvh openssh-*
[root@racnode1 ~]# cd /
[root@racnode1 ~]# eject
为何使用手动方法选项来配置 SSH 用户等效性?
如果 OUI 已包括可以自动配置两个 Oracle RAC 节点间的 SSH 的特性,我们为什么还提供一节的内容来说明如何手动配置无口令的 SSH 连接?事实上,对本文而言,为了支持 Oracle 的自动配置方法(包括在安装程序中),我已决定放弃手动配置 SSH 连接。
提供此节(手动配置 SSH)的一个原因是为了说明这样的事实:必须从所有 Oracle 软件安装所有者的配置文件中删除 stty 命令,并且删除登录时触发的、可生成发往终端的消息的其他安全措施。这些消息、邮件检查及其他显示会阻止 Oracle 软件安装所有者使用 Oracle Universal Installer 中内置的 SSH 配置脚本。如果没有禁用这些安全措施,则必须手动配置 SSH 后才可运行安装。本节稍后将介绍其他说明如何防止因 stty 命令引发的安装错误的文档。
另一个原因是,您可能决定手动配置用户等效性 SSH,以便能够在安装 Oracle 软件之前运行集群验证实用程序 (CVU)。CVU (runcluvfy.sh) 是一个非常有用的工具,位于 Oracle 集群件的根目录下。该工具不仅检查是否满足了软件安装前的所有前提条件,还能够生成称作“修复脚本”的 shell 脚本程序,从而解决许多不满足系统配置要求的问题。然而,CVU 确实有它自己的前提条件,那就是为运行安装的用户帐户正确配置 SSH 用户等效性。如果您打算使用 OUI 配置 SSH 连接,就要知道 CVU 实用程序将会失败,它没有机会执行任何关键检查。
[grid@racnode1 ~]$ /media/cdrom/grid/runcluvfy.sh stage -pre crsinst -fixup -n
racnode1,racnode2 -verbose
Performing pre-checks for cluster services setup Checking node reachability... Check: Node reachability from node "racnode1"
Destination Node Reachable?
------------------------------------ ------------------------
racnode1 yes
racnode2 yes
Result: Node reachability check passed from node "racnode1" Checking user equivalence... Check: User equivalence for user "grid"
Node Name Comment
------------------------------------ ------------------------
racnode2 failed
racnode1 failed
Result: PRVF-4007 : User equivalence check failed for user "grid"ERROR:
User equivalence unavailable on all the specified nodes
Verification cannot proceedPre-check for cluster services setup was unsuccessful on all the nodes.
请注意,在安装 Oracle 软件之前不一定非要运行 CVU 实用程序。从 Oracle 11g 第 2 版开始,安装程序会检测不满足最低安装要求的情况并执行与 CVU 相同的任务 — 生成修复脚本以解决不满足系统配置要求的问题。
在集群的所有节点上手动配置 SSH 连接
需要重申的是,在运行 OUI 之前手动配置 SSH 连接并不是必需的。在 11g 第 2 版中,OUI 在安装过程中为执行安装的用户帐户提供了一个界面,以便在所有集群成员节点之间自动创建无口令的 SSH 连接。这是 Oracle 建议采用的方法,也是本文使用的方法。我们将完成以下任务来手动配置所有集群成员节点之间的 SSH 连接,提供此手动配置过程只是为了说明之目的。要记住本指南使用 grid 作为 Oracle Grid Infrastructure 软件所有者,使用 oracle 作为 Oracle RAC 软件的所有者。如果您决定手动配置 SSH 连接,应对这两个用户帐户都进行这样的配置。
此节旨在为 grid 和 oracle 这两个操作系统用户帐户设置用户等效性。利用用户等效性,grid 和 oracle 用户帐户无需口令即可访问集群中的所有其他节点(运行命令和复制文件)。Oracle 在 10g 第 1 版中增加了对使用 SSH 工具套件设置用户等效性的支持。在 Oracle 数据库 10g 之前,只能使用远程 shell (RSH) 配置用户等效性。
下面示例中列出的 Oracle 软件所有者是 grid 用户。
检查系统中的现有 SSH 配置
要确定是否 SSH 已安装并运行,输入以下命令:
[grid@racnode1 ~]$ pgrep sshd 2535 19852
如果 SSH 正在运行,那么该命令的响应将是一个进程 ID 号(一个或多个)列表。在集群中的两个 Oracle RAC 节点上运行此命令,验证 SSH 后台程序已安装并正在运行。
您需要 SSH 协议所需的 RSA 或 DSA 密钥。RSA 用于 SSH 1.5 协议,而 DSA 则默认用于 SSH 2.0 协议。而对于 OpenSSH,您既可以使用 RSA,也可以使用 DSA。下面的说明是针对 SSH1 的。如果您安装了 SSH2,但不能使用 SSH1,那么请参考 SSH 分发文档来配置 SSH1 兼容性或使用 DSA 配置 SSH2。
注:使用 OUI 自动配置无口令的 SSH 会在集群的所有节点上生成 RSA 加密密钥。
在集群节点上配置无口令的 SSH
要配置无口令的 SSH,必须先在每个集群节点上生成 RSA 或 DSA 密钥,然后将所有集群节点成员上生成的所有密钥复制到 授权密钥文件 中,该文件在每个节点上都是相同的。注意,SSH 文件必须只能由 root 用户、软件安装用户(grid、oracle)读取,因为如果其他用户可以访问一个私钥文件,则 SSH 会忽略该文件。以下示例中使用 DSA 密钥。
对于安装时要使用的 Oracle 软件安装所有者(grid、oracle),您必须为每个所有者分别配置无口令的 SSH。
要配置无口令的 SSH,完成以下任务:
在每个节点上创建 SSH 目录并生成 SSH 密钥
在每个节点上完成以下步骤:
- 以软件所有者身份(此例中为 grid 用户)登录。
[root@racnode1 ~]# su - grid
- 要确保您是以 grid 登录的,并验证用户 ID 与预期的用户 ID(即您已为grid 用户分配的用户 ID)一致,输入 id 和 id grid 命令。确保 Oracle 用户组和用户与您当前使用的用户终端窗口进程的组和用户 ID 相同。例如:
[grid@racnode1 ~]$ id uid=1100(grid) gid=1000(oinstall) groups=1000(oinstall),1200(asmadmin),1201(asmdba),1202(asmoper) [grid@racnode1 ~]$ id grid uid=1100(grid) gid=1000(oinstall) groups=1000(oinstall),1200(asmadmin),1201(asmdba),1202(asmoper)
- 如有必要,在 grid 用户的主目录下创建.ssh 目录并设置相应权限,以确保仅 oracle 用户具有读写权限:
[grid@racnode1 ~]$ mkdir ~/.ssh [grid@racnode1 ~]$ chmod 700 ~/.ssh
注:如果权限未设置为 700,SSH 配置将失败。 - 输入以下命令,为 SSH 协议生成 DSA 密钥对(公共密钥和私有密钥):出现提示时,接受默认的密钥文件位置和无口令短语设置(按 [Enter]):
[grid@racnode1 ~]$ /usr/bin/ssh-keygen -t dsa Generating public/private dsa key pair. Enter file in which to save the key (/home/grid/.ssh/id_dsa):[Enter] Enter passphrase (empty for no passphrase):[Enter] Enter same passphrase again:[Enter] Your identification has been saved in /home/grid/.ssh/id_dsa. Your public key has been saved in /home/grid/.ssh/id_dsa.pub. The key fingerprint is: 7b:e9:e8:47:29:37:ea:10:10:c6:b6:7d:d2:73:e9:03 grid@racnode1
注:Oracle Clusterware 11g 第 2 版及更高版本不支持使用口令短语的 SSH。Oracle 11g 第 2 版及更高版本必须使用无口令的 SSH。
此命令将 DSA 公共密钥写入 ~/.ssh/id_dsa.pub 文件,将私有密钥写入 ~/.ssh/id_dsa 文件。
绝不要将私钥分发给任何无权执行 Oracle 软件安装的用户。
- 对您想使其成为集群成员的所有其他使用 DSA 密钥的节点 (racnode2) 重复第 1 步到第 4 步。
将所有密钥添加到一个公共 authorized_keys 文件
现在,每个 Oracle RAC 节点都包含用于 DSA 的公共和私有密钥,您需要在其中一个节点上创建一个授权密钥文件 (authorized_keys)。授权密钥文件只是一个包含每个用户(每个节点)的 DSA 公共密钥的文件。在授权密钥文件包含了所有公共密钥后,将其分发至集群中的所有其他节点。
注:每个节点上 grid 用户的 ~/.ssh/authorized_keys 文件必须包含您在所有集群节点上生成的所有 ~/.ssh/id_dsa.pub 文件中的内容。
在集群中的一个节点上完成以下步骤以生成授权密钥文件,然后分发该文件。对于此文而言,我将使用集群中的主节点 racnode1:
- 从 racnode1(本地节点)中确定所有者的主目录 .ssh 中是否存在授权密钥文件 ~/.ssh/authorized_keys。大多数情况下,该文件是不存在的,因为本文假设您正在进行新的安装。如果该文件不存在,那么现在进行创建:
[grid@racnode1 ~]$ touch ~/.ssh/authorized_keys [grid@racnode1 ~]$ ls -l ~/.ssh total 8 -rw-r--r-- 1 grid oinstall 0 Nov 12 12:34 authorized_keys -rw------- 1 grid oinstall 668 Nov 12 09:24 id_dsa -rw-r--r-- 1 grid oinstall 603 Nov 12 09:24 id_dsa.pub
在 .ssh 目录中,您会看到前面生成的 id_dsa.pub 密钥以及空白文件 authorized_keys。
- 在本地节点 (racnode1) 上,使用 SCP(安全复制)或 SFTP(安全 FTP)将 ~/.ssh/id_dsa.pub 公共密钥的内容从集群中的两个 Oracle RAC 节点复制到刚才创建的授权密钥文件 (~/.ssh/authorized_keys) 中。同样,从 racnode1 进行该操作。系统将提示您为每个访问的 Oracle RAC 节点输入 grid OS 用户帐户口令。
以下示例是在 racnode1 节点上运行的,假定集群有两个节点,分别是 racnode1 和 racnode2:
[grid@racnode1 ~]$ ssh racnode1 cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys The authenticity of host 'racnode1 (192.168.1.151)' can't be established. RSA key fingerprint is 2f:0d:2c:da:9f:d4:3d:2e:ea:e9:98:20:2c:b9:e8:f5. Are you sure you want to continue connecting (yes/no)? yes Warning: Permanently added 'racnode1,192.168.1.151' (RSA) to the list of known hosts. grid@racnode1's password:xxxxx [grid@racnode1 ~]$ ssh racnode2 cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys The authenticity of host 'racnode2 (192.168.1.152)' can't be established. RSA key fingerprint is 97:ab:db:26:f6:01:20:cc:e0:63:d0:d1:73:7e:c2:0a. Are you sure you want to continue connecting (yes/no)? yes Warning: Permanently added 'racnode2,192.168.1.152' (RSA) to the list of known hosts. grid@racnode2's password:xxxxx
第一次使用 SSH 从某个特定系统连接到节点时,您会看到类似以下的消息:
The authenticity of host 'racnode1 (192.168.1.151)' can't be established. RSA key fingerprint is 2f:0d:2c:da:9f:d4:3d:2e:ea:e9:98:20:2c:b9:e8:f5. Are you sure you want to continue connecting (yes/no)? yes
在该提示下输入 yes 继续。于是,会将公共主机名添加到 ~/.ssh 目录下的 known_hosts 文件中,以后再从此系统连接到相同节点时就不会看到此消息了。
- 此时,racnode1 上的授权密钥文件 (~/.ssh/authorized_keys) 中含有来自集群中各个节点的 DSA 公共密钥。
[grid@racnode1 ~]$ ls -l ~/.ssh total 16 -rw-r--r-- 1 grid oinstall 1206 Nov 12 12:45 authorized_keys -rw------- 1 grid oinstall 668 Nov 12 09:24 id_dsa -rw-r--r-- 1 grid oinstall 603 Nov 12 09:24 id_dsa.pub -rw-r--r-- 1 grid oinstall 808 Nov 12 12:45 known_hosts
我们现在将其复制到集群中的其余节点。在我们的双节点集群示例中,唯一剩下的节点就是 racnode2。使用 scp 命令将授权密钥文件复制到集群中的所有其余节点:
[grid@racnode1 ~]$ scp ~/.ssh/authorized_keys racnode2:.ssh/authorized_keys grid@racnode2's password:xxxxx authorized_keys 100% 1206 1.2KB/s 00:00
- 通过登录到节点并运行以下命令,为集群中的两个 Oracle RAC 节点更改授权密钥文件的权限:
[grid@racnode1 ~]$ chmod 600 ~/.ssh/authorized_keys
在集群节点上启用 SSH 用户等效性
将包含所有公共密钥的 authorized_keys 文件复制到集群中的每个节点之后,完成本节中的各个步骤以确保正确配置了集群成员节点之间的无口令 SSH 连接。在本示例中,将使用名为 grid 的 Oracle Grid Infrastructure 软件所有者。
当您运行本节中的测试 SSH 命令时,如果看到除日期和主机名之外的任何其他消息或文本,则 Oracle 安装将失败。如果任一节点提示您输入口令或口令短语,则验证节点上的 ~/.ssh/authorized_keys 文件中包含了正确的公共密钥并且您已创建了具有同样组成员关系和 ID 的 Oracle 软件所有者。进行必要的更改,以确保您在输入这些命令时只显示日期和主机名。您应当确保对生成任何输出或询问任何问题的登录脚本的任何部分进行修改,以便它们仅当 shell 是 交互式 shell 时才会生效。
- 在您希望运行 OUI 的系统 (racnode1) 上,以 grid 用户身份登录。
[root@racnode1 ~]# su - grid
- 如果 SSH 配置正确,您将能够从终端对话使用 ssh 和 scp 命令,而无需提供口令或口令短语。
[grid@racnode1 ~]$ ssh racnode1 "date;hostname" Fri Nov 13 09:46:56 EST 2009 racnode1 [grid@racnode1 ~]$ ssh racnode2 "date;hostname" Fri Nov 13 09:47:34 EST 2009 racnode2
- 在 Oracle RAC 集群中的其余节点 (racnode2) 上执行相同的操作,以确保这些节点同样可以访问所有其他节点而无需提供口令或口令短语,并且这些节点添加到了 known_hosts 文件中:
[grid@racnode2 ~]$ ssh racnode1 "date;hostname" The authenticity of host 'racnode1 (192.168.1.151)' can't be established. RSA key fingerprint is 2f:0d:2c:da:9f:d4:3d:2e:ea:e9:98:20:2c:b9:e8:f5. Are you sure you want to continue connecting (yes/no)? yes Warning: Permanently added 'racnode1,192.168.1.151' (RSA) to the list of known hosts. Fri Nov 13 10:19:57 EST 2009 racnode1 [grid@racnode2 ~]$ ssh racnode1 "date;hostname" Fri Nov 13 10:20:58 EST 2009 racnode1 -------------------------------------------------------------------------- [grid@racnode2 ~]$ ssh racnode2 "date;hostname" The authenticity of host 'racnode2 (192.168.1.152)' can't be established. RSA key fingerprint is 97:ab:db:26:f6:01:20:cc:e0:63:d0:d1:73:7e:c2:0a. Are you sure you want to continue connecting (yes/no)? yes Warning: Permanently added 'racnode2,192.168.1.152' (RSA) to the list of known hosts. Fri Nov 13 10:22:00 EST 2009 racnode2 [grid@racnode2 ~]$ ssh racnode2 "date;hostname" Fri Nov 13 10:22:01 EST 2009 racnode2
- Oracle Universal Installer 是一个 GUI 接口,要求使用 X 服务器。在启用了用户等效性的终端会话中(您将从其中执行 Oracle 安装的节点),将环境变量 DISPLAY 设置为有效的 X 窗口显示:
Bourne、Korn 和 Bash shell:
[grid@racnode1 ~]$ DISPLAY=<Any X-Windows Host>:0 [grid@racnode1 ~]$ export DISPLAY
C shell:
[grid@racnode1 ~]$ setenv DISPLAY <Any X-Windows Host>:0
将 DISPLAY 变量设置为有效的 X 窗口显示后,您应当执行当前终端会话的另一个测试,以确保未启用 X11 forwarding:
[grid@racnode1 ~]$ ssh racnode1 hostname racnode1 [grid@racnode1 ~]$ ssh racnode2 hostname racnode2
注:如果您使用远程客户端连接到执行安装的节点,则会看到类似这样的消息:“Warning:No xauth data; using fake authentication data for X11 forwarding.”,这意味着您的授权密钥文件配置正确,但是,您的 SSH 配置启用了 X11 forwarding。例如:
[grid@racnode1 ~]$ export DISPLAY=melody:0 [grid@racnode1 ~]$ ssh racnode2 hostname Warning: No xauth data; using fake authentication data for X11 forwarding. racnode2
注意,启用 X11 Forwarding 将导致 Oracle 安装失败。要纠正这个问题,需为禁用 X11 Forwarding 的 oracle OS 用户帐户创建一个用户级 SSH 客户端配置文件:
- 使用文本编辑器,编辑或创建 ~/.ssh/config 文件
- 确保 ForwardX11 属性设为 no。例如,将以下内容插入 ~/.ssh/config 文件:
Host *ForwardX11 no
防止 stty 命令引发的安装错误
在 Oracle Grid Infrastructure 或 Oracle RAC 软件的安装过程中,OUI 使用 SSH 运行命令并将文件复制到其他节点。在安装过程中,系统中的隐藏文件(例如 .bashrc 或 .cshrc)如果包含stty 命令,则会导致生成文件错误和其他安装错误。
要避免该问题,必须在每个 Oracle 安装所有者的用户主目录中修改这些文件以取消所有 STDERR 输出,如下所示:
- Bourne、Bash 或 Korn shell:
if [ -t 0 ]; then stty intr ^C fi
- C shell:
test -t 0 if ($status == 0) then stty intr ^C endif
注:如果由远程 shell 加载的隐藏文件包含 stty 命令,则 OUI 将指示错误并停止安装。
17. 适用于这两个 Oracle RAC 节点的所有启动命令
验证以下启动命令都包含在集群中的两个 Oracle RAC 节点上。
至此,我们已经详细介绍了需要在 Oracle 11g RAC 集群配置的两个节点上配置的参数和资源。在本节中,我们将回顾前几节中提到的在两个 Oracle RAC 节点引导时需要使用的参数、命令和条目。
对于下面每个启动文件, 红色的条目应包含在每个启动文件中。
/etc/sysctl.conf
我们希望调整互连的默认和最大发送缓冲区大小以及默认和最大的接收缓冲区大小。该文件还包含负责配置由 Oracle 实例使用的共享内存、信号、文件句柄以及本地 IP 范围的参数。
.................................................................
# Kernel sysctl configuration file for Red Hat Linux
# # For binary values, 0 is disabled, 1 is enabled. See sysctl(8) and
# sysctl.conf(5) for more details.# Controls IP packet forwarding
net.ipv4.ip_forward = 0# Controls source route verification
net.ipv4.conf.default.rp_filter = 1# Do not accept source routing
net.ipv4.conf.default.accept_source_route = 0# Controls the System Request debugging functionality of the kernel
kernel.sysrq = 0# Controls whether core dumps will append the PID to the core filename
# Useful for debugging multi-threaded applications
kernel.core_uses_pid = 1# Controls the use of TCP syncookies
net.ipv4.tcp_syncookies = 1# Controls the maximum size of a message, in bytes
kernel.msgmnb = 65536# Controls the default maxmimum size of a mesage queue
kernel.msgmax = 65536# Controls the maximum shared segment size, in bytes
kernel.shmmax = 68719476736# Controls the maximum number of shared memory segments, in pages
kernel.shmall = 4294967296# Controls the maximum number of shared memory segments system wide
kernel.shmmni = 4096# Sets the following semaphore values:
# SEMMSL_value SEMMNS_value SEMOPM_value SEMMNI_value
kernel.sem = 250 32000 100 128# Sets the maximum number of file-handles that the Linux kernel will allocate
fs.file-max = 6815744# Defines the local port range that is used by TCP and UDP
# traffic to choose the local port
net.ipv4.ip_local_port_range = 9000 65500# Default setting in bytes of the socket "receive" buffer which
# may be set by using the SO_RCVBUF socket option
net.core.rmem_default=262144# Maximum setting in bytes of the socket "receive" buffer which
# may be set by using the SO_RCVBUF socket option
net.core.rmem_max=4194304# Default setting in bytes of the socket "send" buffer which
# may be set by using the SO_SNDBUF socket option
net.core.wmem_default=262144# Maximum setting in bytes of the socket "send" buffer which
# may be set by using the SO_SNDBUF socket option
net.core.wmem_max=1048576# Maximum number of allowable concurrent asynchronous I/O requests requests
fs.aio-max-nr=1048576
.................................................................
验证 /etc/sysctl.conf 文件中配置了每个所需内核参数。然后,在集群的两个 Oracle RAC 节点上运行以下命令,以确保每个参数真正生效:
[root@racnode1 ~]# sysctl -p net.ipv4.ip_forward = 0 net.ipv4.conf.default.rp_filter = 1 net.ipv4.conf.default.accept_source_route = 0 kernel.sysrq = 0 kernel.core_uses_pid = 1 net.ipv4.tcp_syncookies = 1 kernel.msgmnb = 65536 kernel.msgmax = 65536 kernel.shmmax = 68719476736 kernel.shmall = 4294967296 kernel.shmmni = 4096 kernel.sem = 250 32000 100 128 fs.file-max = 6815744 net.ipv4.ip_local_port_range = 9000 65500 net.core.rmem_default = 262144 net.core.rmem_max = 4194304 net.core.wmem_default = 262144 net.core.wmem_max = 1048576 fs.aio-max-nr = 1048576
/etc/hosts
我们的 RAC 集群中的节点的所有机器/IP 地址项。
.................................................................
# Do not remove the following line, or various programs
# that require network functionality will fail.127.0.0.1 localhost.localdomain localhost# Public Network - (eth0)
192.168.1.151 racnode1
192.168.1.152 racnode2# Private Interconnect - (eth1)
192.168.2.151 racnode1-priv
192.168.2.152 racnode2-priv# Public Virtual IP (VIP) addresses - (eth0:1)
192.168.1.251 racnode1-vip
192.168.1.252 racnode2-vip# Single Client Access Name (SCAN)
192.168.1.187 racnode-cluster-scan# Private Storage Network for Openfiler - (eth1)
192.168.1.195 openfiler1
192.168.2.195 openfiler1-priv# Miscellaneous Nodes
192.168.1.1 router
192.168.1.105 packmule
192.168.1.106 melody
192.168.1.121 domo
192.168.1.122 switch1
192.168.1.125 oemprod
192.168.1.245 accesspoint
.................................................................
/etc/udev/rules.d/55-openiscsi.rules
udev 用来挂载 iSCSI 卷的规则文件。此文件包含所有用于接收事件的名称=值对以及处理事件的 SHELL 调出脚本。
.................................................................
# /etc/udev/rules.d/55-openiscsi.rules
KERNEL=="sd*", BUS=="scsi", PROGRAM="/etc/udev/scripts/iscsidev.sh %b",
SYMLINK+="iscsi/%c/part%n"
.................................................................
/etc/udev/scripts/iscsidev.sh
SHELL 调出脚本,用于处理从 udev 规则文件(见上面)传递过来的事件,并且用于挂载 iSCSI 卷。
.................................................................
#!/bin/sh# FILE: /etc/udev/scripts/iscsidev.shBUS=${1}
HOST=${BUS%%:*}[ -e /sys/class/iscsi_host ] || exit 1file="/sys/class/iscsi_host/host${HOST}/device/session*/iscsi_session*
/targetname"target_name=$(cat ${file})# This is not an open-scsi drive
if [ -z "${target_name}" ]; thenexit 1
fi# Check if QNAP drive
check_qnap_target_name=${target_name%%:*}
if [ $check_qnap_target_name = "iqn.2004-04.com.qnap" ]; thentarget_name=`echo "${target_name%.*}"`
fiecho "${target_name##*.}"
.................................................................
18. 安装并配置 ASMLib 2.0
应在集群中的两个 Oracle RAC 节点上执行本节中的安装和配置过程。但创建 ASM 磁盘将只需在集群中的单个节点 (racnode1) 上执行。
在本节中,我们将安装并配置 ASMLib 2.0,它是 Oracle 数据库的自动存储管理 (ASM) 特性的一个支持库。本文将使用 ASM 作为 Oracle Clusterware 文件(OCR 和表决磁盘)、Oracle Database 文件(数据、联机重做日志、控制文件、存档重做日志)和快速恢复区的共享文件系统和卷管理器。
自动存储管理简化了数据库的管理工作,有了它,DBA 无需直接管理可能数千个的 Oracle 数据库文件,而只需管理分配给 Oracle 数据库的磁盘组。ASM 内置在 Oracle 内核中,既可用于 Oracle 的单实例环境中,也可用于 Oracle 的集群实例环境中。Oracle 使用的所有文件和目录将保存在 磁盘组 中 —(本文中为三个磁盘组)。ASM 在所有可用磁盘驱动器上执行并行负载平衡,以防止热点问题并最大程度地提高性能,甚至对于数据使用快速变化的模式也是如此。ASMLib 令使用 ASM 的 Oracle 数据库更加高效,并能够访问它当前使用的磁盘组。
请记住 ASMLib 只是 ASM 软件的一个支持库。本指南稍后将 ASM 软件作为 Oracle Grid Infrastructure 的一部分来安装。 从 Oracle Grid Infrastructure 11g 第 2 版 (11.2) 开始,自动存储管理和 Oracle Clusterware 软件一起打包到同一个二进制发布版本中并安装到同一个主目录中,这个主目录称为 Grid Infrastructure 主目录。Oracle Grid Infrastructure 软件将为 grid 用户所拥有。
那么,ASM 是否必须使用 ASMLib?完全不是。事实上,有两种不同方法可在 Linux 上配置 ASM:
- 使用 ASMLib I/O 的 ASM:此方法使用 ASMLib 调用在由 ASM 管理的原始 块设备 上创建所有 Oracle 数据库文件。由于 ASMLib 使用块设备,因此该方法不需要原始设备。
- 使用标准 Linux I/O 的 ASM:此方法不使用 ASMLib。此方法使用标准 Linux I/O 系统调用在 ASM 管理的原始字符设备 上创建所有的 Oracle 数据库文件。您将需要为 ASM 使用的所有磁盘分区创建原始设备。
在本文中,我将使用“使用 ASMLib I/O 的 ASM”方法。Oracle 在 Metalink Note 275315.1 中说明,“所提供的 ASMLib 用于支持对 Linux 磁盘的 ASM I/O,同时不受标准 UNIX I/O API 的限制”。我计划将来执行几个测试以确定使用 ASMLib 将会带来的性能改善。这些性能度量和测试细节超出了本文的范围,因此将不予讨论。
如果要了解有关 Oracle ASMLib 2.0 的详细信息,请访问这里
安装 ASMLib 2.0 程序包
在本文的前几个版本中,此时您需要从适用于 Red Hat Enterprise Linux Server 5 的 Oracle ASMLib 下载处下载 ASMLib 2.0 软件。由于 Oracle Enterprise Linux 中包含了 ASMLib 软件,此处不再需要进行这一操作(但用户空间库除外,它需要单独下载)。ASMLib 2.0 软件体系包含下面的软件包:
32 位 (x86) 安装
- ASMLib 内核驱动程序
- oracleasm-x.x.x-x.el5-x.x.x-x.el5.i686.rpm —(用于默认内核)
- oracleasm-x.x.x-x.el5xen-x.x.x-x.el5.i686.rpm —(用于 xen 内核)
- 用户空间库
- oracleasmlib-x.x.x-x.el5.i386.rpm
- 驱动程序支持文件
- oracleasm-support-x.x.x-x.el5.i386.rpm
64 位 (x86_64) 安装
- ASMLib 内核驱动程序
- oracleasm-x.x.x-x.el5-x.x.x-x.el5.x86_64.rpm —(用于默认内核)
- oracleasm-x.x.x-x.el5xen-x.x.x-x.el5.x86_64.rpm —(用于 xen 内核)
- 用户空间库
- oracleasmlib-x.x.x-x.el5.x86_64.rpm
- 驱动程序支持文件
- oracleasm-support-x.x.x-x.el5.x86_64.rpm
就 Oracle Enterprise Linux 5 来说,默认情况下不安装 ASMLib 2.0 软件包。5 号 CD 上有 ASMLib 2.0 内核驱动程序,3 号 CD 上有驱动程序支持文件。用户空间库需单独下载,因为 Enterprise Linux 不包含该库。要确定 Oracle ASMLib 软件包是否已安装(多数情况下没有),在两个 Oracle RAC 节点上执行以下命令:
[root@racnode1 ~]# rpm -qa --queryformat "%{NAME}-%{VERSION}-%{RELEASE}
(%{ARCH})\n"| grep oracleasm | sort
如果未安装 ASMLib 2.0 软件包,依次加载 Enterprise Linux 3 号 CD 和 5 号 CD 到每个 Oracle RAC 节点上并执行以下命令:
From Enterprise Linux 5.4 (x86_64) - [CD #3]
mount -r /dev/cdrom /media/cdrom cd /media/cdrom/Server
rpm -Uvh oracleasm-support-2.1.3-1.el5.x86_64.rpm
cd /
ejectFrom Enterprise Linux 5.4 (x86_64) - [CD #5]
mount -r /dev/cdrom /media/cdrom cd /media/cdrom/Server
rpm -Uvh oracleasm-2.6.18-164.el5-2.0.5-1.el5.x86_64.rpm
cd /
eject
安装完 ASMLib 软件包后,在两个 Oracle RAC 节点上验证已安装该软件:
[root@racnode1 ~]# rpm -qa --queryformat "%{NAME}-%{VERSION}-%{RELEASE}
(%{ARCH})\n"| grep oracleasm | sort
oracleasm-2.6.18-164.el5-2.0.5-1.el5 (x86_64)
oracleasm-support-2.1.3-1.el5 (x86_64)
下载 Oracle ASMLib 用户空间库
如上节所述,ASMLib 2.0 软件包含在 Enterprise Linux 中,但用户空间库则不然(用户空间库也称做 ASMLib 支持库)。用户空间库是必需的,可在此处免费下载:
32 位 (x86) 安装
- oracleasmlib-2.0.4-1.el5.i386.rpm
64 位 (x86_64) 安装
- oracleasmlib-2.0.4-1.el5.x86_64.rpm
将用户空间库下载到集群中的两个 Oracle RAC 节点后,使用以下命令进行安装:
[root@racnode1 ~]# rpm -Uvh oracleasmlib-2.0.4-1.el5.x86_64.rpm
Preparing... ########################################### [100%]1:oracleasmlib ########################################### [100%]
有关如何通过 Unbreakable Linux Network 获取 ASMLib 支持库(并非本文必需)的信息,请访问通过 Unbreakable Linux Network 获得 Oracle ASMLib。
配置 ASMLib
现在,您已安装了用于 Linux 的 ASMLib 程序包,接下来您需要配置并加载 ASM 内核模块。需要在两个 Oracle RAC 节点上作为 root 用户帐户执行该任务。
注:oracleasm 命令的默认路径为 /usr/sbin。以前版本中使用的 /etc/init.d 路径并未被弃用,但该路径下的 oracleasm 二进制文件现在一般用于内部命令。如果输入 oracleasm configure 命令时不带 -i 标志,则显示当前配置。例如,
[root@racnode1 ~]# /usr/sbin/oracleasm configure
ORACLEASM_ENABLED=false
ORACLEASM_UID=
ORACLEASM_GID=
ORACLEASM_SCANBOOT=true
ORACLEASM_SCANORDER=""
ORACLEASM_SCANEXCLUDE=""
- 输入以下命令,以使用 configure 选项运行 oracleasm 初始化脚本:
[root@racnode1 ~]# /usr/sbin/oracleasm configure -i Configuring the Oracle ASM library driver. This will configure the on-boot properties of the Oracle ASM library driver. The following questions will determine whether the driver is loaded on boot and what permissions it will have. The current values will be shown in brackets ('[]'). Hitting <ENTER> without typing an answer will keep that current value. Ctrl-C will abort. Default user to own the driver interface []: grid Default group to own the driver interface []: asmadmin Start Oracle ASM library driver on boot (y/n) [n]: y Scan for Oracle ASM disks on boot (y/n) [y]: y Writing Oracle ASM library driver configuration: done
该脚本完成以下任务:
- 创建 /etc/sysconfig/oracleasm 配置文件
- 创建 /dev/oracleasm 挂载点
- 挂载 ASMLib 驱动程序文件系统
注: ASMLib 驱动程序文件系统并非常规的文件系统。它只用于自动存储管理库与自动存储管理驱动程序的通讯。
- 输入以下命令以加载 oracleasm 内核模块:
[root@racnode1 ~]# /usr/sbin/oracleasm init Creating /dev/oracleasm mount point: /dev/oracleasm Loading module "oracleasm": oracleasm Mounting ASMlib driver filesystem: /dev/oracleasm
- 对集群中要安装 Oracle RAC 的所有节点 (racnode2) 重复此过程。
为 Oracle 创建 ASM 磁盘
创建 ASM 磁盘只需在 RAC 集群中的一个节点上以 root 用户帐户执行。我将在 racnode1 上运行这些命令。在另一个 Oracle RAC 节点上,您将需要执行 scandisk 以识别新卷。该操作完成后,应在两个 Oracle RAC 节点上运行 oracleasm listdisks 命令以验证是否创建了所有 ASM 磁盘以及它们是否可用。
在“在 iSCSI 卷上创建分区”一节中,我们对 ASM 要使用的三个 iSCSI 卷进行了配置(分区)。ASM 将用于存储 Oracle Clusterware 文件、Oracle 数据库文件(如联机重做日志、数据库文件、控制文件、存档重做日志文件)和快速恢复区。在配置三个 ASM 卷时,使用 udev 创建的本地设备名。
要使用 iSCSI 目标名到本地设备名映射创建 ASM 磁盘,键入以下命令:
[root@racnode1 ~]# /usr/sbin/oracleasm createdisk CRSVOL1 /dev/iscsi/crs1/part1
Writing disk header: done
Instantiating disk: done [root@racnode1 ~]# /usr/sbin/oracleasm createdisk DATAVOL1 /dev/iscsi/data1/part1
Writing disk header: done
Instantiating disk: done [root@racnode1 ~]# /usr/sbin/oracleasm createdisk FRAVOL1 /dev/iscsi/fra1/part1
Writing disk header: done
Instantiating disk: done
要使磁盘可用于集群中其他节点 (racnode2),以 root 用户身份在每个节点上输入以下命令:
[root@racnode2 ~]# /usr/sbin/oracleasm scandisks
Reloading disk partitions: done
Cleaning any stale ASM disks...
Scanning system for ASM disks...
Instantiating disk "FRAVOL1"
Instantiating disk "DATAVOL1"
Instantiating disk "CRSVOL1"
现在,我们可以使用以下命令在 RAC 集群中的两个节点上以 root 用户帐户测试是否成功创建了 ASM 磁盘。此命令指出连接的节点的、标记为自动存储管理磁盘的共享磁盘:
[root@racnode1 ~]# /usr/sbin/oracleasm listdisks
CRSVOL1
DATAVOL1
FRAVOL1 [root@racnode2 ~]# /usr/sbin/oracleasm listdisks
CRSVOL1
DATAVOL1
FRAVOL1
19. 下载 Oracle RAC 11g 第 2 版软件
只需在集群中的一个节点上执行以下下载过程。
下一步是从 Oracle 技术网 (OTN) 下载并解压缩所需的 Oracle 软件包:
注: 如果您目前没有 Oracle OTN 帐户,那么您需要创建一个。这是免费帐户!Oracle 提供了一个免费的开发和测试许可。但不提供支持,且该许可不允许用于生产目的。OTN 提供了该许可协议的完整说明。
32 位 (x86) 安装
http://www.oracle.com/technetwork/cn/database/database11g/downloads/112010-linuxsoft-098940-zhs.html
64 位 (x86_64) 安装
http://www.oracle.com/technetwork/cn/database/database11g/downloads/112010-linx8664soft-098700-zhs.html
您将从 Oracle 下载所需的软件并将其解压缩到集群的一个 Linux 节点(即 racnode1)上。您将从此计算机执行所有的 Oracle 软件安装。Oracle 安装程序会通过远程访问 (scp) 将所需软件包复制到 RAC 配置中的所有其他节点。
以相应软件所有者的身份登录到要执行所有 Oracle 安装的节点 (racnode1)。例如,以 grid 用户身份登录后将 Oracle Grid Infrastructure 软件下载到 /home/grid/software/oracle 目录。然后,以 oracle 用户身份登录,将 Oracle Database 和 Oracle Examples(可选)软件下载到 /home/oracle/software/oracle 目录。
下载并解压缩 Oracle 软件
下载以下软件包:
- 适用于 Linux 的 Oracle Database 11g 第 2 版 Grid Infrastructure (11.2.0.1.0)
- 适用于 Linux 的 Oracle Database 11g 第 2 版 (11.2.0.1.0)
- Oracle Database 11g 第 2 版 Examples(可选)
所有下载均在同一页面中提供。
以 grid 用户身份解压缩 Oracle Grid Infrastructure 软件:
[grid@racnode1 ~]$ mkdir -p /home/grid/software/oracle
[grid@racnode1 ~]$ mv linux.x64_11gR2_grid.zip /home/grid/software/oracle
[grid@racnode1 ~]$ cd /home/grid/software/oracle
[grid@racnode1 oracle]$ unzip linux.x64_11gR2_grid.zip
以 oracle 用户身份解压缩 Oracle Database 和 Oracle Examples 软件:
[oracle@racnode1 ~]$ mkdir -p /home/oracle/software/oracle
[oracle@racnode1 ~]$ mv linux.x64_11gR2_database_1of2.zip
/home/oracle/software/oracle
[oracle@racnode1 ~]$ mv linux.x64_11gR2_database_2of2.zip
/home/oracle/software/oracle
[oracle@racnode1 ~]$ mv linux.x64_11gR2_examples.zip /home/oracle/software/oracle
[oracle@racnode1 ~]$ cd /home/oracle/software/oracle
[oracle@racnode1 oracle]$ unzip linux.x64_11gR2_database_1of2.zip
[oracle@racnode1 oracle]$ unzip linux.x64_11gR2_database_2of2.zip
[oracle@racnode1 oracle]$ unzip linux.x64_11gR2_examples.zip
20. 集群的 Oracle Grid Infrastructure 的安装前任务
在集群中的两个 Oracle RAC 节点上执行以下检查。
本节包含尚未讨论过的 Oracle Grid Infrastructure 的其余所有安装前任务。请注意,在运行 Oracle 安装程序之前不一定要手动运行集群验证实用程序 (CVU)。在 Oracle Grid Infrastructure 安装结束时,CVU 会作为配置助手过程的一部分自动运行。
安装用于 Linux 的 cvuqdisk 程序包
在两个 Oracle RAC 节点上安装操作系统程序包 cvuqdisk。如果没有 cvuqdisk,集群验证实用程序就无法发现共享磁盘,当运行(手动运行或在 Oracle Grid Infrastructure 安装结束时自动运行)集群验证实用程序时,您会收到这样的错误消息:“Package cvuqdisk not installed”。使用适用于您的硬件体系结构(例如,x86_64 或 i386)的 cvuqdisk RPM。
cvuqdisk RPM 包含在 Oracle Grid Infrastructure 安装介质上的 rpm 目录中。对于本文,Oracle Grid Infrastructure 介质已由 grid 用户解压缩到 racnode1 节点的 /home/grid/software/oracle/grid 目录中。
要安装 cvuqdisk RPM,执行以下步骤:
- 找到 cvuqdisk RPM 程序包,位于 racnode1 节点中安装介质的 rpm 目录下:
[racnode1]: /home/grid/software/oracle/grid/rpm/cvuqdisk-1.0.7-1.rpm
- 以 grid 用户帐户将 cvuqdisk 程序包从 racnode1 复制到 racnode2:
[racnode2]: /home/grid/software/oracle/grid/rpm/cvuqdisk-1.0.7-1.rpm
- 以 root 用户身份分别登录到两个 Oracle RAC 节点:
[grid@racnode1 rpm]$ su [grid@racnode2 rpm]$ su
- 设置环境变量 CVUQDISK_GRP,使其指向作为 cvuqdisk 的所有者所在的组(本文为 oinstall):
[root@racnode1 rpm]# CVUQDISK_GRP=oinstall; export CVUQDISK_GRP [root@racnode2 rpm]# CVUQDISK_GRP=oinstall; export CVUQDISK_GRP
- 在保存 cvuqdisk RPM 的目录中,使用以下命令在两个 Oracle RAC 节点上安装 cvuqdisk 程序包:
[root@racnode1 rpm]# rpm -iv cvuqdisk-1.0.7-1.rpm Preparing packages for installation... cvuqdisk-1.0.7-1 [root@racnode2 rpm]# rpm -iv cvuqdisk-1.0.7-1.rpm Preparing packages for installation... cvuqdisk-1.0.7-1
使用 CVU 验证是否满足 Oracle 集群件要求(可选)
如本节前面所述,在运行 Oracle 安装程序之前不一定要运行集群验证实用程序。从 Oracle Clusterware 11g 第 2 版开始,Oracle Universal Installer (OUI) 会检测到不满足最低安装要求的情况,并创建 shell 脚本(称为修复脚本)以完成尚未完成的系统配置步骤。如果 OUI 发现未完成的任务,它会生成修复脚本 (runfixup.sh)。在 Oracle Grid Infrastructure 安装过程中,单击 Fix and Check Again Button 之后,可以运行修复脚本。
您也可以让 CVU 在安装之前生成修复脚本。
如果您决定亲自运行 CVU,请记住要作为 grid 用户在将要执行 Oracle 安装的节点 (racnode1) 上运行。此外,必须为 grid 用户配置通过用户等效性实现的 SSH 连通性。如果您打算使用 OUI 配置 SSH 连接,则 CVU 实用程序会失败,它没有机会执行其任何的关键检查并生成修复脚本:
Checking user equivalence...Check: User equivalence for user "grid"Node Name Comment ------------------------------------ ------------------------racnode2 failedracnode1 failed Result: PRVF-4007 : User equivalence check failed for user "grid"ERROR: User equivalence unavailable on all the specified nodes Verification cannot proceedPre-check for cluster services setup was unsuccessful on all the nodes.
在满足了运行 CVU 实用程序的所有前提条件后,可以在安装之前手动检查集群配置,并生成修复脚本以在开始安装前更改操作系统。
[grid@racnode1 ~]$ cd /home/grid/software/oracle/grid
[grid@racnode1 grid]$ ./runcluvfy.sh stage -pre crsinst -n racnode1,racnode2
-fixup -verbose
查看 CVU 报告。 在本文所述配置情况下,应该只发现如下的唯一一个错误:
Check: Membership of user "grid" in group "dba"Node Name User Exists Group Exists User in Group Comment---------------- ------------ ------------ ------------ ----------------racnode2 yes yes no failedracnode1 yes yes no failed
Result: Membership check for user "grid" in group "dba" failed
该检查失败的原因是,本指南通过 任务角色划分 配置创建了以角色分配的组和用户,而 CVU 不能正确识别这种配置。我们在创建任务角色划分操作系统权限组、用户和目录一节中讲述了如何创建任务角色划分配置。CVU 不能识别此类配置,因而假定 grid 用户始终是 dba 组的成员。可以放心地忽略这个失败的检查。CVU 执行的所有其他检查的结果报告应该为“passed”,之后才能继续进行 Oracle Grid Infrastructure 的安装。
使用 CVU 验证硬件和操作系统设置
接下来要运行的 CVU 检查将验证硬件和操作系统设置。同样,在 racnode1 节点上以具有用户等效性配置的 grid 用户帐户运行以下命令:
[grid@racnode1 ~]$ cd /home/grid/software/oracle/grid
[grid@racnode1 grid]$ ./runcluvfy.sh stage -post hwos -n racnode1,racnode2
-verbose
查看 CVU 报告。CVU 执行的所有其他检查的结果报告应该为“passed”,之后才能继续进行 Oracle Grid Infrastructure 的安装。
21. 为集群安装 Oracle Grid Infrastructure仅在集群的一个 Oracle RAC 节点 (racnode1) 上执行以下安装过程。Oracle Universal Installer 将把 Oracle Grid Infrastructure 软件(Oracle Clusterware 和自动存储管理)安装到集群中的两个 Oracle RAC 节点。
现在您已做好准备,可以开始安装环境的“网格”部分了,该部分包括 Oracle Clusterware 和自动存储管理。完成以下步骤,在集群中安装 Oracle Grid Infrastructure。
在安装过程中,如果您对安装程序要求您执行的操作不甚清楚,可随时单击 OUI 页面上的 Help 按钮。
典型安装与高级安装
从 11g 第 2 版开始,Oracle 提供了两个选项供您安装 Oracle Grid Infrastructure 软件:
- 典型安装
典型安装选项是简化的安装过程,只需进行最少的手动配置选择。这个新选项为用户(尤其是那些集群技术新手)提供了一个简化的集群安装过程。典型安装是让尽可能多的选项默认采用最佳实践的建议值。
- 高级安装
高级安装选项是一个高级过程,需要较高程度的系统知识。该安装选项使您可以进行特定的配置选择,包括额外的存储和网络选择、对基于角色的管理权限使用操作系统组身份验证、与 IPMI 集成,或使用细粒度指定自动存储管理角色。
由于本文将使用基于角色的管理权限和细粒度来指定自动存储管理角色,因此我们将使用“高级安装”选项。
配置 SCAN 而不使用 DNS
对于本文,尽管我说过将手动分配 IP 地址并使用 DNS 方法进行名称解析(这与 GNS 不同),实际上我不会在任何 DNS 服务器(或 GNS)中定义 SCAN。相反,我将只在每个 Oracle RAC 节点以及任何将连接到数据库集群的客户端的 hosts 文件 ( /etc/hosts) 中定义 SCAN 主机名和 IP 地址。尽管 Oracle 非常不鼓励这么做,并且强烈建议使用 GNS 或 DNS 解析方法,但我觉得对 DNS 的配置超出了本文的范围。本节将提供一种变通方法(这完全是一种非常规的方法),该方法使用 nslookup 二进制文件,用这种方法,在 Oracle Grid Infrastructure 的安装过程中能够成功地完成集群验证实用程序。请注意,本文所述的这个变通方法只为简便起见,不应认为其可用于生产环境。
只在 hosts 文件中而不在网格命名服务 (GNS) 或 DNS 中定义 SCAN 是一种无效配置,将导致 Oracle Grid Infrastructure 安装过程中运行的集群验证实用程序失败:
图 17:Oracle Grid Infrastructure/CVU 错误 —(配置 SCAN 而不使用 DNS)
INFO: Checking Single Client Access Name (SCAN)...
INFO: Checking name resolution setup for "racnode-cluster-scan"...
INFO: ERROR:
INFO: PRVF-4657 : Name resolution setup check for "racnode-cluster-scan" (IP address: 216.24.138.153) failed
INFO: ERROR:
INFO: PRVF-4657 : Name resolution setup check for "racnode-cluster-scan" (IP address: 192.168.1.187) failed
INFO: ERROR:
INFO: PRVF-4664 : Found inconsistent name resolution entries for SCAN name "racnode-cluster-scan"
INFO: Verification of SCAN VIP and Listener setup failed |
如果 CVU 只报告了此错误,可放心忽略此检查,单击 OUI 中的 [Next] 按钮继续进行 Oracle Grid Infrastructure 的安装。在文档 ID:887471.1(My Oracle Support 网站)中对此有记述。
如果您只在 hosts 文件中定义 SCAN 但却想让 CVU 成功完成,只需在两个 Oracle RAC 节点上以 root 身份对 nslookup 实用程序进行如下修改。
首先,在两个 Oracle RAC 节点上将原先的 nslookup 二进制文件重命名为 nslookup.original:
[root@racnode1 ~]# mv /usr/bin/nslookup /usr/bin/nslookup.original
然后,新建一个名为 /usr/bin/nslookup 的 shell 脚本,在该脚本中用 24.154.1.34 替换主 DNS,用 racnode-cluster-scan 替换 SCAN 主机名,用 192.168.1.187 替换 SCAN IP 地址,如下所示:
#!/bin/bashHOSTNAME=${1}if [[ $HOSTNAME = "racnode-cluster-scan" ]]; thenecho "Server: 24.154.1.34"echo "Address: 24.154.1.34#53"echo "Non-authoritative answer:"echo "Name: racnode-cluster-scan"echo "Address: 192.168.1.187"
else/usr/bin/nslookup.original $HOSTNAME
fi |
最后,将新建的 nslookup shell 脚本更改为可执行脚本:
[root@racnode1 ~]# chmod 755 /usr/bin/nslookup
记住要在两个 Oracle RAC 节点上执行这些操作。
每当 CVU 使用您的 SCAN 主机名调用 nslookup 脚本时,这个新的 nslookup shell 脚本只是回显您的 SCAN IP 地址,其他情况下则会调用原先的 nslookup 二进制文件。
现在,在 Oracle Grid Infrastructure 的安装过程中,当 CVU 尝试验证您的 SCAN 时,它就会成功通过:
[grid@racnode1 ~]$ cluvfy comp scan -verboseVerifying scanChecking Single Client Access Name (SCAN)...SCAN VIP name Node Running? ListenerName Port Running? ---------------- ------------ --------- ------------ ------ ----------racnode-cluster-scan racnode1 true LISTENER 1521 trueChecking name resolution setup for "racnode-cluster-scan"...SCAN Name IP Address Status Comment------------ ------------------------ ------------------------ ----------racnode-cluster-scan 192.168.1.187 passedVerification of SCAN VIP and Listener setup passedVerification of scan was successful.===============================================================================[grid@racnode2 ~]$ cluvfy comp scan -verboseVerifying scanChecking Single Client Access Name (SCAN)...SCAN VIP name Node Running? ListenerName Port Running?---------------- ------------ --------- ------------ ------ ----------racnode-cluster-scan racnode1 true LISTENER 1521 trueChecking name resolution setup for "racnode-cluster-scan"...SCAN Name IP Address Status Comment------------ ------------------------ ------------------------ ----------racnode-cluster-scan 192.168.1.187 passedVerification of SCAN VIP and Listener setup passedVerification of scan was successful. |
验证终端 Shell 环境
在启动 Oracle Universal Installer 之前,先以 Oracle Grid Infrastructure 软件所有者的身份(本文为 grid)登录到 racnode1。接下来,如果您使用远程客户端连接到将执行安装的 Oracle RAC 节点(从一个配置了 X 服务器的工作站通过 SSH 或 Telnet 连接到 racnode1),请根据使用 X 终端登录远程系统一节所述来验证您的 X11 显示服务器设置。
安装 Oracle Grid Infrastructure
以 grid 用户身份执行以下任务来安装 Oracle Grid Infrastructure:
[grid@racnode1 ~]$ id uid=1100(grid) gid=1000(oinstall)
groups=1000(oinstall),1200(asmadmin),1201(asmdba),1202(asmoper)[grid@racnode1 ~]$ DISPLAY=<your local workstation>:0.0
[grid@racnode1 ~]$ export DISPLAY[grid@racnode1 ~]$ cd /home/grid/software/oracle/grid
[grid@racnode1 grid]$ ./runInstaller
屏幕名称 | 响应 | 屏幕截图 | |||||||||
Select Installation Option | 选择 Install and Configure Grid Infrastructure for a Cluster | ||||||||||
Select Installation Type | 选择 Advanced Installation | ||||||||||
Select Product Languages | 为您的环境进行合适的选择。 | ||||||||||
Grid Plug and Play Information | 有关如何配置网格命名服务 (GNS) 的说明超出了本文的范围。取消选中“Configure GNS”选项。
单击 [Next] 之后,OUI 将尝试验证 SCAN 信息:
| ||||||||||
Cluster Node Information | 使用此屏幕将 racnode2 节点添加到集群中并配置 SSH 连接。 单击 Add 按钮,按下表添加 racnode2 及其虚拟 IP 名称 racnode2-vip:
接下来,单击 [SSH Connectivity] 按钮。输入 grid 用户的 OS Password,然后单击 [Setup] 按钮。这会启动 SSH Connectivity 配置过程:
SSH 配置过程成功完成后,确认该对话框。 单击 [Test] 按钮结束该屏幕并验证无口令的 SSH 连接。 | ||||||||||
Specify Network Interface Usage | 指定用于“Public”网络和“Private”网络的网络接口。进行所需更改以与下表中各值保持一致:
| ||||||||||
Storage Option Information | 选择 Automatic Storage Management (ASM)。 | ||||||||||
Create ASM Disk Group | 根据下表中的值创建一个 ASM 磁盘组,将用于保存 Oracle Clusterware 文件:
| ||||||||||
Specify ASM Password | 对于本文,我选择 Use same passwords for these accounts。 | ||||||||||
Failure Isolation Support | 配置 Intelligent Platform Management Interface (IPMI) 超出了本文的范围。选择 Do not use Intelligent Platform Management Interface (IPMI)。 | ||||||||||
Privileged Operating System Groups | 本文通过任务角色划分配置来使用基于角色的管理权限和细粒度来指定自动存储管理角色。 进行所需更改以与下表中各值保持一致:
| ||||||||||
Specify Installation Location | 为 Oracle Grid Infrastructure 安装设置 Oracle Base ( $ORACLE_BASE) 和 Software Location ( $ORACLE_HOME): Oracle Base: /u01/app/grid Software Location: /u01/app/11.2.0/grid | ||||||||||
Create Inventory | 由于这是该主机上的第一次安装,您需要创建 Oracle 清单目录。使用 OUI 提供的默认值: Inventory Directory: /u01/app/oraInventory oraInventory Group Name: oinstall | ||||||||||
Prerequisite Checks | 安装程序将执行一系列的检查以确定这两个 Oracle RAC 节点是否满足安装和配置 Oracle Clusterware 和自动存储管理软件的最低要求。 从 Oracle Clusterware 11g 第 2 版 (11.2) 开始,如果任何检查失败,安装程序 (OUI) 将创建 shell 脚本程序(称为修复脚本)以解决许多不满足系统配置要求之问题。如果 OUI 检测到标记为“fixable”的不满足要求之任务,您可通过单击 [Fix & Check Again] 按钮生成修复脚本来轻松解决这一问题。 修复脚本是在安装期间生成的。安装程序将提示您以 root 身份在一个单独的终端会话中运行该脚本。当您运行该脚本时,它会将内核值提高到所需最小值,如有必要,会完成其他操作系统配置任务。 如果通过了所有的必备条件检查(我的安装就是这样的情况),OUI 继续转到 Summary 屏幕。 | ||||||||||
Summary | 单击 [Finish] 开始安装。 | ||||||||||
Setup | 安装程序在两个 Oracle RAC 节点上执行 Oracle Grid Infrastructure 安装过程。 | ||||||||||
Execute Configuration scripts | 安装完成后,将提示您运行 /u01/app/oraInventory/orainstRoot.sh 和 /u01/app/11.2.0/grid/root.sh 脚本。以 root 用户帐户在集群的两个 Oracle RAC 节点(从执行安装的节点开始)上打开一个新的控制台窗口。 在 RAC 集群的两个节点上运行 orainstRoot.sh 脚本: [root@racnode1 ~]# /u01/app/oraInventory/orainstRoot.sh [root@racnode2 ~]# /u01/app/oraInventory/orainstRoot.sh 在集群中两个 Oracle RAC 节点(从执行安装的节点开始)上的同一个新控制台窗口中,仍以 root 用户帐户登录。在 RAC 集群中的两个节点上运行 root.sh 脚本(从执行安装的节点开始,每次一个)。 [root@racnode1 ~]# /u01/app/11.2.0/grid/root.sh [root@racnode2 ~]# /u01/app/11.2.0/grid/root.sh root.sh 脚本的运行可能需要几分钟。在最后一个节点上运行 root.sh 时,您将收到类似以下的输出,指示安装成功: 返回到 OUI,确认“Execute Configuration scripts”对话框窗口。 | ||||||||||
Configure Oracle Grid Infrastructure for a Cluster | 安装程序将运行 Oracle 网络服务 (NETCA)、自动存储管理 (ASMCA) 和 Oracle 专用互连 (VIPCA) 的配置助手。OUI 执行的最后一步是运行集群验证实用程序 (CVU)。如果配置助手和 CVU 运行成功,可单击 [Next] 然后单击 [Close] 退出 OUI。 如本节早前所述,如果只在 hosts 文件 ( /etc/hosts) 中配置 SCAN,而不在网格命名服务 (GNS) 中配置,也不使用 DNS 来手动配置,则该配置会被视为无效配置,这将导致集群验证实用程序失败。 如果 CVU 只报告了此错误,可放心忽略此检查并继续:单击 [Next] 按钮然后单击 [Close] 按钮退出 OUI。在文档 ID:887471.1(My Oracle Support 网站)中对此有记述。 如果您只在 hosts 文件中定义 SCAN 但却想让 CVU 成功完成,不要在 OUI 中单击 [Next] 按钮来绕过该错误。相反,要按照配置 SCAN 而不使用 DNS 一节中的说明来修改 nslookup 实用程序。在完成该节所述步骤后,返回到 OUI 中,单击 [Retry] 按钮。现在 CVU 会成功完成,不报告错误了。单击 [Next],然后单击 [Close] 退出 OUI。 | ||||||||||
Finish | 在安装结束时,单击 [Close] 按钮退出 OUI。 |
警告:安装完成后,不要在 Oracle Clusterware 还在运行时手动删除或通过运行相应 cron 作业来删除 /tmp/.oracle 或 /var/tmp/.oracle 或集群件的文件。如果删除这些文件,则 Oracle Clusterware 可能遭遇中断挂起,会出现错误 CRS-0184:Cannot communicate with the CRS daemon。
22. 集群的 Oracle Grid Infrastructure 的安装后任务
在集群中的两个 Oracle RAC 节点上执行以下安装后过程。
验证 Oracle Clusterware 安装
安装 Oracle Grid Infrastructure 后,可以运行几个测试来验证安装是否成功。以 grid 用户身份在 RAC 集群的两个节点上运行以下命令。
检查 CRS 状态
[grid@racnode1 ~]$ crsctl check crs CRS-4638: Oracle High Availability Services is online CRS-4537: Cluster Ready Services is online CRS-4529: Cluster Synchronization Services is online CRS-4533: Event Manager is online
检查 Clusterware 资源
注:在 Oracle Clusterware 11g 第 2 版 (11.2) 中不再使用 crs_stat 命令。
[grid@racnode1 ~]$ crs_stat -t -v Name Type R/RA F/FT Target State Host ---------------------------------------------------------------------- ora.CRS.dg ora....up.type 0/5 0/ ONLINE ONLINE racnode1 ora....ER.lsnr ora....er.type 0/5 0/ ONLINE ONLINE racnode1 ora....N1.lsnr ora....er.type 0/5 0/0 ONLINE ONLINE racnode1 ora.asm ora.asm.type 0/5 0/ ONLINE ONLINE racnode1 ora.eons ora.eons.type 0/3 0/ ONLINE ONLINE racnode1 ora.gsd ora.gsd.type 0/5 0/ OFFLINE OFFLINE ora....network ora....rk.type 0/5 0/ ONLINE ONLINE racnode1 ora.oc4j ora.oc4j.type 0/5 0/0 OFFLINE OFFLINE ora.ons ora.ons.type 0/3 0/ ONLINE ONLINE racnode1 ora....SM1.asm application 0/5 0/0 ONLINE ONLINE racnode1 ora....E1.lsnr application 0/5 0/0 ONLINE ONLINE racnode1 ora....de1.gsd application 0/5 0/0 OFFLINE OFFLINE ora....de1.ons application 0/3 0/0 ONLINE ONLINE racnode1 ora....de1.vip ora....t1.type 0/0 0/0 ONLINE ONLINE racnode1 ora....SM2.asm application 0/5 0/0 ONLINE ONLINE racnode2 ora....E2.lsnr application 0/5 0/0 ONLINE ONLINE racnode2 ora....de2.gsd application 0/5 0/0 OFFLINE OFFLINE ora....de2.ons application 0/3 0/0 ONLINE ONLINE racnode2 ora....de2.vip ora....t1.type 0/0 0/0 ONLINE ONLINE racnode2 ora....ry.acfs ora....fs.type 0/5 0/ ONLINE ONLINE racnode1 ora.scan1.vip ora....ip.type 0/0 0/0 ONLINE ONLINE racnode1
检查集群节点 [grid@racnode1 ~]$ olsnodes -n
racnode1 1
racnode2 2
检查两个节点上的 Oracle TNS 监听器进程 [grid@racnode1 ~]$ ps -ef | grep lsnr | grep -v 'grep' | grep -v 'ocfs' |
awk '{print $9}'
LISTENER_SCAN1 LISTENER
[grid@racnode2 ~]$ ps -ef | grep lsnr | grep -v 'grep' | grep -v 'ocfs' |
awk '{print $9}'
LISTENER
确认针对 Oracle Clusterware 文件的 Oracle ASM 功能如果在 Oracle ASM 上安装了 OCR 和表决磁盘文件,则以 Grid Infrastructure 安装所有者的身份,使用下面的命令语法来确认当前正在运行已安装的 Oracle ASM:
[grid@racnode1 ~]$ srvctl status asm -a ASM is running on racnode1,racnode2 ASM is enabled.
检查 Oracle 集群注册表 (OCR) [grid@racnode1 ~]$ ocrcheck
Status of Oracle Cluster Registry is as follows :Version : 3Total space (kbytes) : 262120 Used space (kbytes) : 2404 Available space (kbytes) : 259716 ID : 1259866904 Device/File Name : +CRS Device/File integrity check succeededDevice/File not configuredDevice/File not configuredDevice/File not configuredDevice/File not configuredCluster registry integrity check succeededLogical corruption check bypassed due to non-privileged user
检查表决磁盘 [grid@racnode1 ~]$ crsctl query css votedisk
## STATE File Universal Id File Name Disk group
-- ----- ----------------- --------- --------- 1. ONLINE 4cbbd0de4c694f50bfd3857ebd8ad8c4 (ORCL:CRSVOL1) [CRS]
Located 1 voting disk(s).
注:要管理 Oracle ASM 或 Oracle Net 11g 第 2 版 (11.2) 或更高安装版本,请使用集群的 Oracle Grid Infrastructure 主目录(网格主目录)中的 srvctl 程序。当我们安装 Oracle Real Application Clusters(Oracle 数据库软件)时,不能使用数据库主目录下的 srvctl 程序来管理 Oracle Grid Infrastructure 主目录中的 Oracle ASM 或 Oracle Net。
表决磁盘管理
在以前的版本中,我们强烈建议在安装 Oracle Clusterware 软件之后使用 dd 命令备份表决磁盘。在 Oracle Clusterware 11.2 以及更高版本中,不再支持使用 dd 命令来备份和恢复表决磁盘,因而再使用该命令来备份和恢复可能导致丢失表决磁盘数据。
在 Oracle Clusterware 11g 第 2 版中不再需要备份表决磁盘。当配置的任何部分发生更改时,会在 OCR 中自动备份表决磁盘数据,并将表决磁盘数据自动恢复到任何添加的表决磁盘中。
要了解更多有关管理表决磁盘、Oracle 集群注册表 (OCR) 和 Oracle 本地注册表 (OLR) 的信息,请参阅 Oracle Clusterware 管理和部署指南 11g 第 2 版 (11.2)。
备份 root.sh 脚本
Oracle 建议您在完成安装后备份 root.sh 脚本。如果您在同一 Oracle 主目录下安装其他产品,则安装程序在安装过程中会更新现有 root.sh 脚本的内容。如果您需要原先 root.sh 脚本中包含的信息,可通过 root.sh 文件副本进行恢复。
以 root 身份在两个 Oracle RAC 节点上备份 root.sh 文件:
[root@racnode1 ~]# cd /u01/app/11.2.0/grid
[root@racnode1 grid]# cp root.sh root.sh.racnode1.AFTER_INSTALL_NOV-20-2009 [root@racnode2 ~]# cd /u01/app/11.2.0/grid
[root@racnode2 grid]# cp root.sh root.sh.racnode2.AFTER_INSTALL_NOV-20-2009
安装集群运行状况管理软件(可选)
为了解决故障诊断方面的问题,如果您当前使用的是 Linux 内核 2.6.9 或更高版本,Oracle 建议您安装 Instantaneous Problem Detection OS Tool (IPD/OS)。编写本文时,我们使用的是 Oracle Enterprise Linux 5 Update 4,它使用 2.6.18 内核:
[root@racnode1 ~]# uname -a
Linux racnode1 2.6.18-164.el5 #1 SMP Thu Sep 3 04:15:13 EDT 2009
x86_64 x86_64 x86_64 GNU/Linux
如果当前使用的 Linux 内核是 2.6.9 之前的版本,则可使用 OS Watcher and RACDDT,该软件可从 My Oracle Support 网站(以前的 Metalink)获取。
IPD/OS 工具用于检测和分析有关操作系统和集群资源的性能降低和故障的状况。对于运行 Oracle Clusterware、Oracle ASM 和 Oracle RAC 的集群中出现的许多问题(如节点逐出),该工具可给出更好的解释。该工具不断跟踪每个节点、进程和设备级的操作系统资源消耗情况。它收集并分析整个集群的数据。在实时模式下,达到阈值后,会向操作者显示警报。为了进行根本原因分析,可以重放历史数据以了解故障当时所发生的情况。
有关安装和配置 IPD/OS 工具的说明超出了本文范围,在此不对其进行讨论。您可在以下 URL 下载 IPD/OS 工具及随附的详细安装配置指南:
http://www.oracle.com/technetwork/cn/database/database11g/ipd-download-homepage-087562-zhs.html
23. 为数据和快速恢复区创建 ASM 磁盘组
以 grid 用户身份仅在集群中的一个节点 (racnode1) 上运行 ASM Configuration Assistant (asmca) 以创建其他的 ASM 磁盘组,这些磁盘组将用于创建集群化数据库。
在安装 Oracle Grid Infrastructure 时,我们配置了一个名为 +CRS 的 ASM 磁盘组,用于存储 Oracle Clusterware 文件(OCR 和表决磁盘)。
在本节中,我们将使用 ASM Configuration Assistant ( asmca) 再创建两个 ASM 磁盘组。稍后本指南在创建集群化数据库时将使用这些新的 ASM 磁盘组。
第一个 ASM 磁盘组将命名为 +RACDB_DATA,用于存储所有 Oracle 物理数据库文件(数据、联机重做日志、控制文件、存档重做日志)。另一个 ASM 磁盘组将用于名为 +FRA 的快速恢复区。
验证终端 Shell 环境
启动 ASM Configuration Assistant 之前,先作为 Oracle Grid Infrastructure 软件的所有者(本文为 grid)登录到 racnode1。接下来,如果您使用远程客户端连接到将执行安装的 Oracle RAC 节点(从一个配置了 X 服务器的工作站通过 SSH 或 Telnet 连接到 racnode1),请根据使用 X 终端登录远程系统一节所述来验证您的 X11 显示服务器设置。
使用 ASMCA 创建其他 ASM 磁盘组
以 grid 用户身份执行以下任务来创建另外两个 ASM 磁盘组:
[grid@racnode1 ~]$ asmca &
屏幕名称 | 响应 | 屏幕截图 |
Disk Groups | 在 Disk Groups 选项卡中,单击 Create 按钮。 | |
Create Disk Group | Create Disk Group 对话框应显示我们在本指南前面创建的两个 ASMLib 卷。 如果我们在本文前面创建的 ASMLib 卷在 Select Member Disks 窗口中不作为 eligible 而显示(ORCL:DATAVOL1 和 ORCL:FRAVOL1),则单击 Change Disk Discovery Path 按钮并输入 ORCL:*。 当创建“数据”ASM 磁盘组时,对于 Disk Group Name 使用 RACDB_DATA。在 Redundancy 部分,选择 External (none)。最后,在 Select Member Disks 部分,选中 ASMLib 卷 ORCL:DATAVOL1。 在确认此对话框中所有值均正确后,单击 [OK] 按钮。 | |
Disk Groups | 创建了第一个 ASM 磁盘后,将返回到最初的对话框。再次单击 Create 按钮,创建第二个 ASM 磁盘组。 | |
Create Disk Group | Create Disk Group 现在应显示剩下的最后一个 ASMLib 卷。 当创建“快速恢复区”磁盘组时,对于 Disk Group Name 使用 FRA。在 Redundancy 部分,选择 External (none)。最后,在 Select Member Disks 部分,选中 ASMLib 卷 ORCL:FRAVOL1。 在确认此对话框中所有值均正确后,单击 [OK] 按钮。 | |
Disk Groups | 单击 [Exit] 按钮退出 ASM Configuration Assistant。 |
24. 在 Oracle Real Application Clusters 中安装 Oracle Database 11g
仅在集群中的一个 Oracle RAC 节点 (racnode1) 上执行以下 Oracle Database 软件安装过程!Oracle Universal Installer 会通过 SSH 将 Oracle Database 软件安装到集群中的两个 Oracle RAC 节点。
现在 Grid Infrastructure 软件已可以使用,您可以在集群中的一个节点 ( racnode1) 上以 oracle 用户身份安装 Oracle Database 软件。在安装过程中,OUI 会将二进制文件从此节点复制集群中的所有其他节点上。
就本指南而言,我们在安装 Oracle Database 软件时将不使用“Create Database”选项。在本指南稍后,我们将在完成所有安装任务之后使用 Database Configuration Assistant (DBCA) 创建集群化数据库。
验证终端 Shell 环境
在启动 Oracle Universal Installer (OUI) 之前,先以 Oracle Database 软件所有者的身份(本文为 oracle)登录到 racnode1。接下来,如果您使用远程客户端连接到将执行安装的 Oracle RAC 节点(从一个配置了 X 服务器的工作站通过 SSH 或 Telnet 连接到 racnode1),请根据使用 X 终端登录远程系统一节所述来验证您的 X11 显示服务器设置。
安装 Oracle Database 11g 第 2 版软件
以 oracle 用户身份执行以下任务以安装 Oracle Database 软件:
[oracle@racnode1 ~]$ id uid=1101(oracle)
gid=1000(oinstall)
groups=1000(oinstall),1201(asmdba),1300(dba),1301(oper)[oracle@racnode1 ~]$ DISPLAY=<your local workstation>:0.0
[oracle@racnode1 ~]$ export DISPLAY [oracle@racnode1 ~]$ cd /home/oracle/software/oracle/database
[oracle@racnode1 database]$ ./runInstaller
屏幕名称 | 响应 | 屏幕截图 |
Configure Security Updates | 就本文而言,取消选中安全更新复选框,然后单击 [Next] 按钮继续。出现警告对话框时(该对话框指示您尚未提供电子邮件地址),单击 [Yes] 按钮确认。 | |
Installation Option | 选择 Install database software only。 | |
Grid Options | 选择 Real Application Clusters database installation 单选按钮(此为默认选择),确保选中 Node Name 窗口中的两个 Oracle RAC 节点。 接下来,单击 [SSH Connectivity] 按钮。输入 oracle 用户的 OS Password,然后单击 [Setup] 按钮。这会启动 SSH Connectivity 配置过程:
SSH 配置过程成功完成后,确认该对话框。 单击 [Test] 按钮结束该屏幕并验证无口令的 SSH 连接。 | |
Product Languages | 为您的环境进行合适的选择。 | |
Database Edition | 选择 Enterprise Edition。 | |
Installation Location | 指定 Oracle 基目录和软件位置 (Oracle_home),如下所示: Oracle Base:/u01/app/oracle Software Location:/u01/app/oracle/product/11.2.0/dbhome_1 | |
Operating System Groups | 分别为 SYSDBA 和 SYSOPER 权限选择操作系统组: Database Administrator (OSDBA) Group: dba Database Operator (OSOPER) Group: oper | |
Prerequisite Checks | 安装程序将执行一系列的检查以确定两个 Oracle RAC 节点是否满足安装和配置 Oracle Database 软件的最低要求。 从 11g 第 2 版 (11.2) 开始,如果任何检查失败,安装程序 (OUI) 将创建 shell 脚本程序(称为修复脚本)以解决许多不满足系统配置要求的问题。如果 OUI 检测到标记为“fixable”的不满足要求之任务,您可通过单击 [Fix & Check Again] 按钮生成修复脚本来轻松解决这一问题。 修复脚本是在安装期间生成的。安装程序将提示您以 root 身份在一个单独的终端会话中运行该脚本。当您运行该脚本时,它会将内核值提高到所需最小值,如有必要,会完成其他操作系统配置任务。 如果通过了所有的必备条件检查(我的安装就是这样的情况),OUI 继续转到 Summary 屏幕。 | |
Summary | 单击 [Finish] 开始安装。 | |
Install Product | 安装程序在两个 Oracle RAC 节点上执行 Oracle Database 软件安装过程。 | |
Execute Configuration scripts | 安装完成后,将提示您在两个 Oracle RAC 节点上运行 /u01/app/oracle/product/11.2.0/dbhome_1/root.sh 脚本。以 root 用户帐户在集群的两个 Oracle RAC 节点(从执行安装的节点开始)上打开一个新的控制台窗口。 在 RAC 集群的所有节点上运行 root.sh 脚本。 [root@racnode1 ~]# /u01/app/oracle/product/11.2.0/dbhome_1/root.sh [root@racnode2 ~]# /u01/app/oracle/product/11.2.0/dbhome_1/root.sh 返回到 OUI,确认“Execute Configuration scripts”对话框窗口。 | |
Finish | 在安装结束时,单击 [Close] 按钮退出 OUI。 |
25. 安装 Oracle Database 11g Examples(以前的随附 CD)
仅在集群中的一个 Oracle RAC 节点 (racnode1) 上执行以下 Oracle Database 11g Examples 软件安装过程!Oracle Universal Installer 会通过 SSH 将 Oracle Database Examples 软件安装到集群中的两个 Oracle RAC 节点。
至此已安装了 Oracle Database 11g 软件,您可以选择安装 Oracle Database 11g Examples。和 Oracle Database 软件的安装一样,以 oracle 用户身份只在集群的一个节点 ( racnode1) 上安装 Examples 软件。在安装过程中,OUI 会将二进制文件从此节点复制集群中的所有其他节点上。
验证终端 Shell 环境
在启动 Oracle Universal Installer (OUI) 之前,先以 Oracle Database 软件所有者的身份(本文为 oracle)登录到 racnode1。接下来,如果您使用远程客户端连接到将执行安装的 Oracle RAC 节点(从一个配置了 X 服务器的工作站通过 SSH 或 Telnet 连接到 racnode1),请根据使用 X 终端登录远程系统一节所述来验证您的 X11 显示服务器设置。
安装 Oracle Database 11g 第 2 版 Examples
以 oracle 用户身份执行以下任务以安装 Oracle Database Examples:
[oracle@racnode1 ~]$ cd /home/oracle/software/oracle/examples
[oracle@racnode1 examples]$ ./runInstaller
屏幕名称 | 响应 | 屏幕截图 |
Installation Location | 指定 Oracle 基目录和软件位置 (Oracle_home),如下所示: Oracle Base:/u01/app/oracle Software Location:/u01/app/oracle/product/11.2.0/dbhome_1 | |
Prerequisite Checks | 安装程序将执行一系列的检查以确定两个 Oracle RAC 节点是否满足安装和配置 Oracle Database Examples 软件的最低要求。 从 11g 第 2 版 (11.2) 开始,如果任何检查失败,安装程序 (OUI) 将创建 shell 脚本程序(称为修复脚本)以解决许多不满足系统配置要求的问题。如果 OUI 检测到标记为“fixable”的不满足要求之任务,您可通过单击 [Fix & Check Again] 按钮生成修复脚本来轻松解决这一问题。 修复脚本是在安装期间生成的。安装程序将提示您以 root 身份在一个单独的终端会话中运行该脚本。当您运行该脚本时,它会将内核值提高到所需最小值,如有必要,会完成其他操作系统配置任务。 如果通过了所有的必备条件检查(我的安装就是这样的情况),OUI 继续转到 Summary 屏幕。 | |
Summary | 单击 [Finish] 开始安装。 | |
Install Product | 安装程序在两个 Oracle RAC 节点上执行 Oracle Database Examples 软件安装过程。 | |
Finish | 在安装结束时,单击 [Close] 按钮退出 OUI。 |
26. 创建 Oracle 集群数据库
仅应在集群的一个 Oracle RAC 节点 (racnode1) 上执行数据库创建过程。
我们将使用 Oracle Database Configuration Assistant (DBCA) 创建集群化数据库。
在执行 DBCA 前,确保为 $ORACLE_BASE/product/11.2.0/dbhome_1 环境正确设置了 $ORACLE_HOME 和 $PATH 环境变量。第 13 节中讲述了如何在 oracle 用户帐户的登录脚本中设置环境变量。
在开始创建集群化数据库之前,还应确保现已安装的所有服务(Oracle TNS 监听器、Oracle Clusterware 进程等)正在运行。
[oracle@racnode1 ~]$ su - grid -c "crs_stat -t -v"
Password: *********
Name Type R/RA F/FT Target State Host
----------------------------------------------------------------------
ora.CRS.dg ora....up.type 0/5 0/ ONLINE ONLINE racnode1
ora.FRA.dg ora....up.type 0/5 0/ ONLINE ONLINE racnode1
ora....ER.lsnr ora....er.type 0/5 0/ ONLINE ONLINE racnode1
ora....N1.lsnr ora....er.type 0/5 0/0 ONLINE ONLINE racnode1
ora....DATA.dg ora....up.type 0/5 0/ ONLINE ONLINE racnode1
ora.asm ora.asm.type 0/5 0/ ONLINE ONLINE racnode1
ora.eons ora.eons.type 0/3 0/ ONLINE ONLINE racnode1
ora.gsd ora.gsd.type 0/5 0/ OFFLINE OFFLINE
ora....network ora....rk.type 0/5 0/ ONLINE ONLINE racnode1
ora.oc4j ora.oc4j.type 0/5 0/0 OFFLINE OFFLINE
ora.ons ora.ons.type 0/3 0/ ONLINE ONLINE racnode1
ora....SM1.asm application 0/5 0/0 ONLINE ONLINE racnode1
ora....E1.lsnr application 0/5 0/0 ONLINE ONLINE racnode1
ora....de1.gsd application 0/5 0/0 OFFLINE OFFLINE
ora....de1.ons application 0/3 0/0 ONLINE ONLINE racnode1
ora....de1.vip ora....t1.type 0/0 0/0 ONLINE ONLINE racnode1
ora....SM2.asm application 0/5 0/0 ONLINE ONLINE racnode2
ora....E2.lsnr application 0/5 0/0 ONLINE ONLINE racnode2
ora....de2.gsd application 0/5 0/0 OFFLINE OFFLINE
ora....de2.ons application 0/3 0/0 ONLINE ONLINE racnode2
ora....de2.vip ora....t1.type 0/0 0/0 ONLINE ONLINE racnode2
ora....ry.acfs ora....fs.type 0/5 0/ ONLINE ONLINE racnode1
ora.scan1.vip ora....ip.type 0/0 0/0 ONLINE ONLINE racnode1
验证终端 Shell 环境
在启动 Database Configuration Assistant (DBCA) 之前,先以 Oracle Database 软件所有者的身份(本文为 oracle)登录到 racnode1。接下来,如果您使用远程客户端连接到将执行安装的 Oracle RAC 节点(从一个配置了 X 服务器的工作站通过 SSH 或 Telnet 连接到 racnode1),请根据使用 X 终端登录远程系统一节所述来验证您的 X11 显示服务器设置。
创建集群化数据库
要开始数据库创建过程,以 oracle 用户身份运行以下命令:
[oracle@racnode1 ~]$ dbca &
屏幕名称 | 响应 | 屏幕截图 |
Welcome 屏幕 | 选择 Oracle Real Application Clusters database。 | |
Operations | 选择 Create a Database。 | |
Database Templates | 选择 Custom Database。 | |
Database Identification | 集群数据库配置。 Configuration Type: Admin-Managed 数据库命名。 Global Database Name: racdb.idevelopment.info SID Prefix: racdb 注:对于数据库域,我使用了 idevelopment.info。您可以使用任何数据库域请记住,此域不必为有效的 DNS 域。 节点选择。 | |
Management Options | 保留默认选项 Configure Enterprise Manager / Configure Database Control for local management。 | |
Database Credentials | 我选择了 Use the Same Administrative Password for All Accounts。输入口令(两次)并确保此口令不是以数字开头。 | |
Database File Locations | 指定数据库文件的存储类型和存储位置。 Storage Type: Automatic Storage Management (ASM) Storage Locations: Use Oracle-Managed Files Database Area: +RACDB_DATA | |
Specify ASMSNMP Password | 指定 ASM 实例的 ASMSNMP 口令。 | |
Recovery Configuration | 选中 Specify Flash Recovery Area 选项。 对于 Fast Recovery Area,单击 [Browse] 按钮并选择磁盘组名 +FRA。 我使用的磁盘组大小约为 33GB。定义快速恢复区大小时,用整个卷的大小减去其 10%(用于开销)— (33-10%=30 GB)。我使用了 30 GB ( 30413 MB) 的 Fast Recovery Area Size。 | |
Database Content | 我对所有数据库组件(和目标表空间)保留其默认设置,但选择 Sample Schemas 也完全可以。自从我们安装了 Oracle Database 11g Examples,就可以使用该选项了。 | |
Initialization Parameters | 根据您的环境更改任意参数。我保留了所有这些参数的默认设置。 | |
Database Storage | 根据您的环境更改任意参数。我保留了所有这些参数的默认设置。 | |
Creation Options | 保留默认选项 Create Database。我还始终选择 Generate Database Creation Scripts。单击 Finish 启动数据库创建过程。确认数据库创建报告和脚本生成对话框后,开始创建数据库。 在“Summary”屏幕上单击 OK。 | |
End of Database Creation | 在数据库创建结束时,退出 DBCA。 |
完成 DBCA 后,您就启动了一个功能完善的 Oracle RAC 集群!
验证集群化数据库已开启
[oracle@racnode1 ~]$ su - grid -c "crsctl status resource -w
\"TYPE co 'ora'\" -t"
Password: *********
--------------------------------------------------------------------------------
NAME TARGET STATE SERVER STATE_DETAILS
--------------------------------------------------------------------------------
Local Resources
--------------------------------------------------------------------------------
ora.CRS.dg ONLINE ONLINE racnode1 ONLINE ONLINE racnode2
ora.FRA.dg ONLINE ONLINE racnode1 ONLINE ONLINE racnode2
ora.LISTENER.lsnr ONLINE ONLINE racnode1 ONLINE ONLINE racnode2
ora.RACDB_DATA.dg ONLINE ONLINE racnode1 ONLINE ONLINE racnode2
ora.asm ONLINE ONLINE racnode1 Started ONLINE ONLINE racnode2 Started
ora.eons ONLINE ONLINE racnode1 ONLINE ONLINE racnode2
ora.gsd OFFLINE OFFLINE racnode1 OFFLINE OFFLINE racnode2
ora.net1.network ONLINE ONLINE racnode1 ONLINE ONLINE racnode2
ora.ons ONLINE ONLINE racnode1 ONLINE ONLINE racnode2
ora.registry.acfs ONLINE ONLINE racnode1 ONLINE ONLINE racnode2
--------------------------------------------------------------------------------
Cluster Resources
--------------------------------------------------------------------------------
ora.LISTENER_SCAN1.lsnr1 ONLINE ONLINE racnode1
ora.oc4j1 OFFLINE OFFLINE
ora.racdb.db1 ONLINE ONLINE racnode1 Open 2 ONLINE ONLINE racnode2 Open
ora.racnode1.vip1 ONLINE ONLINE racnode1
ora.racnode2.vip1 ONLINE ONLINE racnode2
ora.scan1.vip1 ONLINE ONLINE racnode1
Oracle Enterprise Manager
如果您配置了 Oracle Enterprise Manager (Database Control),可以用它查看数据库的配置和当前状态。
本示例的 URL 为:https://racnode1:1158/em
[oracle@racnode1 ~]$ emctl status dbconsole
Oracle Enterprise Manager 11g Database Control Release 11.2.0.1.0
Copyright (c) 1996, 2009 Oracle Corporation. All rights reserved.
https://racnode1:1158/em/console/aboutApplication
Oracle Enterprise Manager 11g is running.
------------------------------------------------------------------
Logs are generated in directory
/u01/app/oracle/product/11.2.0/dbhome_1/racnode1_racdb/sysman/log
图 18:Oracle Enterprise Manager —(数据库控制台)
27. 数据库创建后任务(可选)
为了增强可用性和数据库管理,本节提供几个可在新的 Oracle 11g 上执行的可选任务。
重新编译无效对象
运行 utlrp.sql 脚本立即重新编译所有无效的 PL/SQL 程序包,而不是在首次访问它们时再重新编译。这是个可选步骤,但建议您选择该步骤。
[oracle@racnode1 ~]$ sqlplus / as sysdba
SQL> @?/rdbms/admin/utlrp.sql
在 RAC 环境中启用存档日志
无论是单个实例还是集群化数据库,Oracle 都会跟踪对数据库块的所有更改并记录到联机重做日志文件 中。在 Oracle RAC 环境中,每个实例将具有自己的联机重做日志文件集,称为线程。每个 Oracle 实例将以循环方式使用其联机重做日志组。一个联机重做日志填满之后,Oracle 将转至下一个联机重做日志。如果数据库处于“存档日志模式”,Oracle 将创建该联机重做日志的一个副本,然后再对其进行重用。一个线程至少必须包含两个联机重做日志(或联机重做日志组)。对于单个实例的配置也同样如此。单个实例至少必须包含两个联机重做日志(或联机重做日志组)。
联机重做日志文件的大小完全独立于另一个实例的重做日志大小。尽管在大多数配置中该大小是相同的,但是该大小可能会随每个节点的负载和备份/恢复注意事项而异。还值得一提的是,每个实例都具有对自己的联机重做日志文件的独占式写访问权限。但是在正确配置的 RAC 环境中,如果某个实例异常中断,每个实例都可以读取该实例的当前联机重做日志文件以执行实例恢复。因此,需要将联机重做日志置于一个共享存储设备上(就像数据库文件一样)。
如上文所述,Oracle 以循环方式写入其联机重做日志文件。当前的联机重做日志填满之后,Oracle 将转至下一个联机重做日志。为方便进行介质恢复,Oracle 允许 DBA 将数据库置于“存档日志模式”,以在联机重做日志填满后(并且得到重用之前)创建它的副本。该过程称为存档。
利用 Database Configuration Assistant (DBCA),用户可以将一个新数据库配置为存档日志模式,但是大多数 DBA 在最初创建数据库期间选择跳过该选项。在这种情况下,数据库没有处于存档日志模式,只需将数据库置于存档日志模式。但是请注意,这将需要短暂的数据库中断。在 Oracle RAC 配置的一个节点上,执行以下任务将支持 RAC 的数据库置于存档日志模式。在本文中,我将使用运行 racdb1 实例的 racnode1 节点:
- 以 oracle 用户身份登录到一个节点(即 racnode1),通过在当前实例中将 cluster_database 设置为 FALSE 来禁用集群实例参数:
[oracle@racnode1 ~]$ sqlplus / as sysdba SQL> alter system set cluster_database=false scope=spfile sid='racdb1'; System altered.
- 以 oracle 用户身份关闭所有 访问集群化数据库的实例:
[oracle@racnode1 ~]$ srvctl stop database -d racdb
- 使用本地实例,挂载 数据库:
[oracle@racnode1 ~]$ sqlplus / as sysdba SQL*Plus: Release 11.2.0.1.0 Production on Sat Nov 21 19:26:47 2009 Copyright (c) 1982, 2009, Oracle. All rights reserved. Connected to an idle instance. SQL> startup mount ORACLE instance started. Total System Global Area 1653518336 bytes Fixed Size 2213896 bytes Variable Size 1073743864 bytes Database Buffers 570425344 bytes Redo Buffers 7135232 bytes
- 启用存档功能:
SQL> alter database archivelog; Database altered.
- 通过在当前实例中将实例参数 cluster_database 修改为 TRUE,重新启用对集群的支持:
SQL> alter system set cluster_database=true scope=spfile sid='racdb1'; System altered.
- 关闭本地实例:
SQL> shutdown immediate ORA-01109: database not open Database dismounted. ORACLE instance shut down.
- 以 oracle 帐户身份使用 srvctl 命令重启所有实例:
[oracle@racnode1 ~]$ srvctl start database -d racdb
- 登录到本地实例,验证存档日志模式已启用:
[oracle@racnode1 ~]$ sqlplus / as sysdba SQL*Plus: Release 11.2.0.1.0 Production on Sat Nov 21 19:33:38 2009 Copyright (c) 1982, 2009, Oracle. All rights reserved. Connected to: Oracle Database 11g Enterprise Edition Release 11.2.0.1.0 - 64bit Production With the Partitioning, Real Application Clusters, Automatic Storage Management, OLAP, Data Mining and Real Application Testing options SQL> archive log list Database log mode Archive Mode Automatic archival Enabled Archive destination USE_DB_RECOVERY_FILE_DEST Oldest online log sequence 69 Next log sequence to archive 70 Current log sequence 70
启用存档日志模式后,RAC 配置中的每个实例都可以自动存档重做日志!
下载并安装自定义 Oracle 数据库脚本
DBA 依赖 Oracle 的数据字典视图和动态性能视图以支持并更好地管理他们的数据库。尽管这些视图提供一个简单方便的机制来查询有关数据库的重要信息,但是拥有一个用于查询这些视图的准确、随时可用的 SQL 脚本集合是有帮助的。
在本节中,您将下载并安装 Oracle DBA 脚本集合,用于管理数据库的多个方面,包括空间管理、性能、备份、安全性和会话管理。可以使用以下链接 http://www.idevelopment.info/data/Oracle/DBA_scripts/common.zip 下载 Oracle DBA 脚本存档。使用 oracle 用户帐户将 common.zip 存档下载到集群中每个节点的 $ORACLE_BASE 目录。对于本文,将 common.zip 存档复制到 /u01/app/oracle。接下来,将存档文件解压缩到 $ORACLE_BASE 目录。
例如,使用 oracle 用户帐户在 Oracle RAC 集群中的每个节点上执行以下命令:
[oracle@racnode1 ~]$ mv common.zip /u01/app/oracle
[oracle@racnode1 ~]$ cd /u01/app/oracle
[oracle@racnode1 ~]$ unzip common.zip
最后一步是验证(或设置)当前 UNIX shell 相应的环境变量,以确保在任何目录中都可以从 SQL*Plus 内运行 Oracle SQL 脚本。对于 UNIX,验证以下环境变量已设置并包含在您的登录 shell 脚本中:
ORACLE_PATH=$ORACLE_BASE/common/oracle/sql:.:$ORACLE_HOME/rdbms/admin
export ORACLE_PATH
注:ORACLE_PATH 环境变量应该已在 .bash_profile 登录脚本中设置,该登录脚本是在为 oracle 用户帐户创建登录脚本一节中创建的。
既然 Oracle DBA 脚本已解压缩并且 UNIX 环境变量 ( $ORACLE_PATH) 已设置为相应的目录,现在您登录到 SQL*Plus 后应该能够运行 $ORACLE_BASE/common/oracle/sql 中的任何 SQL 脚本。例如,要在以 DBA 用户身份登录到 Oracle 数据库后查询表空间信息,使用以下命令:
SQL> @dba_tablespacesStatus Tablespace TS Type Ext. Seg. Tablespace Used Pct.Name Mgt. Mgt. Size (in bytes) Used
------- ----------- ------------ ------ ------- ------------- ------------ -----
ONLINE SYSAUX PERMANENT LOCAL AUTO 629,145,600 511,967,232 81
ONLINE UNDOTBS1 UNDO LOCAL MANUAL 1,059,061,760 948,043,776 90
ONLINE USERS PERMANENT LOCAL AUTO 5,242,880 1,048,576 20
ONLINE SYSTEM PERMANENT LOCAL MANUAL 734,003,200 703,135,744 96
ONLINE EXAMPLE PERMANENT LOCAL AUTO 157,286,400 85,131,264 54
ONLINE UNDOTBS2 UNDO LOCAL MANUAL 209,715,200 20,840,448 10
ONLINE TEMP TEMPORARY LOCAL MANUAL 75,497,472 66,060,288 88---------------- ---------------- ----
avg 63
sum 2,869,952,512 2,336,227,3287 rows selected.
要在登录到 SQL*Plus 后获得所有可用 Oracle DBA 脚本的列表,运行 help.sql 脚本:
SQL> @help.sql ========================================
Automatic Shared Memory Management
========================================
asmm_components.sql ========================================
Automatic Storage Management
========================================
asm_alias.sql
asm_clients.sql
asm_diskgroups.sql
asm_disks.sql
asm_disks_perf.sql
asm_drop_files.sql
asm_files.sql
asm_files2.sql
asm_templates.sql < --- SNIP --- > perf_top_sql_by_buffer_gets.sql
perf_top_sql_by_disk_reads.sql ========================================
Workspace Manager
========================================
wm_create_workspace.sql
wm_disable_versioning.sql
wm_enable_versioning.sql
wm_freeze_workspace.sql
wm_get_workspace.sql
wm_goto_workspace.sql
wm_merge_workspace.sql
wm_refresh_workspace.sql
wm_remove_workspace.sql
wm_unfreeze_workspace.sql
wm_workspaces.sql
28. 创建/更改表空间
创建集群化数据库时,我们保留了所有表空间的默认大小设置。如果您将一个大型驱动器用作共享存储,则可能想创建一个大小可以调整的测试数据库。
以下是几个可为测试数据库修改和创建所有表空间的可选的 SQL 命令。请记住,此示例中使用的数据库文件名称(OMF 文件)可能与 Oracle Database Configuration Assistant (DBCA) 为您的环境创建的数据库文件名称不同。完成本节后,在适合的地方替换在您的环境中创建的数据文件名。可以使用以下查询确定环境中的文件名:
SQL> select tablespace_name, file_name2 from dba_data_files3 union4 select tablespace_name, file_name5 from dba_temp_files; TABLESPACE_NAME FILE_NAME
--------------- --------------------------------------------------
EXAMPLE +RACDB_DATA/racdb/datafile/example.263.703530435
SYSAUX +RACDB_DATA/racdb/datafile/sysaux.260.703530411
SYSTEM +RACDB_DATA/racdb/datafile/system.259.703530397
TEMP +RACDB_DATA/racdb/tempfile/temp.262.703530429
UNDOTBS1 +RACDB_DATA/racdb/datafile/undotbs1.261.703530423
UNDOTBS2 +RACDB_DATA/racdb/datafile/undotbs2.264.703530441
USERS +RACDB_DATA/racdb/datafile/users.265.703530447 7 rows selected.
[oracle@racnode1 ~]$ sqlplus "/ as sysdba"
SQL> create user scott identified by tiger default tablespace users;
User created.
SQL> grant dba, resource, connect to scott;
Grant succeeded.
SQL> alter database datafile '+RACDB_DATA/racdb/datafile/users.265.703530447'
resize 1024m;
Database altered.
SQL> alter tablespace users add datafile '+RACDB_DATA' size 1024m autoextend off;
Tablespace altered.
SQL> create tablespace indx datafile '+RACDB_DATA' size 1024m2 autoextend on next 100m maxsize unlimited3 extent management local autoallocate4 segment space management auto;
Tablespace created.
SQL> alter database datafile '+RACDB_DATA/racdb/datafile/system.259.703530397'
resize 1024m;
Database altered.
SQL> alter database datafile '+RACDB_DATA/racdb/datafile/sysaux.260.703530411'
resize 1024m;
Database altered.
SQL> alter database datafile '+RACDB_DATA/racdb/datafile/undotbs1.261.703530423'
resize 1024m;
Database altered.
SQL> alter database datafile '+RACDB_DATA/racdb/datafile/undotbs2.264.703530441'
resize 1024m;
Database altered.
SQL> alter database tempfile '+RACDB_DATA/racdb/tempfile/temp.262.703530429'
resize 1024m;
Database altered.
以下是我为我的测试数据库环境定义的表空间快照:
Status Tablespace TS Type Ext. Seg. Tablespace Used Pct.Name Mgt. Mgt. Size (in bytes) Used
------- ----------- ------------ ------ ------- ------------- ------------ -----
ONLINE SYSAUX PERMANENT LOCAL AUTO 1,073,741,824 512,098,304 48
ONLINE UNDOTBS1 UNDO LOCAL MANUAL 1,073,741,824 948,043,776 88
ONLINE USERS PERMANENT LOCAL AUTO 2,147,483,648 2,097,152 0
ONLINE SYSTEM PERMANENT LOCAL MANUAL 1,073,741,824 703,201,280 65
ONLINE EXAMPLE PERMANENT LOCAL AUTO 157,286,400 85,131,264 54
ONLINE INDX PERMANENT LOCAL AUTO 1,073,741,824 1,048,576 0
ONLINE UNDOTBS2 UNDO LOCAL MANUAL 1,073,741,824 20,840,448 2
ONLINE TEMP TEMPORARY LOCAL MANUAL 1,073,741,824 66,060,288 6---------------- ---------------- ---------
avg 33
sum 8,747,220,992 2,338,521,0888 rows selected.
29. 验证 Oracle Grid Infrastructure 和数据库配置
可以在集群中的任意 Oracle RAC 节点上执行以下 Oracle Clusterware 和 Oracle RAC 验证检查。就本文而言,我将以 oracle 操作系统用户身份只从 racnode1 节点执行这些检查。
本节所述大多数检查使用服务器控制实用程序 (SRVCTL) 来进行,并且这些检查可以作为 oracle 或 grid 操作系统用户来执行。为 SRVCTL 定义的节点级任务有五个:
- 添加和删除节点级应用程序
- 设置和取消设置节点级应用程序的环境
- 管理节点应用程序
- 管理 ASM 实例
- 启动和停止一组包括虚拟 IP 地址、监听器、Oracle 通知服务和 Oracle Enterprise Manager 代理在内的程序(出于维护目的)。
Oracle 还提供了 Oracle 集群件控制 (CRSCTL) 实用程序。CRSCTL 是用户与 Oracle Clusterware 之间的接口,用于解析和调用 Oracle Clusterware 对象的 Oracle Clusterware API。
Oracle Clusterware 11g 第 2 版 (11.2) 引进了可识别集群的 命令,可用来对集群执行检查、启动和停止操作。根据所进行的操作,您可以从集群中的任意节点对集群中的另一节点或所有节点运行这些命令。
可以使用 CRSCTL 命令对 Oracle Clusterware 执行如下几个操作:
- 启动和停止 Oracle Clusterware 资源
- 启用和禁用 Oracle Clusterware 后台程序
- 检查集群的运行状况
- 管理代表第三方应用程序的资源
- 将 Intelligent Platform Management Interface (IPMI) 与 Oracle Clusterware 集成,提供故障隔离支持并确保集群完整性
- 调试 Oracle Clusterware 组件
就本文(本节)而言,我们只执行“检查集群的运行状况”这一操作,将通过集群化的(可识别集群的)命令来执行该操作:
crsctl check cluster
在 Oracle Clusterware 11g 第 2 版 (11.2) 中,有许多子程序和命令已不再使用:
- crs_stat
- crs_register
- crs_unregister
- crs_start
- crs_stop
- crs_getperm
- crs_profile
- crs_relocate
- crs_setperm
- crsctl check crsd
- crsctl check cssd
- crsctl check evmd
- crsctl debug log
- crsctl set css votedisk
- crsctl start resources
- crsctl stop resources
检查集群的运行状况 —(集群化命令)
以 grid 用户身份运行以下命令。 [grid@racnode1 ~]$ crsctl check cluster
CRS-4537: Cluster Ready Services is online
CRS-4529: Cluster Synchronization Services is online
CRS-4533: Event Manager is online
所有 Oracle 实例 —(数据库状态)
[oracle@racnode1 ~]$ srvctl status database -d racdb
Instance racdb1 is running on node racnode1
Instance racdb2 is running on node racnode2
单个 Oracle 实例 —(特定实例的状态)
[oracle@racnode1 ~]$ srvctl status instance -d racdb -i racdb1
Instance racdb1 is running on node racnode1
节点应用程序 —(状态)
[oracle@racnode1 ~]$ srvctl status nodeapps
VIP racnode1-vip is enabled
VIP racnode1-vip is running on node: racnode1
VIP racnode2-vip is enabled VIP racnode2-vip is running on node: racnode2
Network is enabled Network is running on node: racnode1
Network is running on node: racnode2 GSD is disabled
GSD is not running on node: racnode1
GSD is not running on node: racnode2
ONS is enabled
ONS daemon is running on node: racnode1
ONS daemon is running on node: racnode2
eONS is enabled eONS daemon is running on node: racnode1
eONS daemon is running on node: racnode2
节点应用程序 —(配置)
[oracle@racnode1 ~]$ srvctl config nodeapps
VIP exists.:racnode1 VIP exists.: /racnode1-vip/192.168.1.251/255.255.255.0/eth0
VIP exists.:racnode2
VIP exists.: /racnode2-vip/192.168.1.252/255.255.255.0/eth0
GSD exists.
ONS daemon exists. Local port 6100, remote port 6200
eONS daemon exists. Multicast port 24057, multicast IP address 234.194.43.168,
listening port 2016
列出配置的所有数据库
[oracle@racnode1 ~]$ srvctl config database racdb
数据库 —(配置)
[oracle@racnode1 ~]$ srvctl config database -d racdb -a
Database unique name: racdb
Database name: racdb
Oracle home: /u01/app/oracle/product/11.2.0/dbhome_1
Oracle user: oracle
Spfile: +RACDB_DATA/racdb/spfileracdb.ora
Domain: idevelopment.info
Start options: open
Stop options: immediate
Database role: PRIMARY
Management policy: AUTOMATIC
Server pools: racdb
Database instances: racdb1,racdb2
Disk Groups: RACDB_DATA,FRA
Services:
Database is enabled
Database is administrator managed
ASM —(状态)
[oracle@racnode1 ~]$ srvctl status asm
ASM is running on racnode1,racnode2
ASM —(配置)
$ srvctl config asm -a
ASM home: /u01/app/11.2.0/grid
ASM listener: LISTENER
ASM is enabled.
TNS 监听器 —(状态)
[oracle@racnode1 ~]$ srvctl status listener
Listener LISTENER is enabled
Listener LISTENER is running on node(s): racnode1,racnode2
TNS 监听器 —(配置)
[oracle@racnode1 ~]$ srvctl config listener -a
Name: LISTENER
Network: 1, Owner: grid
Home: <crs> /u01/app/11.2.0/grid on node(s) racnode2,racnode1
End points: TCP:1521
SCAN —(状态)
[oracle@racnode1 ~]$ srvctl status scan
SCAN VIP scan1 is enabled
SCAN VIP scan1 is running on node racnode1
SCAN —(配置)
[oracle@racnode1 ~]$ srvctl config scan
SCAN name: racnode-cluster-scan, Network: 1/192.168.1.0/255.255.255.0/eth0
SCAN VIP name: scan1, IP: /racnode-cluster-scan/192.168.1.187
VIP —(特定节点的状态)
[oracle@racnode1 ~]$ srvctl status vip -n racnode1
VIP racnode1-vip is enabled
VIP racnode1-vip is running on node: racnode1 [oracle@racnode1 ~]$ srvctl status vip -n racnode2
VIP racnode2-vip is enabled
VIP racnode2-vip is running on node: racnode2
VIP —(特定节点的配置)
[oracle@racnode1 ~]$ srvctl config vip -n racnode1
VIP exists.:racnode1
VIP exists.: /racnode1-vip/192.168.1.251/255.255.255.0/eth0 [oracle@racnode1 ~]$ srvctl config vip -n racnode2
VIP exists.:racnode2
VIP exists.: /racnode2-vip/192.168.1.252/255.255.255.0/eth0
节点应用程序配置 —(VIP、GSD、ONS、监听器)
[oracle@racnode1 ~]$ srvctl config nodeapps -a -g -s -l
-l option has been deprecated and will be ignored.
VIP exists.:racnode1
VIP exists.: /racnode1-vip/192.168.1.251/255.255.255.0/eth0
VIP exists.:racnode2
VIP exists.: /racnode2-vip/192.168.1.252/255.255.255.0/eth0
GSD exists.
ONS daemon exists. Local port 6100, remote port 6200
Name: LISTENER
Network: 1, Owner: grid
Home: <crs> /u01/app/11.2.0/grid on node(s) racnode2,racnode1
End points: TCP:1521
验证所有集群节点间的时钟同步
[oracle@racnode1 ~]$ cluvfy comp clocksync -verbose Verifying Clock Synchronization across the cluster nodes Checking if Clusterware is installed on all nodes...
Check of Clusterware install passed Checking if CTSS Resource is running on all nodes...
Check: CTSS Resource running on all nodes Node Name Status ------------------------------------ ------------------------ racnode1 passed
Result: CTSS resource check passed Querying CTSS for time offset on all nodes...
Result: Query of CTSS for time offset passed Check CTSS state started...
Check: CTSS state Node Name State ------------------------------------ ------------------------ racnode1 Active
CTSS is in Active state. Proceeding with check of clock time offsets on all nodes...
Reference Time Offset Limit: 1000.0 msecs
Check: Reference Time Offset Node Name Time Offset Status ------------ ------------------------ ------------------------ racnode1 0.0 passed Time offset is within the specified limits on the following set of nodes: "[racnode1]"
Result: Check of clock time offsets passed Oracle Cluster Time Synchronization Services check passed Verification of Clock Synchronization across the cluster nodes was successful.
集群中所有正在运行的实例 — (SQL)
SELECTinst_id, instance_number inst_no, instance_name inst_name, parallel, status, database_status db_status, active_state state, host_name host
FROM gv$instance
ORDER BY inst_id; INST_ID INST_NO INST_NAME PAR STATUS DB_STATUS STATE HOST
-------- -------- ---------- --- ------- ------------ --------- -------1 1 racdb1 YES OPEN ACTIVE NORMAL racnode12 2 racdb2 YES OPEN ACTIVE NORMAL racnode2
所有数据库文件及它们所在的 ASM 磁盘组 — (SQL)
select name from v$datafile
union
select member from v$logfile
union
select name from v$controlfile
union
select name from v$tempfile;
NAME
-------------------------------------------
+FRA/racdb/controlfile/current.256.703530389
+FRA/racdb/onlinelog/group_1.257.703530391
+FRA/racdb/onlinelog/group_2.258.703530393
+FRA/racdb/onlinelog/group_3.259.703533497
+FRA/racdb/onlinelog/group_4.260.703533499
+RACDB_DATA/racdb/controlfile/current.256.703530389
+RACDB_DATA/racdb/datafile/example.263.703530435
+RACDB_DATA/racdb/datafile/indx.270.703542993
+RACDB_DATA/racdb/datafile/sysaux.260.703530411
+RACDB_DATA/racdb/datafile/system.259.703530397
+RACDB_DATA/racdb/datafile/undotbs1.261.703530423
+RACDB_DATA/racdb/datafile/undotbs2.264.703530441
+RACDB_DATA/racdb/datafile/users.265.703530447
+RACDB_DATA/racdb/datafile/users.269.703542943
+RACDB_DATA/racdb/onlinelog/group_1.257.703530391
+RACDB_DATA/racdb/onlinelog/group_2.258.703530393
+RACDB_DATA/racdb/onlinelog/group_3.266.703533497
+RACDB_DATA/racdb/onlinelog/group_4.267.703533499
+RACDB_DATA/racdb/tempfile/temp.262.703530429 19 rows selected.
ASM 磁盘卷 — (SQL)
SELECT path
FROM v$asm_disk;
PATH
----------------------------------
ORCL:CRSVOL1
ORCL:DATAVOL1
ORCL:FRAVOL1
30. 启动/停止集群
至此,已为 Oracle RAC 11g 第 2 版进行了所有安装和配置。Oracle Grid Infrastructure 已由 grid 用户安装,Oracle RAC 软件已由 oracle 用户安装。一个名为 racdb 的功能完善的集群化数据库正在运行。
完成所有这些艰巨任务之后,您可能会问:“那么我怎样来启动和停止服务?”。如果您遵循了本指南中的说明,则所有服务(包括 Oracle Clusterware、ASM、网络、SCAN、VIP、Oracle Database 等)应在 Linux 节点每次重新引导时自动启动。
但有时为了进行维护,您可能想在某节点上关闭 Oracle 服务,稍后再重启 Oracle Clusterware 系统。或者,您可能发现 Enterprise Manager 没有运行而需要启动它。本节为在本地服务器 ( racnode1) 上停止和启动 Oracle Clusterware 系统提供所需命令。
以下停止/启动操作需要以 root 身份来执行。
在本地服务器上停止 Oracle Clusterware 系统
在 racnode1 节点上使用 crsctl stop cluster 命令停止 Oracle Clusterware 系统:
[root@racnode1 ~]# /u01/app/11.2.0/grid/bin/crsctl stop cluster
CRS-2673: Attempting to stop 'ora.crsd' on 'racnode1'
CRS-2790: Starting shutdown of Cluster Ready Services-managed resources on
'racnode1'
CRS-2673: Attempting to stop 'ora.LISTENER.lsnr' on 'racnode1'
CRS-2673: Attempting to stop 'ora.CRS.dg' on 'racnode1'
CRS-2673: Attempting to stop 'ora.racdb.db' on 'racnode1'
CRS-2673: Attempting to stop 'ora.registry.acfs' on 'racnode1'
CRS-2673: Attempting to stop 'ora.LISTENER_SCAN1.lsnr' on 'racnode1'
CRS-2677: Stop of 'ora.LISTENER.lsnr' on 'racnode1' succeeded
CRS-2673: Attempting to stop 'ora.racnode1.vip' on 'racnode1'
CRS-2677: Stop of 'ora.LISTENER_SCAN1.lsnr' on 'racnode1' succeeded
CRS-2673: Attempting to stop 'ora.scan1.vip' on 'racnode1'
CRS-2677: Stop of 'ora.scan1.vip' on 'racnode1' succeeded
CRS-2672: Attempting to start 'ora.scan1.vip' on 'racnode2'
CRS-2677: Stop of 'ora.racnode1.vip' on 'racnode1' succeeded
CRS-2672: Attempting to start 'ora.racnode1.vip' on 'racnode2'
CRS-2677: Stop of 'ora.registry.acfs' on 'racnode1' succeeded
CRS-2676: Start of 'ora.racnode1.vip' on 'racnode2' succeeded <-- Notice racnode1 VIP moved to racnode2
CRS-2676: Start of 'ora.scan1.vip' on 'racnode2' succeeded <-- Notice SCAN moved to racnode2
CRS-2672: Attempting to start 'ora.LISTENER_SCAN1.lsnr' on 'racnode2'
CRS-2676: Start of 'ora.LISTENER_SCAN1.lsnr' on 'racnode2' succeeded <-- Notice LISTENER_SCAN1 moved to racnode2
CRS-2677: Stop of 'ora.CRS.dg' on 'racnode1' succeeded
CRS-2677: Stop of 'ora.racdb.db' on 'racnode1' succeeded
CRS-2673: Attempting to stop 'ora.FRA.dg' on 'racnode1'
CRS-2673: Attempting to stop 'ora.RACDB_DATA.dg' on 'racnode1'
CRS-2677: Stop of 'ora.RACDB_DATA.dg' on 'racnode1' succeeded
CRS-2677: Stop of 'ora.FRA.dg' on 'racnode1' succeeded
CRS-2673: Attempting to stop 'ora.asm' on 'racnode1'
CRS-2677: Stop of 'ora.asm' on 'racnode1' succeeded
CRS-2673: Attempting to stop 'ora.ons' on 'racnode1'
CRS-2673: Attempting to stop 'ora.eons' on 'racnode1'
CRS-2677: Stop of 'ora.ons' on 'racnode1' succeeded
CRS-2673: Attempting to stop 'ora.net1.network' on 'racnode1'
CRS-2677: Stop of 'ora.net1.network' on 'racnode1' succeeded
CRS-2677: Stop of 'ora.eons' on 'racnode1' succeeded
CRS-2792: Shutdown of Cluster Ready Services-managed resources on 'racnode1' has
completed
CRS-2677: Stop of 'ora.crsd' on 'racnode1' succeeded
CRS-2673: Attempting to stop 'ora.cssdmonitor' on 'racnode1'
CRS-2673: Attempting to stop 'ora.ctssd' on 'racnode1'
CRS-2673: Attempting to stop 'ora.evmd' on 'racnode1'
CRS-2673: Attempting to stop 'ora.asm' on 'racnode1'
CRS-2677: Stop of 'ora.cssdmonitor' on 'racnode1' succeeded
CRS-2677: Stop of 'ora.evmd' on 'racnode1' succeeded
CRS-2677: Stop of 'ora.ctssd' on 'racnode1' succeeded
CRS-2677: Stop of 'ora.asm' on 'racnode1' succeeded
CRS-2673: Attempting to stop 'ora.cssd' on 'racnode1'
CRS-2677: Stop of 'ora.cssd' on 'racnode1' succeeded
CRS-2673: Attempting to stop 'ora.diskmon' on 'racnode1'
CRS-2677: Stop of 'ora.diskmon' on 'racnode1' succeeded
注:在运行“ crsctl stop cluster”命令之后,如果 Oracle Clusterware 管理的资源中有任何一个还在运行,则整个命令失败。使用 -f 选项无条件地停止所有资源并停止 Oracle Clusterware 系统。
另请注意,可通过指定 -all 选项在集群中所有服务器上停止 Oracle Clusterware 系统。以下命令将在 racnode1 和 racnode2 上停止 Oracle Clusterware 系统:
[root@racnode1 ~]# /u01/app/11.2.0/grid/bin/crsctl stop cluster -all
在本地服务器上启动 Oracle Clusterware 系统
在 racnode1 节点上使用 crsctl start cluster 命令启动 Oracle Clusterware 系统:
[root@racnode1 ~]# /u01/app/11.2.0/grid/bin/crsctl start cluster
CRS-2672: Attempting to start 'ora.cssdmonitor' on 'racnode1'
CRS-2676: Start of 'ora.cssdmonitor' on 'racnode1' succeeded
CRS-2672: Attempting to start 'ora.cssd' on 'racnode1'
CRS-2672: Attempting to start 'ora.diskmon' on 'racnode1'
CRS-2676: Start of 'ora.diskmon' on 'racnode1' succeeded
CRS-2676: Start of 'ora.cssd' on 'racnode1' succeeded
CRS-2672: Attempting to start 'ora.ctssd' on 'racnode1'
CRS-2676: Start of 'ora.ctssd' on 'racnode1' succeeded
CRS-2672: Attempting to start 'ora.evmd' on 'racnode1'
CRS-2672: Attempting to start 'ora.asm' on 'racnode1'
CRS-2676: Start of 'ora.evmd' on 'racnode1' succeeded
CRS-2676: Start of 'ora.asm' on 'racnode1' succeeded
CRS-2672: Attempting to start 'ora.crsd' on 'racnode1'
CRS-2676: Start of 'ora.crsd' on 'racnode1' succeeded
注:可通过指定 -all 选项在集群中所有服务器上启动 Oracle Clusterware 系统。
[root@racnode1 ~]# /u01/app/11.2.0/grid/bin/crsctl start cluster -all
还可以通过列出服务器(各服务器之间以空格分隔)在集群中一个或多个指定的服务器上启动 Oracle Clusterware 系统:
[root@racnode1 ~]# /u01/app/11.2.0/grid/bin/crsctl start cluster -n
racnode1 racnode2
使用 SRVCTL 启动/停止所有实例
最后,可使用以下命令来启动/停止所有实例及相关服务:
[oracle@racnode1 ~]$ srvctl stop database -d racdb
[oracle@racnode1 ~]$ srvctl start database -d racdb
31. 故障排除
确保 /etc/hosts 文件的环回地址中不包含节点名(racnode1 或 racnode2)。如果计算名出现在环回地址条目中,如下所示:
127.0.0.1 racnode1 localhost.localdomain localhost
需要按如下所示将其删除:127.0.0.1 localhost.localdomain localhost
如果 RAC 节点名出现在环回地址中,在 RAC 安装过程中会收到以下错误消息:
ORA-00603: ORACLE server session terminated by fatal error
或者ORA-29702: error occurred in Cluster Group Service operation
使用连接到 Openfiler 服务器的 USB 驱动器时,出现了一个我多次遇到的问题。重新引导 Openfiler 服务器后,系统能够识别 USB 驱动器,但是无法加载逻辑卷,它会将以下消息写入 /var/log/messages —(也可通过 dmesg 获得):
iSCSI Enterprise Target Software - version 0.4.14 iotype_init(91) register fileio iotype_init(91) register blockio iotype_init(91) register nullio open_path(120) Can't open /dev/rac1/crs -2 fileio_attach(268) -2 open_path(120) Can't open /dev/rac1/asm1 -2 fileio_attach(268) -2 open_path(120) Can't open /dev/rac1/asm2 -2 fileio_attach(268) -2 open_path(120) Can't open /dev/rac1/asm3 -2 fileio_attach(268) -2 open_path(120) Can't open /dev/rac1/asm4 -2 fileio_attach(268) -2
请注意,我不是说只有与 Openfiler 服务器连接的 USB 驱动器才会出现该问题。其他类型的驱动器也可能会出现该问题,但是,我只看到了 USB 驱动器出现了该问题!
如果您确实收到该错误,首先应在 Openfiler 服务器中使用 lvscan 命令检查所有逻辑卷的状态:
# lvscan inactive '/dev/rac1/crs' [2.00 GB] inherit inactive '/dev/rac1/asm1' [115.94 GB] inherit inactive '/dev/rac1/asm2' [115.94 GB] inherit inactive '/dev/rac1/asm3' [115.94 GB] inherit inactive '/dev/rac1/asm4' [115.94 GB] inherit
注意,每个逻辑卷的状态设置为 inactive —(工作系统上每个逻辑卷的状态应设置为 ACTIVE)。
目前,我知道有两种方法可以让 Openfiler 在重新引导时自动加载逻辑卷,下面将说明这两种方法。
方法 1
首先,关闭集群中的两个 Oracle RAC 节点 — racnode1 和 racnode2。然后,在 Openfiler 服 务器中,针对每个后续的重新引导,手动将每个逻辑卷设置为 ACTIVE:
# lvchange -a y /dev/rac1/crs # lvchange -a y /dev/rac1/asm1 # lvchange -a y /dev/rac1/asm2 # lvchange -a y /dev/rac1/asm3 # lvchange -a y /dev/rac1/asm4
也可以使用卷组更改命令将所有逻辑卷的状态设置为 active,如下所示:
# vgscan Reading all physical volumes. This may take a while... Found volume group "rac1" using metadata type lvm2 # vgchange -ay 5 logical volume(s) in volume group "rac1" now active
将每个逻辑卷设置为 active 后,使用 lvscan 命令再次验证状态:
# lvscan ACTIVE '/dev/rac1/crs' [2.00 GB] inheritACTIVE '/dev/rac1/asm1' [115.94 GB] inheritACTIVE '/dev/rac1/asm2' [115.94 GB] inheritACTIVE '/dev/rac1/asm3' [115.94 GB] inheritACTIVE '/dev/rac1/asm4' [115.94 GB] inherit
作为最后的测试,重新引导 Openfiler 服务器以确保引导过程之后每个逻辑卷会设置为 ACTIVE。验证在引导时会激活每个逻辑卷之后,检查 iSCSI 目标服务是否正在运行:
# service iscsi-target status ietd (pid 2668) is running...
最后,重新启动集群中的每个 Oracle RAC 节点(racnode1 和 racnode2)。
方法 2
该方法由 Martin Jones 友情提供。他的变通方法包括修改 /etc/rc.sysinit 脚本,主要是等待 USB 磁盘(在本例中为 /dev/sda)得到检测。对 /etc/rc.sysinit 脚本进行更改(见下面)之后,验证外部驱动器已打开电源,然后重新引导 Openfiler 服务器。
以下是 Openfiler 服务器上的 /etc/rc.sysinit 脚本的一小部分,其中包含 Martin 建议的更改(用 蓝色高亮显示):
.............................................................. # LVM2 initialization, take 2if [ -c /dev/mapper/control ]; thenif [ -x /sbin/multipath.static ]; thenmodprobe dm-multipath >/dev/null 2>&1/sbin/multipath.static -v 0if [ -x /sbin/kpartx ]; then/sbin/dmsetup ls --target multipath --exec "/sbin/kpartx -a"fifiif [ -x /sbin/dmraid ]; thenmodprobe dm-mirror > /dev/null 2>&1/sbin/dmraid -i -a yfi#----- #----- MJONES - Customisation Start #-----# Check if /dev/sda is readywhile [ ! -e /dev/sda ]doecho "Device /dev/sda for first USB Drive is not yet ready."echo "Waiting..."sleep 5doneecho "INFO - Device /dev/sda for first USB Drive is ready."#----- #----- MJONES - Customisation END #-----if [ -x /sbin/lvm.static ]; thenif /sbin/lvm.static vgscan > /dev/null 2>&1 ; thenaction $"Setting up Logical Volume Management:" /sbin/lvm.static vgscan --mknodes --ignorelockingfailure && /sbin/lvm.static vgchange -a y --ignorelockingfailurefififi# Clean up SELinux labels if [ -n "$SELINUX" ]; thenfor file in /etc/mtab /etc/ld.so.cache ; do[ -r $file ] && restorecon $file >/dev/null 2>&1done fi ..............................................................最后,重新启动集群中的每个 Oracle RAC 节点(racnode1 和 racnode2)。
32. 总结
Oracle11g RAC 允许 DBA 配置一个拥有优越的容错和负载平衡功能的数据库解决方案。然而,对于那些希望深入了解 Oracle11g RAC 的特性和优势的 DBA 而言,他们会发现即使一个小型 RAC 集群的配置成本也在 15,000 美元到 20,000 美元之间。
本文希望为您提供一个低成本的解决方案,这个方案使用 Oracle Enterprise Linux 和 iSCSI 技术建立和配置一个经济实惠的 Oracle 11g 第 2 版 RAC 集群。本文介绍的 RAC 解决方案总共需要大约 2,700 美元,可以为 DBA 提供一个功能完善的 Oracle 11g 第 2 版 RAC 集群。虽然本文使用的硬件对于教学目的而言足够稳定,但永远不应认为其适用于生产环境。
33. 致谢
像这样篇幅和复杂程度的文章通常并非出自一人之手。尽管本人能够记述构成此配置的组件并成功演示这些组件的有效性,但我要感谢其他几个帮助我成功编写本文的人。
首先,我要感谢来自 Oracle 的 Server BDE 团队的 Bane Radulovic。Bane 不仅向我介绍了 Openfiler,还与我共享了他对于该产品以及如何针对 Oracle RAC 充分利用该产品的经验和知识。他的研究和辛苦工作使得配置 Openfiler 的任务得以圆满完成。Bane 还参与了硬件建议和测试工作。
特别感谢 K Gopalakrishnan 的帮助,他提供了本文的 Oracle RAC 11g 概述一节。本节中有关 Oracle RAC 历史的很多内容可以在他的畅销书《Oracle Database 10g Real Application Clusters Handbook》中找到。此书受到希望成功实施 Oracle RAC 以及完全理解缓存融合 和全局资源目录 等多种高级服务的工作原理的 DBA 和开发人员的极力推荐。
最后,我想表达对以下供应商的感谢,他们慷慨地为本文提供了硬件:Seagate、Avocent Corporation 和 Intel。
Jeffrey M. Hunter [www.idevelopment.info] 是一位 Oracle 认证专家、Java 开发认证专家、作者和 Oracle ACE。Jeff 当前作为高级数据库管理员就职于宾夕法尼亚州匹兹堡市的 The DBA Zone, Inc.。
Jeff 的工作包括高级性能调优、Java 和 PL/SQL 编程、容量规划、数据库安全性以及 UNIX、Linux 和 Windows 服务器环境中的物理/逻辑数据库设计。Jeff 的其他兴趣还包括数学加密理论、Java 和 C 的编程语言处理器(编译器和解释器)、LDAP、编写基于 Web 的数据库管理工具,当然还有 Linux。
Jeff 作为高级数据库管理员和软件工程师拥有 16 年以上的工作经验,他的个人网站是:http://www.iDevelopment.info。Jeff 毕业于位于特洛克的加利福尼亚州立大学的 Stanislaus 分校,获得了计算机科学学士学位。