Oracle 可观测最佳实践

devtools/2025/1/20 14:58:46/

简介

Oracle 数据库是一种广泛使用的商业关系数据库管理系统(RDBMS),由甲骨文公司(Oracle Corporation)开发。它支持 SQL 语言,能够存储和管理大量数据,并提供高级数据管理功能,如数据仓库、联机事务处理(OLTP)和复杂的查询处理。

监控 Oracle 数据库的关键指标对于确保数据库的性能、稳定性和安全性至关重要。通过实时监控,可以及时发现并解决性能瓶颈、资源不足、查询效率低下等问题,从而优化数据库响应时间和处理能力。

本文主要介绍观测云采集器 DataKit 直采 Oracle 相关指标,以及如何日常故障排查。

观测云

观测云是一个统一实时监测平台,它提供全面的系统可观测性解决方案,帮助用户快速实现对云平台、云原生、应用及业务的监控需求。观测云的核心功能包括:基础设施监测,日志采集和分析,用户访问监测(RUM),应用性能监测(APM),服务可用性监测(拨测),安全巡检,智能监控等等。

DataKit 自身提供 Oracle 指标和日志的采集,安装好 DataKit 之后,开通 Oracle 采集器,即可采集 Oracle 指标和日志到观测云。下面是在 Windows 主机中,部署 DataKit 并开通 Oracle 采集器的示例。

环境介绍

  • DataKit:v1.62.0
  • Oracle:v19c

部署 DataKit

登录观测云控制台,点击「集成」 - 「DataKit」 - 「Windows」,复制安装命令,在主机中必须以管理员运行 PowerShell 进行安装。

创建监控账号

如果是使用单 PDB 或者非 CDB 实例,一个本地用户(local user)就足够了(用 sys 管理员账号来创建并授权,避免出现权限不足等问题):

-- Create the datakit user. Replace the password placeholder with a secure password.
CREATE USER datakit IDENTIFIED BY <PASSWORD>;-- Grant access to the datakit user.
GRANT CONNECT, CREATE SESSION TO datakit;
GRANT SELECT_CATALOG_ROLE to datakit;
GRANT SELECT ON DBA_TABLESPACE_USAGE_METRICS TO datakit;
GRANT SELECT ON DBA_TABLESPACES TO datakit;
GRANT SELECT ON DBA_USERS TO datakit;
GRANT SELECT ON SYS.DBA_DATA_FILES TO datakit;
GRANT SELECT ON V_$ACTIVE_SESSION_HISTORY TO datakit;
GRANT SELECT ON V_$ARCHIVE_DEST TO datakit;
GRANT SELECT ON V_$ASM_DISKGROUP TO datakit;
GRANT SELECT ON V_$DATABASE TO datakit;
GRANT SELECT ON V_$DATAFILE TO datakit;
GRANT SELECT ON V_$INSTANCE TO datakit;
GRANT SELECT ON V_$LOG TO datakit;
GRANT SELECT ON V_$OSSTAT TO datakit;
GRANT SELECT ON V_$PGASTAT TO datakit;
GRANT SELECT ON V_$PROCESS TO datakit;
GRANT SELECT ON V_$RECOVERY_FILE_DEST TO datakit;
GRANT SELECT ON V_$RESTORE_POINT TO datakit;
GRANT SELECT ON V_$SESSION TO datakit;
GRANT SELECT ON V_$SGASTAT TO datakit;
GRANT SELECT ON V_$SYSMETRIC TO datakit;
GRANT SELECT ON V_$SYSTEM_PARAMETER TO datakit;

如果想监控来自 CDB 和所有 PDB 中的表空间(Table Spaces),需要一个有合适权限的公共用户(common user):

-- Create the datakit user. Replace the password placeholder with a secure password.
CREATE USER datakit IDENTIFIED BY <PASSWORD>;-- Grant access to the datakit user.
ALTER USER datakit SET CONTAINER_DATA=ALL CONTAINER=CURRENT;
GRANT CONNECT, CREATE SESSION TO datakit;
GRANT SELECT_CATALOG_ROLE to datakit;
GRANT SELECT ON v_$instance TO datakit;
GRANT SELECT ON v_$database TO datakit;
GRANT SELECT ON v_$sysmetric TO datakit;
GRANT SELECT ON v_$system_parameter TO datakit;
GRANT SELECT ON v_$session TO datakit;
GRANT SELECT ON v_$recovery_file_dest TO datakit;
GRANT SELECT ON v_$active_session_history TO datakit;
GRANT SELECT ON v_$osstat TO datakit;
GRANT SELECT ON v_$restore_point TO datakit;
GRANT SELECT ON v_$process TO datakit;
GRANT SELECT ON v_$datafile TO datakit;
GRANT SELECT ON v_$pgastat TO datakit;
GRANT SELECT ON v_$sgastat TO datakit;
GRANT SELECT ON v_$log TO datakit;
GRANT SELECT ON v_$archive_dest TO datakit;
GRANT SELECT ON v_$asm_diskgroup TO datakit;
GRANT SELECT ON sys.dba_data_files TO datakit;
GRANT SELECT ON DBA_TABLESPACES TO datakit;
GRANT SELECT ON DBA_TABLESPACE_USAGE_METRICS TO datakit;
GRANT SELECT ON DBA_USERS TO datakit;

注意:上述的 SQL 语句由于 Oracle 版本的原因部分可能会出现 "表不存在" 等错误,忽略即可。

DataKit 配置采集器

进入 DataKit 安装目录 C:\Program Files\datakit\conf.d\db ,复制 conf.d 目录下的配置文件并命名为 oracle.conf 。 修改配置文件中的连接信息。

[[inputs.oracle]]# host namehost = "localhost"## portport = 1521## user nameuser = "datakit"## passwordpassword = "<PASS>"## serviceservice = "XE"## intervalinterval = "10s"## connection timeoutconnect_timeout = "30s"## slow query time threshold defined. If larger than this, the executed sql will be reported.slow_query_time = "0s"## Set true to enable electionelection = true## Run a custom SQL query and collect corresponding metrics.# [[inputs.oracle.custom_queries]]#   sql = '''#     SELECT#       GROUP_ID, METRIC_NAME, VALUE#     FROM GV$SYSMETRIC#   '''#   metric = "oracle_custom"#   tags = ["GROUP_ID", "METRIC_NAME"]#   fields = ["VALUE"][inputs.oracle.tags]# some_tag = "some_value"# more_tag = "some_other_value"

配置完成后,重启 DataKit 即可。

仪表板

在观测云的「场景」 - 「新建仪表板」,搜索“Oracle”,选择 “Oracle监控视图” ,即可查看采集上来的 Oracle 指标数据。

慢查询支持

DataKit 可以将执行超过用户自定义时间的 SQL 语句报告给观测云,并在日志中显示,source 是 oracle_log 。

该功能默认情况下是关闭的,用户可以在 Oracle 的配置文件中将其打开,方法如下:

将 slow_query_time 的值从 0s 改成用户心中的阈值,最小值是 1 毫秒。 一般推荐 10 秒。

指标

以下所有数据采集,默认会追加全局选举 tag,也可以在配置中通过 [inputs.oracle.tags] 指定其它标签。

 [inputs.oracle.tags]# some_tag = "some_value"# more_tag = "some_other_value"# ...
oracle_process
指标名描述类型单位
pga_alloc_mem按进程分配的 PGA 内存floatB
pga_freeable_mem按进程释放的 PGA 内存floatB
pga_max_mem进程分配的 PGA 最大内存floatB
pga_used_mem进程使用的 PGA 内存floatB
pidOracle 进程标识符int-
oracle_tablespace
指标名描述类型单位
in_use已用空间百分比,作为最大可能表空间大小的函数float百分比
off_use表空间占用的总空间,以数据库块为单位floatB
ts_size表空间大小floatB
pga_used_mem进程使用的 PGA 内存floatB
used_space已用空间floatB
oracle_system
指标名描述类型单位
active_sessions活动会话数floatcount
buffer_cachehit_ratio缓冲区缓存命中率float百分比
cache_blocks_corrupt损坏的缓存块floatcount
cache_blocks_lost丢失缓存块floatcount
consistent_read_changes每秒一致性读取更改floatcount
consistent_read_gets每秒一致性读取获取floatcount
cursor_cachehit_ratio游标缓存命中率float百分比
database_cpu_time_ratio数据库 CPU 时间比率float百分比
database_wait_time_ratio每秒内存排序数float百分比
db_block_changes每秒数据库数据块更改数floatcount
db_block_gets数据库块每秒获取数floatcount
disk_sorts每秒磁盘排序数floatcount
enqueue_timeouts每秒排队超时floatcount
execute_without_parse在没有解析比率的情况下执行floatcount
gc_cr_block_received收到 GC CR 块floatcount
host_cpu_utilization主机 CPU 利用率 (%)float百分比
library_cachehit_ratio库缓存命中率float百分比
logical_reads每秒逻辑读取数floatcount
logons登录尝试次数floatcount
memory_sorts_ratio内存排序比率float百分比
pga_over_allocation_count过度分配 PGA 内存计数floatcount
physical_reads每秒物理读取数floatcount
physical_reads_direct每秒直接物理读取floatcount
physical_writes每秒物理写入数floatcount
redo_generated每秒生成的重做floatcount
redo_writes每秒重做写入次数floatcount
rows_per_sort每个排序的行数floatcount
service_response_time服务响应时间float
session_count会话计数floatcount
session_limit_usage会话限制使用情况float百分比
shared_pool_free共享池可用内存 %float百分比
soft_parse_ratio软解析比率float百分比
sorts_per_user_call按用户调用排序floatcount
temp_space_used已用临时空间floatB
user_rollbacks用户回滚次数floatcount

监控器

点击「监控」 -「监控器」 - 「从模板新建」,添加以下两个监控器,也可以点击具体监控器进去修改对应的阈值。

Oracle 活跃会话数突变告警

Oracle 表空间不足告警

总结

通过监控 Oracle 数据库特定的指标,比如缓存命中率、表空间使用率、响应时间和数据库连接状态等,能够帮助我们优化查询效率,并进行有效的容量规划。通过综合监控这些关键指标,可以及时发现并解决潜在的性能瓶颈,从而维护 Oracle 的高效运行和稳定性。


http://www.ppmy.cn/devtools/152119.html

相关文章

Spring boot面试题----Spring Boot核心注解有哪些

一、@SpringBootApplication 功能: 这是一个组合注解,相当于同时使用了 @Configuration、@EnableAutoConfiguration 和 @ComponentScan 三个注解。它是 Spring Boot 应用程序的入口点,通常添加在应用程序的主类上,例如:@SpringBootApplication public class MyApplicatio…

SpringBoot 集成 Gitee 实现三方登录

前段时间学习了 Oauth2 相关的授权流程 刚好想实践一下&#xff0c;就利用 Gitee 的官方文档进行了实践 源代码地址&#xff1a;gitee-spring-boot: Gitee的Oauth2三方登录实现 用的是 h2 数据库&#xff0c;按照 readme 步骤运行 Gitee 会返回用户信息 后端会判断 Gitee …

Linux使用SSH连接GitHub指南

基础配置流程 步骤1:生成SSH密钥 打开终端:首先,打开你的Linux终端。 生成SSH密钥对:输入以下命令来生成一个新的SSH密钥对: ssh-keygen -t rsa -b 4096 -C "your_email@example.com"-t rsa:使用RSA加密算法生成密钥。-b 4096:密钥长度为4096位,增加安全性。…

springboot集成websocket实现实时大量数据,效率性能高

前言 小编我将用CSDN记录软件开发求学之路上亲身所得与所学的心得与知识&#xff0c;有兴趣的小伙伴可以关注一下&#xff01; 也许一个人独行&#xff0c;可以走的很快&#xff0c;但是一群人结伴而行&#xff0c;才能走的更远&#xff01;让我们在成长的道路上互相学习&…

Word表格批量提取数据到Excel,批量提取,我爱excel

Word表格批量提取数据到Excel&#xff0c;Word导出到Excel - 我爱Excel助你高效办公 在日常办公中&#xff0c;Word表格常常用于记录和整理数据&#xff0c;但将这些数据从Word提取到Excel&#xff0c;特别是当涉及多个文件时&#xff0c;常常让人头疼。如果你经常需要将多个W…

CT重建笔记(三)——共轭梯度法

求解力学问题的有限元方法、CT迭代重建方法等都存在以下问题&#xff1a; A x b Axb Axb 其中&#xff0c; A A A为大型稀疏矩阵。利用系统矩阵的稀疏性可以把原问题缩减为一个小问题&#xff0c;从而加速求解。对于同样维度的问题&#xff0c;采用缩减法对于线性方程组问题不…

@LoadBalanced注解的实现原理

LoadBalanced LoadBalanced注解通常结合RestTemplate使用&#xff0c;RestTemplate是SpringCloud提供的一个编程式的实现远程过程调用的组件&#xff0c;简单来说就是可以实现发送http请求。但是在基于服务发现发送请求时&#xff0c;RestTemplate自己无法实现负载均衡&#x…

DEBERTA:具有解耦注意力机制的解码增强型BERT

摘要 近年来&#xff0c;预训练神经语言模型的进展显著提升了许多自然语言处理&#xff08;NLP&#xff09;任务的性能。本文提出了一种新的模型架构DeBERTa&#xff08;具有解耦注意力机制的解码增强型BERT&#xff09;&#xff0c;通过两种新技术改进了BERT和RoBERTa模型。第…