Oracle常用导元数据方法

news/2025/2/13 9:40:56/

1 说明

前两天领导发邮件要求导出O库一批表和索引的ddl语句做国产化测试,涉及6个系统,6千多张表,还好涉及的用户并不多,要不然很麻烦。
如此大费周折原因,是某国产库无法做元数据迁移。。。额,只能我手动导出,拿去给他们同步。

考虑的方案有两个:

  1. 使用get_ddl查询出语句。
  2. 使用数据泵导元数据。

两种方式各有优点,分场景使用。

2 get_ddl查询

在需要查询的表不多,且不用导索引时,get_ddl方式比较省力。

缺点就是步骤比较多,表、索引、注释等都需要单独做查询;段属性之类的信息无法屏蔽。最大的问题是比较慢,我导出1000张表及其相关索引花了差不多4个小时,时间主要花在查询索引ddl上。

2.1 创建表清单表

将需要生成ddl的表粘到下面表中:

create table lu9up.cs_tab_250210
(owner           varchar2(30) not null,table_name      varchar2(30) not null
);select * from lu9up.cs_tab_250210 for update;

2.2 部署脚本

进入到某个目录下,创建script_cs_250210.sql脚本,用于跑get_ddl:

cat > script_cs_250210.sql << EOF
declarescripts varchar2(4000);cursor tab isselect owner,table_name,dbms_metadata.get_ddl('TABLE', table_name, owner) || ';' table_scriptsfrom lu9up.cs_tab_250210--where owner = '' and table_name = ''order by owner;
beginfor i in tab loopdbms_output.put_line(chr(10) || '----' || i.owner || '.' ||i.table_name);dbms_output.put_line(i.table_scripts);for j in (select to_char(dbms_metadata.get_ddl(t.index_type,t.index_name,t.owner)) || ';' scriptsfrom (select owner, index_name, 'INDEX' index_typefrom dba_indexes bwhere owner = i.ownerand not exists(select 1from dba_constraints cwhere b.owner = i.ownerand b.index_name = c.constraint_name)and table_name = i.table_nameorder by 3, 2) t) loopdbms_output.put_line(j.scripts);end loop;end loop;
end;
/
EOF

创建script_cs_250210.sh脚本,调用script_cs_250210.sql脚本:

#!/bin/bash
export ORACLE_SID=xxxdb
sqlplus -s / as sysdbba <<EOF
set lines 500
set serveroutput on
spool cs_tab_250210.sql
@script_cs_250210.sql
spool off
EOF

2.3 导出元数据到sql文件

执行script_cs_250210.sh脚本:

nohup sh script_cs_250210.sh &

结果在cs_tab_250210.sql文件。

3 数据泵导出

如果涉及到的表、索引很多的情况下,使用数据泵比较快,几千张表十来分钟就可以导出完毕了,且可读性比较高。

3.1 创建表清单表

将需要生成ddl的表粘到下面表中:

create table lu9up.cs_tab_250210
(owner           varchar2(30) not null,table_name      varchar2(30) not null
);select * from lu9up.cs_tab_250210 for update;

3.2 创建导出目录

创建一个具有oracle权限的导出目录:

create directory csdir as '/home/oracle/lu9up';
grant read,write on directory csdir to lu9up;
grant datapump_exp_full_database to lu9up;
grant datapump_imp_full_database to lu9up;select * from dba_directories;

3.3 生成执行语句

由于得按schema导出,执行以下sql可生成不同schema的数据泵执行语句:

select '--'||owner|| chr(10) ||'cat > cs_'||owner||'_exp_250210.par << EOF' || chr(10) ||'directory=CSDIR' || chr(10) || 'schemas='||owner||'' || chr(10) ||'include=table:"in (select table_name from lu9up.cs_tab_250210 where owner = '''||owner||''')"' ||chr(10) || 'parallel=8' || chr(10) || 'cluster=n' || chr(10) ||'content=metadata_only' || chr(10) ||'dumpfile=cs_'||owner||'_exp_250210.dmp' || chr(10) ||'logfile=cs_'||owner||'_exp_250210.log' || chr(10) || 'EOF' || chr(10) ||chr(10) ||'expdp lu9up/oracle parfile=cs_'||owner||'_exp_250210.par' ||chr(10) ||chr(10)||chr(10)|| 'cat > cs_'||owner||'_imp_250210.par << EOF' || chr(10) ||'directory=CSDIR' || chr(10)|| 'dumpfile=cs_'||owner||'_exp_250210.dmp' ||chr(10) || 'parallel=8' || chr(10) ||'exclude=grant,statistics' || chr(10) ||'transform=segment_attributes:n'|| chr(10) ||'sqlfile='||owner||'.sql' || chr(10) ||'logfile=cs_'||owner||'_imp_250210.log' || chr(10) ||'EOF' || chr(10) ||chr(10) ||'impdp lu9up/oracle  parfile=cs_'||owner||'_imp_250210.par'from (select owner, count(*) ctfrom lu9up.cs_tab_250210group by ownerorder by ct desc);

image.png

image.png

有多个用户的时候就非常方便,可以直接拿去执行,不用再修改脚本。

其实也可以直接用dblink+impdp不落地导sqlfile,省去了expdp的步骤。

3.4 脚本部署

把cs_xxx_exp_250210.par和cs_xxx_imp_250210.par两个文件部署到数据库服务器,确认有oracle用户权限。

image.png

3.5 执行导出

脚本分两个,一个是使用expdp导出元数据到dmp文件,然后再用impdp将dmp文件转化为sqlfile。

expdp:

expdp lu9up/oracle  parfile=cs_xxx_exp_250210.par

impdp:

impdp lu9up/oracle  parfile=cs_xxx_imp_250210.par

结果生成到导出目录csdir中xxx.sql文件。

4 总结

总的来说,使用数据泵导出元数据比较符合规范,内容比较完整,阅读性高,且可以使用参数控制输出的内容。
get_ddl在少量表和索引的情况下,相对比较方便快捷。


http://www.ppmy.cn/news/1571676.html

相关文章

ChatGPT怎么回事?

纯属发现&#xff0c;调侃一下~ 这段时间deepseek不是特别火吗&#xff0c;尤其是它的推理功能&#xff0c;突发奇想&#xff0c;想用deepseek回答一些问题&#xff0c;回答一个问题之后就回复服务器繁忙&#xff08;估计还在被攻击吧~_~&#xff09; 然后就转向了GPT&#xf…

MySQL InnoDB引擎 MVCC

MVCC&#xff08;Multi-Version Concurrency Control&#xff09;即多版本并发控制&#xff0c;是 MySQL 的 InnoDB 存储引擎实现并发控制的一种重要技术。它在很多情况下避免了加锁操作&#xff0c;从而提高了数据库的并发性能。 一、原理 MVCC 的核心思想是通过保存数据在某…

使用DeepSeek+本地知识库,尝试从0到1搭建高度定制化工作流(需求分析篇)

1.需求分析 数据爬取 -> 数据清洗 -> 数据存储为文本文件文本切片 -> 文本嵌入模型 -> 向量数据库用户提问 -> 数据召回 -> 注入Prompt -> 生成回答生成文案 -> 生成配图 -> 发布到平台 2.RAG流程 3.目录结构(预设) . ├── xiaohongshu_drafts…

Netty的线程模型详解

引言 Netty 是一个高性能、异步事件驱动的网络应用框架&#xff0c;广泛应用于各种网络服务器和客户端的开发。它基于Java NIO&#xff08;Non-blocking I/O&#xff09;技术&#xff0c;能够高效处理大量并发连接和高吞吐量的网络通信。Netty 的核心之一就是它的线程模型&…

又要pde。。

五分文件 文件 1&#xff1a;The energy technique for the six-step BDF method.pdf 这篇论文研究了六阶 BDF 方法的稳定性分析&#xff0c;并将其应用于抛物线方程的数值解。主要内容包括&#xff1a; 引言&#xff1a;介绍了 BDF 方法的基本原理和六阶 BDF 方法的特性&…

如何解决ChatGPT API响应慢的问题

随着人工智能技术的快速发展&#xff0c;OpenAI的ChatGPT API已广泛应用于多种场景中&#xff0c;从客户服务到内容创作&#xff0c;甚至在教育、娱乐等领域也有着重要的应用。然而&#xff0c;很多开发者和使用者会遇到一个共同的问题——ChatGPT API响应速度较慢&#xff0c;…

Python 数据挖掘与机器学习

模块一&#xff1a;Python编程 Python编程入门 1、Python环境搭建 2、如何选择Python编辑器&#xff1f; 3、Python基础 4、常见的错误与程序调试 5、第三方模块的安装与使用 6、文件读写&#xff08;I/O&#xff09; Python进阶与提高 1、Numpy模块库 2、Pandas模块…

Python分享20个Excel自动化脚本

在数据处理和分析的过程中&#xff0c;Excel文件是我们日常工作中常见的格式。通过Python&#xff0c;我们可以实现对Excel文件的各种自动化操作&#xff0c;提高工作效率。 本文将分享20个实用的Excel自动化脚本&#xff0c;以帮助新手小白更轻松地掌握这些技能。 1. Excel单…