Oracle 数据库中,UNION ALL创建视图的使用详解

news/2024/12/21 19:35:35/

目录

UNION ALL 的特点

UNION ALL 的作用 

1. 合并结果集

2. 保留重复行

3. 提高性能

UNION ALL 的使用场景

1. 日志或数据拼接

2. 区分数据来源

3. 解决分区表查询

注意事项

 在创建视图中的作用

场景 1:合并多个表的数据到视图

表结构

目标

SQL 实现

解析

场景 2:合并不同类型的数据

表结构

目标

解析

场景 3:合并分区数据

表结构

目标

SQL 实现

场景 4:跨业务系统的数据合并

表结构

目标

SQL 实现

解析

场景 5:多条件动态数据组合

表结构

目标

SQL 实现

解析

总结


在 Oracle 数据库中,UNION ALL 是一种用于将多个查询的结果合并为一个结果集的 SQL 运算符。它的功能是将两个或多个查询的结果 直接合并,包括重复的行。以下是对 UNION ALL 的详细解释

SELECT 列1, 列2, ...
FROM 表1
[WHERE 条件]
UNION ALL
SELECT 列1, 列2, ...
FROM 表2
[WHERE 条件]

UNION ALL 的特点

  • 不去重

    • UNION 不同,UNION ALL 不会去除结果集中的重复行,因此效率更高。
    • 如果需要去重,请使用 UNION
  • 支持列数和数据类型匹配

    • 合并的各个查询必须有 相同数量的列,且每一列的数据类型必须兼容。
    • 列的名称可以不同,但顺序和类型必须一致。
  • 执行顺序

    • UNION ALL 以查询的书写顺序逐行合并结果,查询的顺序会直接影响最终的结果。

UNION ALL 的作用 

1. 合并结果集

UNION ALL 适合在明确不需要去重的情况下合并多个查询结果,例如:

SELECT 'Apple' AS Fruit FROM DUAL
UNION ALL
SELECT 'Banana' AS Fruit FROM DUAL;

结果:

Fruit
-----
Apple
Banana

2. 保留重复行

如果数据中存在重复行,并且需要完整保留(包括重复行),可以使用 UNION ALL

SELECT 'Apple' AS Fruit FROM DUAL
UNION ALL
SELECT 'Apple' AS Fruit FROM DUAL;

结果:

Fruit
-----
Apple
Apple

UNION 对比:

SELECT 'Apple' AS Fruit FROM DUAL
UNION
SELECT 'Apple' AS Fruit FROM DUAL;

结果:

Fruit
-----
Apple

3. 提高性能

由于 UNION ALL 不需要去重,因此在处理大量数据时比 UNION 性能更高。

SELECT employee_id, salary FROM employees
WHERE department_id = 10
UNION ALL
SELECT employee_id, salary FROM employees
WHERE department_id = 20;

UNION ALL 的使用场景

1. 日志或数据拼接

将多张日志表的记录合并为一个结果集:

SELECT log_id, log_date, log_message FROM log_table_2023
UNION ALL
SELECT log_id, log_date, log_message FROM log_table_2024;

2. 区分数据来源

通过额外的列标识数据来源:

SELECT '2023年数据' AS 来源, log_id, log_message
FROM log_table_2023
UNION ALL
SELECT '2024年数据' AS 来源, log_id, log_message
FROM log_table_2024;

3. 解决分区表查询

分区表的分区查询结果可以用 UNION ALL 合并:

SELECT * FROM sales PARTITION (Q1)
UNION ALL
SELECT * FROM sales PARTITION (Q2);

注意事项

  1. 结果集大小
    如果使用 UNION ALL 合并了大量重复行,可能会导致结果集变得非常庞大,占用更多的内存和存储。

  2. 列的兼容性
    合并的列需要有相同或兼容的数据类型,例如数值和字符类型不能直接混合。

  3. 排序需求
    如果需要对最终结果排序,应在最后的结果集使用 ORDER BY

SELECT column1 FROM table1
UNION ALL
SELECT column1 FROM table2
ORDER BY column1;

 性能对比:UNION vs UNION ALL

特性UNIONUNION ALL
是否去重
执行速度较慢(去重耗时)较快(直接合并)
内存占用较高(需要排序去重)较低(不需要排序)
结果是否包含重复行

 在创建视图中的作用

在 Oracle SQL 中,UNION ALL 可以在创建复杂视图时起到整合多个数据源的关键作用。通过合并多个查询结果并保留重复数据,UNION ALL 非常适用于需要从多张表、多个分区或不同来源数据中创建整合视图的场景。

以下是一些详细的举例和解析:

场景 1:合并多个表的数据到视图

假设有多个分区表存储了不同年份的销售数据,现在需要创建一个视图,将所有年份的销售数据整合为一个统一的视图。

表结构

每年的销售数据分别存储在以下分区表中:

  • sales_2022 (字段: sale_id, product_id, amount, sale_date)
  • sales_2023 (字段: sale_id, product_id, amount, sale_date)
目标

创建一个视图,能够统一访问所有年的销售数据。

SQL 实现
CREATE OR REPLACE VIEW all_sales AS
SELECT sale_id, product_id, amount, sale_date, '2022年' AS year_label
FROM sales_2022
UNION ALL
SELECT sale_id, product_id, amount, sale_date, '2023年' AS year_label
FROM sales_2023;

查询视图数据

SELECT * FROM all_sales WHERE product_id = 101;
解析
  1. 添加来源标识
    • 使用 '2022年' AS year_label'2023年' AS year_label 区分数据来源。
  2. 不去重
    • 因为不同年份的数据不重叠,无需去重,UNION ALLUNION 更高效。
  3. 动态扩展
    • 可以通过追加新的 SELECT 块来合并后续年份的数据,而不影响现有视图。

场景 2:合并不同类型的数据

假设公司有两种类型的员工记录:

  1. 正式员工存储在表 full_time_employees 中。
  2. 合同工存储在表 contract_employees 中。
表结构
  • full_time_employees (字段: employee_id, name, salary, hire_date, job_type 固定为 '正式员工')
  • contract_employees (字段: employee_id, name, salary, hire_date, job_type 固定为 '合同工')
目标

创建一个统一的视图,显示所有员工的数据,包括其身份类型。

SQL 实现

CREATE OR REPLACE VIEW all_employees AS
SELECT employee_id, name, salary, hire_date, '正式员工' AS job_type
FROM full_time_employees
UNION ALL
SELECT employee_id, name, salary, hire_date, '合同工' AS job_type
FROM contract_employees;

查询视图数据

SELECT * FROM all_employees WHERE salary > 5000 ORDER BY hire_date;
解析
  1. 不同来源的数据整合
    • 数据源表结构类似,UNION ALL 能轻松整合不同表的数据。
  2. 字段类型兼容
    • 列数和数据类型需一致,例如两个表中的 salary 均为数值类型。
  3. 性能优越
    • 使用 UNION ALL 避免去重操作,显著提升查询速度。

场景 3:合并分区数据

假设有一个大型分区表 sales 按季度存储数据(PARTITION BY),需要创建视图合并其中的 Q1 和 Q2 数据。

表结构
  • 分区表 sales (字段: sale_id, region, amount, sale_date)
    • 分区:Q1Q2Q3Q4
目标

创建视图只合并第一季度和第二季度的数据。

SQL 实现
CREATE OR REPLACE VIEW sales_h1 AS
SELECT * FROM sales PARTITION (Q1)
UNION ALL
SELECT * FROM sales PARTITION (Q2);

 查询视图数据

SELECT region, SUM(amount) AS total_sales
FROM sales_h1
GROUP BY region;

 解析

  1. 分区查询的整合
    • 使用 UNION ALL 按分区提取数据,避免全表扫描。
  2. 优化性能
    • 分区表与 UNION ALL 配合能够高效处理特定数据的整合。

场景 4:跨业务系统的数据合并

假设一家企业的 HR 和财务系统分别存储员工的基本信息和薪资信息,现在需要创建一个视图整合这两部分数据。

表结构
  • HR 系统:hr_employees (字段: employee_id, name, department, position)
  • 财务系统:finance_employees (字段: employee_id, name, salary, pay_date)
目标

创建视图合并员工的所有信息,保留重复行以便后续分析。

SQL 实现
CREATE OR REPLACE VIEW unified_employees AS
SELECT employee_id, name, department, position, NULL AS salary, NULL AS pay_date
FROM hr_employees
UNION ALL
SELECT employee_id, name, NULL AS department, NULL AS position, salary, pay_date
FROM finance_employees;

查询视图数据 

SELECT employee_id, name, MAX(salary) AS max_salary
FROM unified_employees
WHERE name IS NOT NULL
GROUP BY employee_id, name;
解析
  1. 字段对齐
    • 两个表字段不完全一致,使用 NULL 补齐不存在的列。
  2. 数据整合
    • 利用 UNION ALL 合并不同系统中的数据,方便后续在统一视图中分析。

场景 5:多条件动态数据组合

假设需要将客户的订单数据按照地区和时间分别进行合并,提供给不同的业务部门使用。

表结构
  • orders (字段: order_id, customer_id, region, order_date, amount)
目标

创建视图,分别合并北方和南方地区的数据,并按年份标识来源。

SQL 实现
CREATE OR REPLACE VIEW regional_orders AS
SELECT order_id, customer_id, region, order_date, amount, '北方' AS region_label
FROM orders
WHERE region IN ('北方')
UNION ALL
SELECT order_id, customer_id, region, order_date, amount, '南方' AS region_label
FROM orders
WHERE region IN ('南方');

查询视图数据

SELECT region_label, SUM(amount) AS total_sales
FROM regional_orders
WHERE order_date >= TO_DATE('2024-01-01', 'YYYY-MM-DD')
GROUP BY region_label;
解析
  1. 动态整合
    • 按条件动态分区和标记数据来源,方便后续业务使用。
  2. 聚合分析
    • 在视图基础上进行统计分析,减少重复查询复杂性。

总结

在复杂视图的创建中,UNION ALL 的作用可以总结为以下几点:

  1. 高效整合多数据源:适合合并大规模数据且无需去重的场景。
  2. 动态扩展性:轻松添加新的查询来源而不破坏视图。
  3. 保留数据完整性:不会丢失重复行,适合需要完整记录的分析场景。
  4. 优化性能:避免去重操作,处理速度快,特别是对大表或分区表的整合。

在设计复杂视图时,根据实际业务需求选择是否使用 UNION ALL,结合字段对齐、动态标识等方式,使视图更灵活高效!

UNION ALL 是 Oracle SQL 中非常实用的工具,尤其在以下情况下效果最佳:

  • 不需要去重时。
  • 数据量较大且对性能要求高时。
  • 需要保留重复数据时。

如需去重,请改用 UNION


http://www.ppmy.cn/news/1556996.html

相关文章

7 家使用量子计算的公司

劳斯莱斯、Deloitte、BASF、Roche、富士通、JPMorgan和宝马是率先开展量子计算实验的部分公司。 商用量子计算的实现仍需数年时间,但这并未阻止世界上一些知名企业对其进行试验。在许多情况下,利用当下有噪声的中等规模量子(NISQ&#xff09…

ACL-2024 | MapGPT:基于地图引导提示和自适应路径规划机制的视觉语言导航

作者: Jiaqi Chen, Bingqian Lin, Ran Xu, Zhenhua Chai, Xiaodan Liang, Kwan-Yee K. Wong, 单位: 香港大学,中山大学深圳校区,美团 原文链接:MapGPT: Map-Guided Prompting with Adaptive Path Planning for Visio…

跨站脚本攻击(XSS)可能存在的位置与实操演示

免责申明 本文仅是用于学习研究XSS攻击的原理,请勿用在非法途径上,若将其用于非法目的,所造成的一切后果由您自行承担,产生的一切风险和后果与笔者无关;本文开始前请认真详细学习《‌中华人民共和国网络安全法》【学法时习之丨网络安全在身边一图了解网络安全法_中央网络安…

量子通信学习路径(一)

量子通信是一门融合量子力学和通信技术的交叉学科,其核心目标是利用量子力学的特性(如叠加态和纠缠)实现信息传递和安全通信。以下是一个系统学习量子通信的完整大纲,从基础知识到实际应用逐步深入,帮助建立全面的知识…

JVM(Java虚拟机)分区详情

JVM(Java虚拟机)运行时数据区是Java虚拟机的内存管理模型,它包括了多个关键的内存区域,这些区域各自承担着不同的职责,共同支持着Java程序的运行。以下是JVM运行时数据区的详细介绍: 一、整体概述 JVM运行时数据区按照线程占用的情况可以分为两类:线程共享和线程独享。…

JavaEE 【知识改变命运】06 多线程进阶(1)

文章目录 锁一常见的锁乐观锁和悲观锁轻量级锁和重量级锁自旋锁和挂起等待锁读写锁和普通互斥锁公平锁和不公平锁可重入锁和不可重入锁sycnchroized是什么锁 CAS什么是CASCAS伪代码CSA是怎么实现的CAS如何保证线程安全的呢实现自旋锁JDK中提供的使用自旋锁的方式处理锁竞争CAS …

c++理解(三)

本文主要探讨c相关知识。 模板是对类型参数化 函数模板特化不是模板函数重载 allocator(空间配置器):内存开辟释放,对象构造析构 优先调用对象成员方法实现的运算符重载函数,其次全局作用域找 迭代器遍历访问元素,调用erase,insert方法后,当前位置到容器…

Guava 库中的 `Multiset` 是一个允许元素重复的集合

Guava 库中的 Multiset 是一个允许元素重复的集合。它继承自 Collection 接口,提供了额外的方法来处理元素的计数。以下是一些使用 Guava Multiset 的基本代码示例: 引入 Guava 库 首先,确保你的项目中已经添加了 Guava 库的依赖。如果你使…