Oracle 中什么情况下 可以使用 EXISTS 替代 IN 提高查询效率

embedded/2024/12/20 8:05:20/

为什么 EXISTS 更高效?

EXISTS 提前终止:

     EXISTS 一旦在子查询中找到第一个匹配项,就会立即返回 TRUE,不再继续扫描子查询中的其他记录。IN 必须扫描整个子查询的结果集,将所有结果与主查询的每一行进行对比。

大数据集性能差异大:

     当子查询的数据集很大(如几万到几百万行)时,EXISTS 的提前终止特性会显著减少不必要的扫描。IN 在子查询中会生成临时结果集,这会导致更多的内存占用和性能开销。

🚀 EXISTS 替换 IN 的写法

IN 的原始写法:

SELECT * 
FROM employees e 
WHERE e.department_id IN ( SELECT d.department_id FROM departments d WHERE d.department_name = 'SALES'
);

这段 SQL 查询的逻辑是,查询部门名为 ‘SALES’ 的所有员工。
这里的 IN 先生成一个临时结果集(d.department_id),并与 e.department_id 进行对比。

🔄 使用 EXISTS 替换 IN

SELECT * 
FROM employees e 
WHERE EXISTS ( SELECT 1 FROM departments d WHERE d.department_name = 'SALES' AND d.department_id = e.department_id
);

这段 SQL 查询的逻辑是等价的。
不同点在于:

EXISTS 只要找到一个匹配项(d.department_id = e.department_id)就返回 TRUE,这时主查询中的这条 e 记录就被返回。
子查询中的 SELECT 1,实际上只要返回一行数据就能满足 EXISTS 条件,不需要返回字段值。

⚙️ EXISTS 和 IN 的区别

区别点INEXISTS
子查询结果生成子查询的完整结果集只要找到一个匹配的值就立即返回
子查询数据量适用于小数据集适用于大数据集
效率扫描整个子查询的结果集提前终止,效率高
关联条件主表的每一行与子查询的结果集比较子查询的条件与主表的每一行比较
内存使用子查询的结果集可能存储在临时表中不生成临时表,减少内存开销
索引利用索引不一定有效,可能全表扫描更容易利用索引

🔥 何时使用 EXISTS 替换 IN?

场景推荐使用方式原因
子查询返回大数据量EXISTS子查询中数据大,EXISTS 可以提前终止
子查询返回小数据量IN子查询小数据集,IN 性能也很好
子查询包含 NULL 值EXISTSIN 会因为 NULL 导致结果不匹配
主表数据多EXISTS主表数据多,EXISTS 在行对比上更高效
子查询不依赖主表IN如果子查询不依赖主表,IN 更清晰
子查询依赖主表EXISTS描子查询依赖主表的字段,EXISTS 更高效

🔍 示例 1:替代 IN 的常用场景

原始 SQL (使用 IN):

SELECT e.employee_name 
FROM employees e 
WHERE e.department_id IN (SELECT d.department_id FROM departments d WHERE d.department_name LIKE 'SALES%'
);

替换为 EXISTS:

SELECT e.employee_name 
FROM employees e 
WHERE EXISTS (SELECT 1 FROM departments d WHERE d.department_name LIKE 'SALES%' AND d.department_id = e.department_id
);

🔍 示例 2:避免 NULL 值的坑

原始 SQL (使用 IN):

SELECT * 
FROM employees e 
WHERE e.department_id IN (SELECT d.department_id FROM departments d WHERE d.department_name = 'SALES'
);

替换为 EXISTS:

SELECT * 
FROM employees e 
WHERE EXISTS (SELECT 1 FROM departments d WHERE d.department_name = 'SALES' AND d.department_id = e.department_id
);

🔍 示例 3:子查询依赖主表的场景

原始 SQL (使用 IN):

SELECT * 
FROM orders o 
WHERE o.customer_id IN (SELECT c.customer_id FROM customers c WHERE c.customer_type = o.customer_type
);

替换为 EXISTS:

SELECT * 
FROM orders o 
WHERE EXISTS (SELECT 1 FROM customers c WHERE c.customer_type = o.customer_type AND c.customer_id = o.customer_id
);

💡 总结

场景推荐使用
子查询返回大结果集EXISTS
子查询不依赖主表字段IN
子查询可能返回 NULLEXISTS
子查询依赖主表字段EXISTS
子查询小、主表大EXISTS
主表小、子查询大EXISTS

🚀 小结

  • EXISTS 在数据集较大时性能更高,尤其是子查询的返回数据量较大或包含 NULL 时。
  • EXISTS 避免了 IN 的“NULL 陷阱”,更安全。
  • 当子查询依赖主表的字段时,EXISTS 比 IN 更高效,因为不需要生成中间结果集。
  • EXISTS 可以提前终止子查询,在数据量较大时,性能优势更明显。

http://www.ppmy.cn/embedded/147224.html

相关文章

WebRTC服务质量(04)- 重传机制(01) RTX NACK概述

WebRTC服务质量(01)- Qos概述 WebRTC服务质量(02)- RTP协议 WebRTC服务质量(03)- RTCP协议 WebRTC服务质量(04)- 重传机制(01) RTX NACK概述 WebRTC服务质量(…

智能光学计算成像技术与应用

智能光学计算成像是一个将人工智能(AI)与光学成像技术相结合的前沿领域,它通过深度学习、光学神经网络、超表面光学(metaphotonics)、全息技术和量子光学等技术,推动光学成像技术的发展。以下是智能光学计算…

springcloud-gateway获取应用响应信息乱码

客户端通过springcloud gateway跳转访问tongweb上的应用,接口响应信息乱码。使用postman直接访问tongweb上的应用,响应信息显示正常。 用户gateway中自定义了实现GlobalFilter的Filter类,在该类中获取了上游应用接口的响应信息,直…

BlueLM:以2.6万亿token铸就7B参数超大规模语言模型

一、介绍 BlueLM 是由 vivo AI 全球研究院自主研发的大规模预训练语言模型,本次发布包含 7B 基础 (base) 模型和 7B 对话 (chat) 模型,同时我们开源了支持 32K 的长文本基础 (base) 模型和对话 (chat) 模型。 更大量的优质数据 :高质量语料…

推动数字金融高质量发展行动方案之数据安全解读

一、《方案》中的数据安全要求 2024年11月27日,中国人民银行等七部门联合印发《推动数字金融高质量发展行动方案》(以下简称《方案》),明确提出系统推进金融机构数字化转型、运用数字技术提升重点领域金融服务质效、夯实数字金融发展基础、完善数字金融治理体系等方面的重…

网络安全(4)_网络层安全IPSec

5. 网络层安全IPSec 5.1 IPSec协议 (1)前面使用Outlook进行数字签名和数字加密是应用层实现的安全。安全套接字实现的安全是在应用层和传输层之间插入了一层来实现数据通信安全。而IPSec是网络层实现的安全。不需要应用程序的支持,只要配置…

使用 Puppeteer 快速上手 Node.js 爬虫

使用 Puppeteer 库通过自动化浏览器来访问百度图片搜索,并在搜索结果中下载图片。代码分为两部分: 自动化浏览器任务:使用 Puppeteer 浏览百度图片搜索并获取图片 URL。图片下载:检查图片 URL 类型(base64 或 URL&…

arcgisPro将面要素转成CAD多段线

1、说明:正常使用【导出为CAD】工具,则导出的是CAD三维多线段,无法进行编辑操作、读取面积等。这是因为要素面中包含Z值,导出则为三维多线段数据。需要利用【复制要素】工具禁用M值和Z值,再导出为CAD,则得到…