MySQL 中如何解决深度分页的问题? MySQL中 join、inner join、left join、right join区别

news/2025/3/1 19:31:13/

MySQL 中如何解决深度分页的问题?

在 MySQL 中解决深度分页问题的核心思路是减少扫描的数据量,尤其是避免通过 LIMIT offset, size 导致的大范围数据扫描。以下是三种优化方法及其原理、适用场景和注意事项:


1. 子查询 + 覆盖索引(延迟关联)

原理

  • 先通过覆盖索引(如二级索引 (name, id))快速定位目标页的起始 id,再通过主键索引回表查询数据。
  • 子查询只需扫描二级索引,体积小且有序,能高效跳过 offset 行,获取起始 id
  • 主查询通过 id >= [子查询结果] 直接定位数据,避免全表扫描。

示例 SQL

SELECT * FROM mianshiya 
WHERE name = 'yupi' AND id >= (SELECT id FROM mianshiya WHERE name = 'yupi' ORDER BY id LIMIT 99999990, 1
)
ORDER BY id LIMIT 10;

或使用 JOIN 优化:

SELECT * FROM mianshiya 
INNER JOIN (SELECT id FROM mianshiya WHERE name = 'yupi' ORDER BY id LIMIT 99999990, 10
) AS tmp ON mianshiya.id = tmp.id;

关键点

  • 必须创建联合索引 (name, id),确保子查询直接利用索引有序性,避免临时排序(filesort)。
  • 主查询的 name 条件可省略(若子查询结果 id 对应的 name 必为 'yupi'),但需权衡数据变更风险。

2. 记录最大 ID(游标分页)

原理

  • 每次分页返回当前页的最大 id,下页查询时通过 WHERE id > max_id LIMIT size 跳过已读数据。
  • 仅扫描目标数据(size 行),时间复杂度稳定为 O(size),性能极佳。

适用场景

  • 连续分页(如“下一页”),不支持随机跳页。
  • 数据按主键或有序字段分页(如 ORDER BY id)。

示例 SQL

-- 第一页
SELECT * FROM mianshiya WHERE name = 'yupi' ORDER BY id LIMIT 10;
-- 后续页(假设上一页最大 id 为 100)
SELECT * FROM mianshiya WHERE name = 'yupi' AND id > 100 ORDER BY id LIMIT 10;

注意事项

  • 若数据删除或新增可能导致少量重复或遗漏,需业务容忍。
  • 需前端配合传递 max_id,不可直接跳页。

3. Elasticsearch 优化

原理

  • 将数据同步到 Elasticsearch,利用其分布式特性加速搜索。
  • 通过 search_after 参数实现游标分页,类似记录 max_id 方法,避免深分页性能问题。

ES 分页示例

{"query": { "match": { "name": "yupi" } },"sort": [{ "id": "asc" }],"size": 10,"search_after": [100]  -- 上一页最后一条记录的排序值
}

ES 注意事项

  • 默认限制 from + size <= 10000,深度分页需改用 search_afterscroll
  • search_after 需基于唯一排序字段,且仅支持连续分页。

其他优化思路

  • 业务限制:禁止深度跳页(如最多展示前 100 页)。
  • 预计算分页位置:按时间或分段存储分页起始 ID(如每 1000 页记录一个起始 ID)。
  • 分区表:按时间或范围分区,减少单次扫描数据量。

总结

方法优点缺点适用场景
子查询 + 覆盖索引支持跳页,通用性强依赖联合索引设计需频繁分页且允许跳页
记录最大 ID性能最优,复杂度低仅支持连续分页连续分页(如瀑布流)
Elasticsearch适合复杂搜索,分布式性能好维护成本高,ES 需额外学习高并发搜索+分页场景

核心要点

  • 索引设计是优化基础,确保覆盖索引和排序字段匹配。
  • 权衡业务需求,优先选择游标分页(记录 max_id)或延迟关联(子查询)。
  • 搜索引擎适用于复杂查询,但引入额外组件需评估成本。

MySQL中 join、inner join、left join、right join区别

在 MySQL 中,JOIN 操作用于将多个表中的数据关联起来。以下是 INNER JOINLEFT JOINRIGHT JOIN 的核心区别和用法总结,帮助你快速分清它们:


1. INNER JOIN(内连接)

  • 作用:只返回两个表中完全匹配的行。

  • 结果:仅包含两个表中都存在关联键值的行。

  • 语法

    SELECT * 
    FROM 表A
    INNER JOIN 表B ON 表A.= 表B.;
    
  • 示例

    • 表A(员工表)和表B(部门表)通过 department_id 关联。
    • 结果:只显示有部门的员工信息,无部门无员工的数据会被过滤掉。

2. LEFT JOIN(左外连接)

  • 作用:返回左表(LEFT JOIN 左侧的表)的所有行,即使右表没有匹配。

  • 结果:左表所有数据 + 右表匹配的数据(无匹配时右表字段为 NULL)。

  • 语法

    SELECT * 
    FROM 表A
    LEFT JOIN 表B ON 表A.= 表B.;
    
  • 示例

    • 表A(员工表)LEFT JOIN 表B(部门表)。
    • 结果:显示所有员工信息,即使员工没有部门(部门字段为 NULL)。

3. RIGHT JOIN(右外连接)

  • 作用:返回右表(RIGHT JOIN 右侧的表)的所有行,即使左表没有匹配。

  • 结果:右表所有数据 + 左表匹配的数据(无匹配时左表字段为 NULL)。

  • 语法

    SELECT * 
    FROM 表A
    RIGHT JOIN 表B ON 表A.= 表B.;
    
  • 示例

    • 表A(员工表)RIGHT JOIN 表B(部门表)。
    • 结果:显示所有部门信息,即使部门没有员工(员工字段为 NULL)。

4. JOIN(默认是 INNER JOIN)

  • 说明:在 MySQL 中,直接写 JOIN 等价于 INNER JOIN

    SELECT * 
    FROM 表A
    JOIN 表B ON 表A.= 表B.; -- 等同于 INNER JOIN
    

对比总结

类型行为适用场景
INNER JOIN仅返回两个表匹配的行需要精确匹配的数据(如订单和商品)
LEFT JOIN返回左表全部数据 + 右表匹配的数据(右表无匹配则为 NULL保留左表全部数据(如所有员工信息)
RIGHT JOIN返回右表全部数据 + 左表匹配的数据(左表无匹配则为 NULL保留右表全部数据(如所有部门信息)

关键注意事项

  1. 方向性LEFT JOINRIGHT JOIN 的方向取决于表的书写顺序。
    • LEFT JOIN 以左表为主,RIGHT JOIN 以右表为主。
  2. 过滤条件
    • LEFT JOIN 中,若在 WHERE 子句中对右表字段过滤(如 WHERE 表B.键 IS NULL),会筛选出仅存在于左表但右表无匹配的行。
  3. 性能
    • INNER JOIN 通常效率更高,因为它涉及的数据量更小。
    • LEFT/RIGHT JOIN 可能因处理 NULL 值而略慢,尤其是在大表中。

示例演示

数据准备
-- 员工表(employees)
+-------------+-------+---------------+
| employee_id | name  | department_id |
+-------------+-------+---------------+
| 1           | 张三  | 101           |
| 2           | 李四  | 102           |
| 3           | 王五  | NULL          |
+-------------+-------+---------------+-- 部门表(departments)
+---------------+-----------------+
| department_id | department_name |
+---------------+-----------------+
| 101           | 技术部          |
| 102           | 市场部          |
| 103           | 财务部          |
+---------------+-----------------+
查询结果对比
  1. INNER JOIN(匹配数据):

    SELECT * 
    FROM employees
    INNER JOIN departments ON employees.department_id = departments.department_id;
    

    结果

    | 1 | 张三 | 101 | 101 | 技术部 |
    | 2 | 李四 | 102 | 102 | 市场部 |
    
  2. LEFT JOIN(保留所有员工):

    SELECT * 
    FROM employees
    LEFT JOIN departments ON employees.department_id = departments.department_id;
    

    结果

    | 1 | 张三 | 101 | 101 | 技术部 |
    | 2 | 李四 | 102 | 102 | 市场部 |
    | 3 | 王五 | NULL| NULL| NULL   | -- 员工无部门,右表字段为 NULL
    
  3. RIGHT JOIN(保留所有部门):

    SELECT * 
    FROM employees
    RIGHT JOIN departments ON employees.department_id = departments.department_id;
    

    结果

    | 1 | 张三 | 101 | 101 | 技术部 |
    | 2 | 李四 | 102 | 102 | 市场部 |
    | NULL| NULL| NULL| 103 | 财务部 | -- 部门无员工,左表字段为 NULL
    

总结

  • INNER JOIN:精确匹配,适合需要严格关联的场景。
  • LEFT JOIN:保留左表全部数据,适合主从表查询(如“所有员工及其部门”)。
  • RIGHT JOIN:保留右表全部数据,使用较少(通常用 LEFT JOIN 调换表顺序替代)。

http://www.ppmy.cn/news/1575848.html

相关文章

江协科技/江科大-51单片机入门教程——P[1-1] 课程简介P[1-2] 开发工具介绍及软件安装

本教程也力求在玩好单片机的同时了解一些计算机的基本概念&#xff0c;了解电脑的一些基本操作&#xff0c;了解电路及其元器件的基本理论&#xff0c;为我们学习更高级的单片机&#xff0c;入门IT和信息技术行业&#xff0c;打下一定的基础。 目录 1.课程简介 2.开发工具及…

将VsCode变得顺手好用(1

目录 设置中文 配置调试功能 提效和增强相关插件 主题和图标相关插件 创建js文件 设置中文 打开【拓展】 输入【Chinese】 下载完成后重启Vs即可变为中文 配置调试功能 在随便一个位置新建一个文件夹&#xff0c;用于放置调试文件以及你未来写的代码&#xff0c;随便命名但…

六、索引优化实战案例

索引优化实战案例&#xff1a;电商商品查询优化 一、模拟数据环境 1. 创建测试表 -- 创建商品表&#xff08;无索引&#xff09; CREATE TABLE products (id INT PRIMARY KEY AUTO_INCREMENT,name VARCHAR(255),category VARCHAR(50),price DECIMAL(10,2),stock INT,created…

(学习总结27)Linux工具:软件包管理器 yum、apt 和常用软件包下载安装介绍

Linux工具&#xff1a;软件包管理器 yum、apt 和常用软件包下载介绍 软件包管理器概念Linux 下载软件包的过程Linux 命令行中执行 yum安装软件包命令 yum install删除软件包命令 yum remove更新软件包命令 yum update搜索软件包命令 yum search查看软件包信息命令 yum info清理…

【三维分割】LangSplat: 3D Language Gaussian Splatting(CVPR 2024 highlight)

论文&#xff1a;https://arxiv.org/pdf/2312.16084 代码&#xff1a;https://github.com/minghanqin/LangSplat 文章目录 一、3D language field二、回顾 Language Fields的挑战三、使用SAM学习层次结构语义四、Language Fields 的 3DGS五、开放词汇查询&#xff08;Open-voca…

常用的 pip 命令

pip 是 Python 的包管理工具&#xff0c;可用于安装、卸载、更新和管理 Python 包。以下是一些常用的 pip 命令&#xff1a; 1. 安装包 安装最新版本的包 pip install package_namepackage_name 是你要安装的 Python 包的名称&#xff0c;例如 pip install requests 可以安装…

Java 连接 Redis 的两种方式

今天带来一期&#xff1a;Java通过两种方式连接Redis&#xff0c;如果大家对于除本内容外的疑问无法解答&#xff0c;可以私信找我&#xff0c;我来帮大家解决。 前言 Redis 是一种高性能的键值存储数据库&#xff0c;广泛应用于缓存、消息队列、会话存储等场景。Java 作为一门…