MySQL 中如何进行 SQL 调优?

embedded/2025/1/26 14:49:55/

重点

平时进行 SQL 调优,主要是通过观察慢 SQL,然后利用 explain 分析查询语句的执行计划,识别性能瓶颈,优化查询语句。

1) 合理设计索引,利用联合索引进行覆盖索引的优化,避免回表的发生,减少一次查询和随机 I/O

  • 回表:索引无法满足查询所需的所有列数据,需要回到主表获取额外的数据。
  • 避免回表:创建覆盖索引(索引包含了查询所需的所有列),让查询可以直接从索引中获取所有数据,无需访问主表。

例子:

建表和建立索引:

sql">CREATE TABLE user (id INT PRIMARY KEY,name VARCHAR(50),age INT,gender CHAR(1),city VARCHAR(50)
);
CREATE INDEX idx_name_age_gender ON user(name, age, gender);  
  • 建立了联合索引:nameagegender

若执行SELECT city FROM user WHERE name = 'John' AND age = 25; 因为 select 需要 返回city。 索引中没有city列的数据,还需要根据索引条目中包含的主键信息(虽然例子中没有显式指定,但通常索引会包含指向主键的指针)回到 user 表的主键索引中,去查找完整的行数据,这个“回到主表查找 city 列”的过程就是回表

2) 避免 SELECT *,只查询必要的字段

3) 避免在 SQL 中进行函数计算等操作,使得无法命中索引

4) 避免使用 %LIKE,导致全表扫描

5) 注意联合索引需满足最左匹配原则

解释最左匹配原则:最左匹配原则是指在使用联合索引时,必须按照索引的顺序从左到右使用,不能跳过索引中的列。
1. SQL 实战理解 最左匹配原则
建表语句:假设我们有一个用户订单表,包含用户ID、订单日期和订单金额三个字段,我们对这三个字段创建一个联合索引。

sql">CREATE TABLE user_orders (id INT AUTO_INCREMENT PRIMARY KEY,user_id INT,order_date DATE,order_amount DECIMAL(10,2),INDEX idx_user_date_amount (user_id, order_date, order_amount)
);

Python脚本生成测试数据:

from datetime import datetime, timedelta
import random# 生成INSERT语句
def generate_insert_statements():start_date = datetime(2023, 1, 1)statements = []for _ in range(4200):user_id = random.randint(1, 1000)days = random.randint(0, 365)order_date = (start_date + timedelta(days=days)).strftime('%Y-%m-%d')order_amount = round(random.uniform(10.0, 1000.0), 2)insert_sql = f"INSERT INTO user_orders (user_id, order_date, order_amount) VALUES ({user_id}, '{order_date}', {order_amount});"statements.append(insert_sql)# 将所有INSERT语句写入文件with open('insert_data.sql', 'w') as f:f.write('\n'.join(statements))print("INSERT语句已生成到 insert_data.sql 文件中")if __name__ == "__main__":generate_insert_statements()

测试不同查询场景:

-- 完全满足最左匹配原则(使用全部索引列)
EXPLAIN SELECT * FROM user_orders 
WHERE user_id = 100 AND order_date = '2023-05-01' AND order_amount = 500;

在这里插入图片描述

-- 满足最左匹配原则(使用索引的前两列)
EXPLAIN SELECT * FROM user_orders 
WHERE user_id = 100 AND order_date = '2023-05-01';

explain 结果:
满足最左匹配原则

-- 满足最左匹配原则(只使用第一列)
EXPLAIN SELECT * FROM user_orders 
WHERE user_id = 100;

explain 结果:
满足最左匹配原则

-- 不满足最左匹配原则(跳过`user_id`)
EXPLAIN SELECT * FROM user_orders 
WHERE order_date = '2023-05-01' AND order_amount = 500;

explain 结果:
不满足最左匹配原则

-- 不满足最左匹配原则(只使用order_date)
EXPLAIN SELECT * FROM user_orders 
WHERE order_date = '2023-05-01';

explain 结果:
不满足最左匹配原则

-- 不满足最左匹配原则(只使用order_amount)
EXPLAIN SELECT * FROM user_orders 
WHERE order_amount = 500;

explain 结果:
不满足最左匹配原则

  • 从上述explain 的结果看出,不满足最左匹配原则,filitered 都很低。

6) 不要对无索引字段进行排序操作

  1. 强制使用文件排序(filesort):
    当对无索引字段排序时,MySQL无法利用索引的有序性,必须将数据加载到内存中进行排序,这就是filesort,filesort是一个非常耗费资源的操作。

  2. 内存开销大
    如果排序数据量小,MySQL会在内存中完成排序,如果数据量超过sort_buffer_size,会发生磁盘文件排序,磁盘排序涉及临时文件的创建和多次IO,性能更差!

SQL实战演示

sql">-- 创建测试表
CREATE TABLE worker(id INT AUTO_INCREMENT PRIMARY KEY,name VARCHAR(50),salary DECIMAL(10,2),department VARCHAR(50),INDEX idx_salary (salary)  -- 只对salary创建索引
);-- 插入测试数据
INSERT INTO worker(name, salary, department) VALUES
('张三', 5000, '技术部'),
('李四', 6000, '市场部'),
('王五', 4500, '技术部'),
('赵六', 7000, '销售部');
sql">-- 会使用索引排序的情况:
-- 只查询索引列
SELECT salary FROM employees ORDER BY salary;
-- 或者
SELECT id, salary FROM employees ORDER BY salary;
-- 结果显示: Using index for order by

在这里插入图片描述

sql">会导致filesort的情况:
-- 特例:查询所有列(SELECT *)
SELECT * FROM employees ORDER BY salary;

在这里插入图片描述

  • 当使用SELECT *时,需要回表获取所有列的数据,这种情况下,MySQL认为使用索引排序的成本比filesort更高。
sql">-- 对无索引的department字段排序
EXPLAIN SELECT * FROM employees ORDER BY department;
-- 结果显示: Using filesort

在这里插入图片描述

7) 连表查询需要注意不同字段的字符集是否一致,否则也会导致全表扫描

除此之外,还可以利用缓存来优化,一些变化少或者访问频繁的数据设置到缓存中,减轻数据库的压力,提升查询的效率。

还可以通过业务来优化,例如少展示一些不必要的字段,减少多表查询的情况,将列表查询替换成分页分批查询等等。


http://www.ppmy.cn/embedded/157162.html

相关文章

双写+灰度发布:高并发场景下的维度表拆分零事故迁移实践

目录 0 文章摘要 1业务场景描述 2 迁移及实施过程 2.1 拆分设计与数据探查 2.1 历史数据迁移(全量) 2.3 增量数据同步(双写过渡) 2.4.业务切换验证 2.5 回滚预案 2.6 成果与收益 3 关键经验总结 往期回顾 专栏优势&am…

Redis-缓存

1.缓存 1.1 什么是缓存? 越野车,山地自行车,都拥有"避震器",防止车体加速后因惯性,在酷似"U"字母的地形上飞跃,硬着陆导致的损害,像个弹簧一样;同样,实际开发中,系统也需要"避震器",防止过高的数据访问猛冲系统,导致其操作线程无法…

数据结构day02

1 线性表的定义和基本操作 1.1 线性表的定义 分析: 1.1.1 问题一:我们为什么探讨线性表的定义和基本操作 在研究数据结构时,需要重点关注三个方面:逻辑结构、物理结构以及数据的运算。在本节内容里,我们首先来介绍线…

深入探讨:如何在 Debian 系统中实施有效的安全配置

深入探讨:如何在 Debian 系统中实施有效的安全配置 在如今的网络环境中,服务器的安全配置已经成为每个运维工程师的必备技能。无论是个人网站还是企业应用,确保服务器的安全性都是至关重要的。作为一名运维领域的自媒体创作者,我将分享一些在 Debian 系统中实施安全配置的…

2025美赛数学建模B题 管理可持续旅游业保姆级教程讲解|模型讲解

2025 MCM 问题 B:管理可持续旅游业 为了构建一个详细的数学模型来实现Juneau可持续旅游业的优化,我们可以采用以下步骤来分析和制定策略。我们将通过几个关键因素来分析:游客数量、总体收入、基础设施压力和环境保护措施等,并结合…

亚博microros小车-原生ubuntu支持系列:6-整体检测

前面迁移了手部检测:亚博microros小车-原生ubuntu支持系列:4-手部检测-CSDN博客 亚博microros小车-原生ubuntu支持系列:5-姿态检测-CSDN博客 本篇迁移整体检测。 结合前两节的内容,本节例程实现即可检测手掌也可检测人体的功能…

20250122-正则表达式

1. 正则标记 表示一位字符:\\ 表示指定的一位字符:x 表示任意的一位字符:. 表示任意一位数字:\d 表示任意一位非数字:\D 表示任意一个字母:[a-zA-Z](大写或小写) 表示任意一个…

【开源免费】基于SpringBoot+Vue.JS智慧图书管理系统(JAVA毕业设计)

本文项目编号 T 152 ,文末自助获取源码 \color{red}{T152,文末自助获取源码} T152,文末自助获取源码 目录 一、系统介绍二、数据库设计三、配套教程3.1 启动教程3.2 讲解视频3.3 二次开发教程 四、功能截图五、文案资料5.1 选题背景5.2 国内…