1、索引
1.1、概念
索引相当于一种特殊文件,包含着对数据表里所有记录的引用指针。可以对表中的一列或多列创建索引,并指定索引类型,各类索引各自的结构实现。
1.2、作用
*通俗来讲,索引就相当于是我们的书本目录,为了提高查询效率
*索引本身也要占用一定的存储空间,就像书本目录也要占页数一样,也要组织数据
*通过索引可以快速定位目标记录的位置
1.3、使用场景
要考虑对数据库表的某列或某几列创建索引,需要考虑一下几点:
*数据量比较大,且经常对这些列进行条件查询。
*该数据库表的插入操作,及对这些列的修改操作频率较低。
*索引会占用额外的磁盘空间
满足以上条件时,考虑对表中的这些字段创建索引,以提高查询效率。
反之,如果非条件查询列,或经常做修改、插入操作,或磁盘空间不足时,不考虑创建索引
1.4、使用
创建主键约束(PRIMARY KEY)、唯一约束(UNIQUE)、外键约束(FOREIGN KEY)时,会自动创建对应列的索引
*查看索引
show index from 表名;
示例:查看学生表已有的索引
show index from student;
*创建索引
对于非主键、非唯一约束、非外键的字段,可以创建普通索引
create index 索引名 on 表名(字段名);
示例:创建班级表中,name字段的索引
create index idex_classes_name on classes(name);
*删除索引
drop index 索引名 on 表名;
示例:删除班级表中的name字段的索引
drop index idex_classes_name on classes;
1.5、示例
-- 创建用户表
DROP TABLE IF EXISTS test_user;
CREATE TABLE test_user (
id_number INT,
name VARCHAR(20) comment '姓名',
age INT comment '年龄',
create_time timestamp comment '创建日期'
);
准备测试数据,批量插入用户数据(操作耗时较长大约十分钟+)
-- 构建一个8000000条记录的数据
-- 构建的海量表数据需要有差异性,所以使用存储过程来创建, 拷贝下面代码就可以了,暂时不用理解
-- 产生名字
drop function if exists rand_name;
delimiter $$
create function rand_name(n INT, l INT)
returns varchar(255)
begin
declare return_str varchar(255) default '';
declare i int default 0;
while i < n do
if i=0 then
set return_str = rand_string(l);else
set return_str =concat(return_str,concat(' ', rand_string(l)));
end if;
set i = i + 1;
end while;
return return_str;
end $$
delimiter ;
-- 产生随机字符串
drop function if exists rand_string;
delimiter $$
create function rand_string(n INT)
returns varchar(255)
begin
declare lower_str varchar(100) default
'abcdefghijklmnopqrstuvwxyz';
declare upper_str varchar(100) default
'ABCDEFJHIJKLMNOPQRSTUVWXYZ';
declare return_str varchar(255) default '';
declare i int default 0;
declare tmp int default 5+rand_num(n);
while i < tmp do
if i=0 then
set return_str
=concat(return_str,substring(upper_str,floor(1+rand()*26),1));
else
set return_str
=concat(return_str,substring(lower_str,floor(1+rand()*26),1));
end if;
set i = i + 1;
end while;
return return_str;
end $$
delimiter ;
-- 产生随机数字
drop function if exists rand_num;
delimiter $$
create function rand_num(n int)
returns int(5)
begin
declare i int default 0;
set i = floor(rand()*n);
return i;
end $$
delimiter ;
-- 向用户表批量添加数据
drop procedure if exists insert_user;
delimiter $$
create procedure insert_user(in start int(10),in max_num int(10))
begin
declare i int default 0;
set autocommit = 0;
repeat
set i = i + 1;insert into test_user values ((start+i) ,rand_name(2,
5),rand_num(120),CURRENT_TIMESTAMP);
until i = max_num
end repeat;
commit;
end $$
delimiter ;
-- 执行存储过程,添加8000000条用户记录
call insert_user(1, 8000000);
查询id_number为778899的用户信息
-- 耗时较长3.75s
select * from test_user where id_number=778899;
可以使用explain来进行查看SQL的执行
explain select * from test_user where id_number=778899;
为提供查询速度,创建id_number字段的索引
create index idx_test_user_id_number on test_user(id_number);
换一个身份证号查询,并比较执行时间
select * from test_user where id_number=556677;
这样加入了索引之后,查询效率就会大大提高
使用explain来进行查看SQL的执行
explain select * from test_user where id_number=556677;