开发规范（一）：Mysql篇

1. 流程

数据库表结构的修改需要相关人员和Leader一起评审，保证符合涉及规范。

不允许使用root账号，所有开发和测试应当分配指定账号，并授予最小数据库权限

2. 数据库与表规范

表命名规范

常规表表名以 t_开头，t 代表 table 的意思，命名规则即 「t + 模块（包含模块含义的简写）+ 表（包含表含义的简写）」，比如用户模块的教育信息表：t_user_eduinfo。
临时表（RD、QA 或 DBA 同学用于数据临时处理的表），命名规则： 「temp 前缀+模块+表+日期后缀」：temp_user_eduinfo_20210719
备份表（用于保存和归档历史数据或者作为灾备恢复的数据）命名规则， 「bak 前缀+模块+表+日期后缀」：bak_user_eduinfo_20210719
区分位: iz_* [String(1)] 1表示是 0表示否，（禁用 is_,代码生成实体有问题 )
状态位: *_status [String(1-2)] 状态字段必须加注释说明每个值代表含义
同一个模块的表尽可能使用相同的前缀，表名称尽可能表达含义
多个单词以下划线 _ 分隔
常规表表名尽量不超过 30 个字符，temp 表和 bak 表视情况而定，也尽量简短为宜，命名应使用小写

数据库对象设计规范

字符集统一使用 utf8mb4,排序 utf8mb4_general_ci
不允许使用视图、存储过程、触发器
数据库引擎统一 innodb
模块划分和代码中业务模块一致

表设计规范

不要使用外键
表必须有主键，设置为varchar(64)，唯一
表必须有create_time(timestamp)字段
表必须有update_time(timestamp)字段
禁止使用复杂类型，json使用要看情况
「需要json连接的字段，类型必须一致，防止隐式转换」
严禁使用分区表
单表字段数不要太多，建议最多不要大于50个。过度的宽表对性能也是很大的影响。
MySQL在处理大表时，性能就开始明显降低，所以建议单表物理大小限制在16GB，表中数据行数控制在2000W内。^[业内的规则是超过2000W性能开始明显降低。但是这个值是灵活的，你可以根据实际情况进行测试来判断，比如阿里的标准就是500W，百度的确是2000W。实际上是否宽表，单行数据所占用的空间都有起到作用的。

] 10. 表字段注释，每个字段必须设置注释说明; 11. 表字段注释，状态类型的字段必须说明取值规则（比如性别sex取值规则）

3. 字段规范

字段命名规范

字段命名需要表示其实际含义的英文单词或简写， 「单词之间用下划线 _ 进行连接」，如 service_ip、service_port。
「各表之间相同意义的字段必须同名」，比如 a 表和 b 表都有创建时间，应该统一为 create_time，不一致会很混乱。
多个单词以下划线 _ 分隔
字段名尽量不超过 30 个字符， 「命名应该使用小写」

字段设计规范

「对于精确浮点型数据存储，需要使用DECIMAL」，严禁使用FLOAT和DOUBLE
禁止使用TEXT、BLOG字段，特殊情况除外
「字段使用NOT NULL属性」，可用默认值代替NULL
区分、状态、类型字段，尽量用String类型，避免数字类型的一些问题
字段默认值（字段尽量不设置默认值，采用编码方式加默认值）
逻辑删除字段，del_flag [int(1)]，1表示删除 0表示未删除，可选择加
乐观锁字段， update_count[Integer]，可选择加

4. 索引规范

索引命名规范

唯一索引使用 「uni + 字段名」 来命名：create unique index uni_uid on t_user_basic(uid) 。
非唯一索引使用 「idx + 字段名」 来命名：create index idx_uname_mobile on t_user_basic(uname,mobile) 。
多个单词以 「下划线 _ 分隔」。
索引名尽量不超过50个字符，命名应该使用小写，组合索引的字段不宜太多，不然也不利于查询效率的提升。
多单词组成的列名，取尽可能代表意义的缩写，如 test_contact表member_id和friend_id上的组合索引：idx_mid_fid。
「理解组合索引最左前缀原则，避免重复建设索引」，如果建立了(a,b,c)，相当于建立了(a), (a,b), (a,b,c)。

索引设计规范

索引必须创建在索引选择性（区分度）较高的列上，选择性的计算方式为: selecttivity = count(distinct c_name)/count(*) ; 如果区分度结果小于0.2，则不建议在此列上创建索引，否则大概率会拖慢SQL执行
单张表的索引数量理论上应 「控制在5个以内」。经常有大批量插入、更新操作表，应尽量少建索引，索引建立的原则理论上是 「多读少写的场景」。
「ORDER BY，GROUP BY，DISTINCT的字段需要添加在索引的后面，形成覆盖索引」
联合索引注意 「最左匹配原则」：必须按照从左到右的顺序匹配，MySQL会一直向右匹配索引直到遇到范围查询(>、<、between、like)然后停止匹配。如：depno=1 and empname>'' and job=1 如果建立(depno,empname,job)顺序的索引，job是用不到索引的。
应需而取策略，查询记录的时候， 「不要一上来就使用」*，只取需要的数据，可能的话尽量只利用索引覆盖，可以减少回表操作，提升效率。
避免索引失效的原则： 「禁止对索引字段使用函数、运算符操作，会使索引失效」。
「避免非必要的类型转换」，字符串字段使用数值进行比较的时候会导致索引无效。
「模糊查询'%value%'会使索引无效」，变为全表扫描，因为无法判断扫描的区间， 「但是'value%'是可以有效利用索引」。
「索引覆盖排序字段」，这样可以减少排序步骤，提升查询效率
「尽量的扩展索引，非必要不新建索引」。比如表中已经有a的索引，现在要加(a,b)的索引，那么只需要修改原来的索引即可。

扩展下最左前缀

这里创建一个索引

CREATE INDEX idx_name ON users (first_name, last_name);

在这个索引中，first_name 是最左前缀。现在，当您执行类似以下的查询时，索引可以被有效地利用：

SELECT * FROM users WHERE first_name = 'John' AND last_name = 'Doe';

5. SQL 查询编写规范

不允许使用 select *
查询必须加where条件，避免全表扫描
如果必须有TEXT对象，必须单独加表并关联
where条件中过滤字段严禁使用任何函数，包括数据类型转换函数
分页查询必须带排序条件
用in/union替换or，并注意in个数小于300
如无必要不要使用%前缀进行模糊查询，避免全表查询
避免使用子查询，转为join连接

子查询性能差原因

「「·」」 子查询的结果集无法使用索引，通常子查询的结果集会被存储到临时表中，不论是内存临时表还是磁盘临时表都不会存在索引，所以查询性能会受到一定的影响；

「「·」」 特别是对于返回结果集比较大的子查询，其对查询性能的影响也就越大；

「「·」」 由于子查询会产生大量的临时表也没有索引，所以会消耗过多的CPU和IO资源，产生大量的慢查询。

6. 事务管理和性能优化

所有方法涉及到更新、删除、添加操作需要使用 @Transactional注解
数据量大的情况下，需要分批次操作

7. 安全性考虑

数据库配置应当使用druid等框架对明文进行加密
避免拼接SQL
防止SQL注入

本文由 mdnice 多平台发布

开发规范（一）：Mysql篇

1. 流程

2. 数据库与表规范

表命名规范

数据库对象设计规范

表设计规范

3. 字段规范

字段命名规范

字段设计规范

4. 索引规范

索引命名规范

索引设计规范

5. SQL 查询编写规范

6. 事务管理和性能优化

7. 安全性考虑

相关文章

深度思考rpc框架面经系列之三

44 | 酒店预订及取消的数据分析

leetcode经典算法——快速幂

8.14 ARM

探讨uniapp的数据缓存问题

海国图志#2：这一周难忘瞬间，吐血整理，不得不看

DC电源模块减小输入电源与输出负载之间的能量损失

B树和B+树区别