mycat 是mysql分库分表的中间件,由java编写,本次进行mysql、mycat 的docker搭建,理解mycat的原理与特性。
一、mysql docker 搭建
这里启动两个实例:
docker run -itd --name mysql1 -p 3307:3306 -e MYSQL_ROOT_PASSWORD=123 mysql:5.7.40docker run -itd --name mysql2 -p 3308:3306 -e MYSQL_ROOT_PASSWORD=123 mysql:5.7.40
二、写mycat 配置
schema.xml:配置逻辑库、逻辑表、分片规则、数据结点配置。
ITCAST是逻辑库,player、team是逻辑表。
db1需要在mysql1 、mysql2 种创建。
rule1为分片规则。
172.17.0.2、172.17.0.3为mysql1 、mysql2的docker ip。
<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://io.mycat/"> <!-- 逻辑库配置 --> <schema name="ITCAST" checkSQLschema="false" sqlMaxLimit="100"> <!-- 逻辑表配置 --> <table name="player,team" dataNode="dn1,dn2" rule="rule1"/> </schema> <!-- 数据节点配置 --> <dataNode name="dn1" dataHost="host1" database="db1" /> <dataNode name="dn2" dataHost="host2" database="db1" /> <!-- 节点主机配置 --> <dataHost name="host1" maxCon="1000" minCon="10" balance="0" writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100"> <heartbeat>select user()</heartbeat> <writeHost host="hostM1" url="172.17.0.2:3306" user="root" password="123"></writeHost></dataHost> <dataHost name="host2" maxCon="1000" minCon="10" balance="0" writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100"> <heartbeat>select user()</heartbeat> <writeHost host="hostM1" url="172.17.0.3:3306" user="root" password="123"></writeHost> </dataHost> </mycat:schema>
rule.xml:配置一系列分片规则,我们使用rule1。按主键均匀分表。
<?xml version="1.0" encoding="UTF-8"?>
<!-- - - Licensed under the Apache License, Version 2.0 (the "License");- you may not use this file except in compliance with the License. - Youmay obtain a copy of the License at - - http://www.apache.org/licenses/LICENSE-2.0- - Unless required by applicable law or agreed to in writing, software -distributed under the License is distributed on an "AS IS" BASIS, - WITHOUTWARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. - See theLicense for the specific language governing permissions and - limitationsunder the License. -->
<!DOCTYPE mycat:rule SYSTEM "rule.dtd">
<mycat:rule xmlns:mycat="http://io.mycat/"><tableRule name="rule1"><rule><columns>id</columns><algorithm>crc32slot</algorithm></rule></tableRule><tableRule name="auto-sharding-long"><rule><columns>id</columns><algorithm>rang-long</algorithm></rule></tableRule><function name="crc32slot" class="io.mycat.route.function.PartitionByCRC32PreSlot"><property name="count">2</property><!-- 要分片的数据库节点数量,必须指定,否则没法分片 --></function><function name="rang-long" class="io.mycat.route.function.AutoPartitionByLong"><property name="mapFile">autopartition-long.txt</property></function>
</mycat:rule>
server.xml:配置mycat 的用户与密码。
<?xml version="1.0" encoding="UTF-8"?>
<!-- - - Licensed under the Apache License, Version 2.0 (the "License"); - you may not use this file except in compliance with the License. - You may obtain a copy of the License at - - http://www.apache.org/licenses/LICENSE-2.0 - - Unless required by applicable law or agreed to in writing, software - distributed under the License is distributed on an "AS IS" BASIS, - WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. - See the License for the specific language governing permissions and - limitations under the License. -->
<!DOCTYPE mycat:server SYSTEM "server.dtd">
<mycat:server xmlns:mycat="http://io.mycat/"><system><property name="charset">utf8</property><property name="nonePasswordLogin">0</property> <!-- 0为需要密码登陆、1为不需要密码登陆 ,默认为0,设置为1则需要指定默认账户--><property name="ignoreUnknownCommand">0</property><!-- 0遇上没有实现的报文(Unknown command:),就会报错、1为忽略该报文,返回ok报文。在某些mysql客户端存在客户端已经登录的时候还会继续发送登录报文,mycat会报错,该设置可以绕过这个错误--><property name="useHandshakeV10">1</property><property name="removeGraveAccent">1</property><property name="useSqlStat">0</property> <!-- 1为开启实时统计、0为关闭 --><property name="useGlobleTableCheck">0</property> <!-- 1为开启全加班一致性检测、0为关闭 --><property name="sqlExecuteTimeout">300</property> <!-- SQL 执行超时 单位:秒--><property name="sequnceHandlerType">1</property><!--<property name="sequnceHandlerPattern">(?:(\s*next\s+value\s+for\s*MYCATSEQ_(\w+))(,|\)|\s)*)+</property>INSERT INTO `travelrecord` (`id`,user_id) VALUES ('next value for MYCATSEQ_GLOBAL',"xxx");--><!--必须带有MYCATSEQ_或者 mycatseq_进入序列匹配流程 注意MYCATSEQ_有空格的情况--><property name="sequnceHandlerPattern">(?:(\s*next\s+value\s+for\s*MYCATSEQ_(\w+))(,|\)|\s)*)+</property><property name="subqueryRelationshipCheck">false</property> <!-- 子查询中存在关联查询的情况下,检查关联字段中是否有分片字段 .默认 false --><property name="sequenceHanlderClass">io.mycat.route.sequence.handler.HttpIncrSequenceHandler</property><!-- <property name="useCompression">1</property>--> <!--1为开启mysql压缩协议--><!-- <property name="fakeMySQLVersion">5.6.20</property>--> <!--设置模拟的MySQL版本号--><!-- <property name="processorBufferChunk">40960</property> --><!-- <property name="processors">1</property> <property name="processorExecutor">32</property> --><!--默认为type 0: DirectByteBufferPool | type 1 ByteBufferArena | type 2 NettyBufferPool --><property name="processorBufferPoolType">0</property><!--默认是65535 64K 用于sql解析时最大文本长度 --><!--<property name="maxStringLiteralLength">65535</property>--><!--<property name="sequnceHandlerType">0</property>--><!--<property name="backSocketNoDelay">1</property>--><!--<property name="frontSocketNoDelay">1</property>--><!--<property name="processorExecutor">16</property>--><!--<property name="serverPort">8066</property> <property name="managerPort">9066</property> <property name="idleTimeout">300000</property> <property name="bindIp">0.0.0.0</property><property name="dataNodeIdleCheckPeriod">300000</property> 5 * 60 * 1000L; //连接空闲检查<property name="frontWriteQueueSize">4096</property> <property name="processors">32</property> --><!--分布式事务开关,0为不过滤分布式事务,1为过滤分布式事务(如果分布式事务内只涉及全局表,则不过滤),2为不过滤分布式事务,但是记录分布式事务日志--><property name="handleDistributedTransactions">0</property><!--off heap for merge/order/group/limit 1开启 0关闭--><property name="useOffHeapForMerge">0</property><!--单位为m--><property name="memoryPageSize">64k</property><!--单位为k--><property name="spillsFileBufferSize">1k</property><property name="useStreamOutput">0</property><!--单位为m--><property name="systemReserveMemorySize">384m</property><!--是否采用zookeeper协调切换 --><property name="useZKSwitch">false</property><!-- XA Recovery Log日志路径 --><!--<property name="XARecoveryLogBaseDir">./</property>--><!-- XA Recovery Log日志名称 --><!--<property name="XARecoveryLogBaseName">tmlog</property>--><!--如果为 true的话 严格遵守隔离级别,不会在仅仅只有select语句的时候在事务中切换连接--><property name="strictTxIsolation">false</property><property name="useZKSwitch">true</property><!--如果为0的话,涉及多个DataNode的catlet任务不会跨线程执行--><property name="parallExecute">0</property></system><!-- 全局SQL防火墙设置 --><!--白名单可以使用通配符%或着*--><!--例如<host host="127.0.0.*" user="root"/>--><!--例如<host host="127.0.*" user="root"/>--><!--例如<host host="127.*" user="root"/>--><!--例如<host host="1*7.*" user="root"/>--><!--这些配置情况下对于127.0.0.1都能以root账户登录--><!--<firewall><whitehost><host host="1*7.0.0.*" user="root"/></whitehost><blacklist check="false"></blacklist></firewall>--><user name="root"> <property name="password">123456</property> <property name="schemas">ITCAST</property> </user> <user name="test"> <property name="password">123456</property> <property name="schemas">ITCAST</property> </user></mycat:server>
三、docker 启动mycat
在当前目录下,创建mycat/conf 目录,并将schema.xml rule.xml server.xml 放入其中。
docker run -itd --name mycat -p 8066:8066 -p 9066:9066 -v `pwd`/my_cat/conf/schema.xml:/usr/local/mycat/conf/schema.xml -v `pwd`/my_cat/conf/rule.xml:/usr/local/mycat/conf/rule.xml -v `pwd`/my_cat/conf/server.xml:/usr/local/mycat/conf/server.xml longhronshens/mycat-docker
四、建库
连接mycat,输入123456
此时,ITCAST逻辑库已存在,逻辑表也存在。但mysql1、mysql2 中没有这两张表。
建表:
此时再看mysql1、mysql2,表就出现了。
插入数据:
insert into player(id,name,team_id) values(1,'name_aa',1);
insert into player(id,name,team_id) values(2,'name_bb',1);
insert into player(id,name,team_id) values(3,'name_cc',3);insert into team(id,name) values(1,'team_aa');
insert into team(id,name) values(2,'team_bb');
insert into team(id,name) values(3,'team_cc');
其中:
id为1、3的数据分配到mysql1 中。
id为2的数据分配到mysql2 中。
mysql1:
mysql2:
五、打开mysql SQL执行日志。
临时打开:
mysql> SET GLOBAL general_log = 'ON';
日志文件路径:
mysql> show variables like '%general_log_file%';
六、mycat不适用场景的验证
1.非分片键的查询将扩散至所有结点。
使用a、b 对照试验,a按分片键查找,b不按分片键查找。
a.
在mycat 执行:
mysql> select * from player where id=1;
查看mysql1、mysql2 日志:
mysql1:
mysql2:
26秒~36秒间无其他操作。
b.
在mycat 执行:
mysql> select * from player where name like '%_aa';
查看mysql1、mysql2 日志:
mysql1:
mysql2:
2.分页排序将性能下降。
limit m,n 的分页查询将对每个结点发起limit m+n / limit 0,m+n的查询,然后等所有结点数据返回后,根据m+n 构造最小堆,最后取最小堆中的最大的n个。
在mycat 执行:
mysql> select * from player order by id limit 1,1;
必须加order,否则返回的数据将是不准确的。
mysql1:
mysql2:
3.表连接将无法进行。
在mycat 中执行:
mysql> select player.name name,team.name team_name from player left join team on player.team_id = team.id where player.id=2;
查询id=2 的运动员的姓名和队名,这在单表中一定能轻松查出来。但在mycat下就有问题:
原因这条语句,mycat只发往了mysql2:
mysql1 无任何执行:
因为mysql2 中没有队伍3的数据,所以id=2的队员没有查出对应的队伍。
六、mycat适用场景
1.单纯的读写分离,此时配置最为简单,支持读写分离,主从切换。
2.分表分库,对于超过 1000 万的表进行分片,最大支持 1000 亿的单表分片。
3.多租户应用,每个应用一个库,但应用程序只连接 Mycat,从而不改造程序本身,实现多租户化
4.报表系统,借助于 Mycat 的分表能力,处理大规模报表的统计;
5.作为海量数据实时查询的一种简单有效方案,比如 100 亿条频繁查询的记录需要在 3 秒内查询出来结果,除了基于主键的查询,还可能存在范围查询或其他属性查询,此时 Mycat 可能是最简单有效的选择。
七、其他
随着业务的发展,核心数据越来越多,TPS越来越高,数据库的主从、分库分表将不能满足需求,需要引入可水平拓展的分布式事务数据库,如TiDB、GuassDB等。
references:
mycat简介与使用场景