Alibaba Canal 使用记录

news/2025/2/19 17:47:33/

项目中使用 canal 来同步数据到 Elasticsearch, 遇到很多问题,做一下记录:

版本问题:

1. 解析binlog出错 ,表现为 limit excceed:xx

目前使用 mariadb 10.9.7/10.10.6 + canal 1.1.6 hotfix ,在这个版本组合中只要binlog中出现对表结构操作的SQL语句就会出错并卡住。

解决办法:

(1)每次在对表结构操作后重启数据库服务,这样会新建一个binlog 文件 。

(2)升级到1.1.7, release说明中说支持mariadb 10.10.x的binlog, 但目前1.1.7是alpha版,从isuse上看此版本的问题还是挺多的,我也简单的试了一下1.1.7-alpha-2版本,在配置没有任何更改的情况下无法同步,查看adapter日志能发现DML#4796,但就是不同步到es, 这种情况可能是配置问题,但由于不想使用alpha版本没有更详细的测试,等到正式版出了再说。

2.日志能发现DML,但不能同步到ES。

这种错误出现的最多,引起的原因也五花八门,目前发现以下原因:

(1)filter配置的问题,这种情况从日志能够看出来,首先deployer在启动时会在日志中打印出转意后的正则,可查看和自己设置的是否一致。另外如果filter通过了在DML日志后会根一条带有data 的日志。

(2)filter的正则问题,filter正则过滤真是让我挠头。

a.  canal会自动为正则加"^"和“$",所以配置时不能再加了,多个正则用逗号分隔。

b.  正则写的时候需要按Java字符串转义后再按正则转义,例如想配置"."那么要写成 "\\.",其中"\\"是java字符串转义,转成"\.", "\"是按正则转义,对"."转义

c.  官方说明过滤内容是  "库名.表名" ,但我设置 :

canal.instance.filter.regex=record_.+\\..*

是想仅同步数据库名以"record_"开头的所有表。但是设置后所有的同步都失效了,目前没有解决,使用了默认的 ".*\\..*"。

(3) sql错误

canal 对sql写法是有要求的,并不是能执行的就行,目前已知的要求有:

a.  只支持 left join

b. 第一个表必须是主表

c. 主表的主键字段名必须是_id

d. left join on 中使用的条件字段必须包含在select 选择列中

e. 不支持多级嵌套查询

对SQL的检查最好是先启动canal,然后再把写好yml文件拷到配置目录中,这时查看日志,会看到动态加载的日志,如果成功就说明sql没问题,否则会出现加载出错信息。


http://www.ppmy.cn/news/1090470.html

相关文章

华为OD机试 - 关联子串 - 滑动窗口(Java 2023 B卷 100分)

目录 专栏导读一、题目描述二、输入描述三、输出描述四、解题思路五、Java算法源码六、效果展示1、输入2、输出3、说明4、换个思路 华为OD机试 2023B卷题库疯狂收录中,刷题点这里 专栏导读 本专栏收录于《华为OD机试(JAVA)真题(A…

SpringBoot 集成 Canal 实现监听MySQL表数据

SpringBoot 集成 Canal 准备工作什么是 CanalCanal 在 Spring Boot 中的作用和优势准备工作安装和配置 MySQL 数据库 安装Canal项目集成导入依赖添加配置信息创建监听类测试 准备工作 什么是 Canal Canal 是阿里巴巴开源的基于数据库增量日志解析的数据同步和订阅组件&#x…

Milvus以及Web UI 安装

向量数据库懂的都懂 版本数据 [rootiZ7xv7q4im4c48qen2do2bZ project]# cat /etc/redhat-release CentOS Stream release 9 [rootiZ7xv7q4im4c48qen2do2bZ project]# docker version Client: Docker Engine - CommunityVersion: 24.0.5API version: 1.43Go v…

10 种常用的字符串方法

10 种常用的字符串方法 1.concat() 字符串拼接 const str1 12345678;const str2 abcdefgh;const str3 -【】;‘;console.log(str1.concat(str2,str3))//12345678abcdefgh-【】;‘ 2.includes() 判断字符串中是否包含指定值,返回布尔值…

解决Echarts中双坐标轴分割错位问题

1、处理函数 /*** Description 刻度最大值* date 2023-08-30* param {any} isNaN(maxValue/1* returns {any}*/ export const getYAxisMax (maxValue): number > {if (isNaN(maxValue / 1) || maxValue / 1 < 10) {return 10;}const max: any Math.ceil(maxValue) ;c…

JavaScript中包含对象的数组去重

一.数组遍历 function Uniarray(array) {// 接收去重后的数组let resArr [];// 遍历数组for (let i 0; i < array.length; i) {let isFind false;// 检查当前元素是否已存在于结果数组中for (let j 0; j < resArr.length; j) {// 使用严格相等运算符&#xff08;&am…

protobuf安装及简单使用

protobuf简单介绍和ubuntu 16.04环境下安装教程&#xff1a;https://pythonjishu.com/rgdzjkxgoyicrhu/ Protocol Buffers使用指南&#xff1a;https://blog.csdn.net/jarvanxy/article/details/132256759

Python中的函数式编程是什么?

Python中的函数式编程是一种编程范式&#xff0c;它强调使用纯函数和避免可变状态来构建程序。函数式编程的核心思想是将计算视为函数的求值&#xff0c;而不是通过改变状态来实现。在函数式编程中&#xff0c;函数被视为一等公民&#xff0c;可以作为参数传递给其他函数&#…