博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
阿里巴巴 canal 开源组件发布 v1.1.3 版本
阅读量:6923 次
发布时间:2019-06-27

本文共 1790 字,大约阅读时间需要 5 分钟。

canal 是阿里巴巴在 2012 年开源的基于 MySQL 数据库增量日志解析,提供增量数据订阅&消费。基于 canal 的准实时日志订阅消费,你可以完成类似的业务:

  1. 同步到另一个数据库,比如异地容灾、同步离线库等
  2. 构建多级索引 (卖家和买家各自分库索引)
  3. 实时构建搜索引擎,比如同步给 elasticsearch
  4. 业务 cache 刷新
  5. 价格变化等重要业务消息

项目开源地址:https://github.com/alibaba/canal。经历了 4 个月的蛰伏,canal 1.1 系列的 1.1.3 正式发布了,主要围绕自建的生态能力,完善消息投递到 MQ 和 Client Adapter 做了比较多的测试和修复工作,具体的变更日志:

功能新增

  1. 支持 MySQL 8.0 新的 caching_sha2_password 认证协议

  2. 支持 Azure MySQL 的认证协议

  3. canal 投递 MQ 消息

    • 支持按表规则定义 dynamic topic、partition 路由的能力

    • 新增 kafka 消息投递事务

  4. canal 内置的客户端

    • rds-adapter 增加 MySQL 整个 DB 层面的同步配置

    • es-adapter 新增父子文档索引适配

小需求 & bugfix

  1. 解决 server 单核服务器无法接收数据的问题

  2. 修复 TableMeta TSDB 支持 utf8mb4 

  3. 修复 MQ 消息发送时非 flatMessage 模式出现数据重复

  4. 修复 Kafka 配置为分区模式时出现数据

  5. 修复 fastsql 的几个 DDL 解析问题   

  6. 修复 rdb-adapter 同步的类型转化、空指针、大小写、DDL 同步等问题     

  7. 修复投递 MQ 模式,Canal server HA 在切换后不生效 

  8. 修复 es-adapter 数据库主键类型错误 

  9. 修复 charset 编码不存在 

更多详情,可以参见 https://github.com/alibaba/canal/releases

canal 工作原理

原理相对比较简单:

  1. canal 模拟 MySQL slave 的交互协议,伪装自己为 MySQL slave,向 MySQL master 发送 dump 协议
  2. MySQL master 收到 dump 请求,开始推送 binary log 给 slave(也就是 canal)
  3. canal 解析 binary log 对象(原始为 byte 流)

canal 整体架构

064223_f5Ia_2720166.jpg

说明:

  • server 代表一个 canal 运行实例,对应于一个 jvm
  • instance 对应于一个数据队列 (1个 server 对应 1..n 个 instance)

instance 模块:

  • eventParser (数据源接入,模拟 slave 协议和 master 进行交互,协议解析)
  • eventSink (Parser 和 Store 链接器,进行数据过滤、加工、分发的工作)
  • eventStore (数据存储)
  • metaManager (增量订阅&消费信息管理器)

整个 canal-server 可以有两种交付方式

  1. client/server 架构,可以独立部署一个 canal server 进程去抓取 MySQL binlog,然后业务代码里启动1个或多个 canal client 来做消费。优点:开箱即用,运维简单

  2. 嵌入式架构,允许业务代码里启动 canal server 直接来做消费。优点:方便和业务系统做集成

canal 相比于其他开源的 binlog 产品,比如 open-replicator、mysql-binlog-connector-java、Tungsten Replicator、maxwell 有比较多的优势:

  1. 高可用性。canal 支持 MySQL 主备、server 和 client 多个层面的高可用机制,可以作为生产使用

  2. 跨语言。canal 的通讯协议选择了 protobuf 3.6.1,client 层面目前支持 java、c#、go 多个语言的客户端

  3. 整体性。canal 支持增量数据投递到 MQ,同时引入 Client Adpater 扩展机制,目前支持 rdb、elasticsearch、hbase 等目标的写入

来源 

转载地址:http://rdjjl.baihongyu.com/

你可能感兴趣的文章
Maven pom.xml配置解读
查看>>
SVN clearup提示Path is not a working copy directory
查看>>
15种最佳方式帮你顺利掌握Hadoop技术
查看>>
读写分离
查看>>
emacs+cscope阅读C代码
查看>>
ILGeoNamesSearchController
查看>>
js学习笔记
查看>>
微博舆情监测
查看>>
Flink 幕后之内存管理
查看>>
javascript 学习笔记 【数组操作方法】
查看>>
Android 实现ListView的展开式动画ExpandAnimation
查看>>
PreparedStatement 与Statement 区别
查看>>
mybatis增删改查配置
查看>>
分析APACHE NGINX的LOG
查看>>
android studio 无法在可视化页面预览布局文件
查看>>
结构体初始化的一点注意 -std=gnu++0x
查看>>
SQL Server里查询表结构命令
查看>>
自动发送Exchange Server 2013使用情况到指定邮箱
查看>>
【Shell脚本】逐行处理文本文件
查看>>
mysql视图学习总结
查看>>