- 作者:老汪软件技巧
- 发表时间:2024-08-26 04:02
- 浏览量:
一. 前言
Flink CDC(Change Data Capture)是 Apache Flink 提供的一个功能强大的组件,用于实时捕获和处理数据库中的数据变更。
官方文档 @ Apache Flink CDC |Apache Flink CDC
宏观概念入门 :
简单聊一聊趋势 :
常见的方式包括通过 DataX 实现全量同步后 ,再通过 Canal 实现对应的增量同步。这种方式并没有太大的问题 ,性能方面和操作方式都不难,最大的问题可能就是 : 全量和增量需要分开处理
而 Flink 我认为它的最大好处在于可以同时集成增量和全量,且适配的上下游比较多(生态好,功能多).
而在我个人的设计中 ,轻量级的 MySQL 数据同步用 Canal 足够了。 而实时计算要求更高的复杂营销,统计我会考虑 Flink。
生态快速一览(数据同步类型) :
当然除了数据同步 ,Flink 还支持机器学习 , CEP 等高级用法
最后的最后聊一下应用场景 :
就像上文说的 ,功能上包括 : 数据同步 , 数据分发 ,数据集成。 而在实践上面就可以分为 : 报表分析 ,实时大屏 , 数据应用 ,实时营销等一些具体的场景了
二. 基础使用流程2.1 使用方式2.2 关于版本的选择
Flink CDC 最难的点不在代码上, 而在于版本如何确定。
// Flink CDC 参考
- Flink 1.15.x 对应 flink-connector-mysql-cdc 2.4.x
- Flink 1.14.x 对应 flink-connector-mysql-cdc 2.3.x
- Flink 1.13.x 对应 flink-connector-mysql-cdc 2.2.x
- Flink 1.12.x 对应 flink-connector-mysql-cdc 1.4.x
三. 上手流程3.1 Maven 依赖
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd">
<modelVersion>4.0.0modelVersion>
<groupId>com.ganggroupId>
<artifactId>com-ant-example-mysqlartifactId>
<version>0.0.1-SNAPSHOTversion>
<dependencies>
<dependency>
<groupId>org.apache.flinkgroupId>
<artifactId>flink-coreartifactId>
<version>1.14.2version>
dependency>
<dependency>
<groupId>org.apache.flinkgroupId>
<artifactId>flink-javaartifactId>
<version>1.14.2version>
dependency>
<dependency>
<groupId>org.apache.flinkgroupId>
<artifactId>flink-shaded-guavaartifactId>
<version>30.1.1-jre-14.0version>
dependency>
<dependency>
<groupId>org.apache.flinkgroupId>
<artifactId>flink-streaming-java_2.12artifactId>
<version>1.14.2version>
dependency>
<dependency>
<groupId>com.ververicagroupId>
<artifactId>flink-connector-mysql-cdcartifactId>
<version>2.3.0version>
dependency>
<dependency>
<groupId>org.apache.flinkgroupId>
<artifactId>flink-connector-jdbc_2.12artifactId>
<version>1.14.2version>
dependency>
<dependency>
<groupId>com.alibabagroupId>
<artifactId>fastjsonartifactId>
<version>1.2.47version>
dependency>
<dependency>
<groupId>org.projectlombokgroupId>
<artifactId>lombokartifactId>
<version>1.18.30version>
dependency>
dependencies>
<build>
<plugins>
<plugin>
<groupId>org.apache.maven.pluginsgroupId>
<artifactId>maven-compiler-pluginartifactId>
<version>3.8.1version>
<configuration>
<source>1.8source>
<target>1.8target>
configuration>
plugin>
<plugin>
<groupId>org.apache.maven.pluginsgroupId>
<artifactId>maven-shade-pluginartifactId>
<version>3.2.4version>
<executions>
<execution>
<phase>packagephase>
<goals>
<goal>shadegoal>
goals>
<configuration>
<createDependencyReducedPom>falsecreateDependencyReducedPom>
<transformers>
<transformer
implementation="org.apache.maven.plugins.shade.resource.ManifestResourceTransformer">
<mainClass>com.ant.flink.FlinkMySQLExampleMainmainClass>
transformer>
transformers>
configuration>
execution>
executions>
plugin>
plugins>
build>
project>