• 作者:老汪软件技巧
  • 发表时间:2024-08-26 04:02
  • 浏览量:

一. 前言

Flink CDC(Change Data Capture)是 Apache Flink 提供的一个功能强大的组件,用于实时捕获和处理数据库中的数据变更。

官方文档 @ Apache Flink CDC |Apache Flink CDC

宏观概念入门 :

简单聊一聊趋势 :

常见的方式包括通过 DataX 实现全量同步后 ,再通过 Canal 实现对应的增量同步。这种方式并没有太大的问题 ,性能方面和操作方式都不难,最大的问题可能就是 : 全量和增量需要分开处理

而 Flink 我认为它的最大好处在于可以同时集成增量和全量,且适配的上下游比较多(生态好,功能多).

而在我个人的设计中 ,轻量级的 MySQL 数据同步用 Canal 足够了。 而实时计算要求更高的复杂营销,统计我会考虑 Flink。

生态快速一览(数据同步类型) :

当然除了数据同步 ,Flink 还支持机器学习 , CEP 等高级用法

最后的最后聊一下应用场景 :

就像上文说的 ,功能上包括 : 数据同步 , 数据分发 ,数据集成。 而在实践上面就可以分为 : 报表分析 ,实时大屏 , 数据应用 ,实时营销等一些具体的场景了

二. 基础使用流程2.1 使用方式2.2 关于版本的选择

Flink CDC 最难的点不在代码上, 而在于版本如何确定。

// Flink CDC 参考
- Flink 1.15.x 对应 flink-connector-mysql-cdc 2.4.x
- Flink 1.14.x 对应 flink-connector-mysql-cdc 2.3.x
- Flink 1.13.x 对应 flink-connector-mysql-cdc 2.2.x
- Flink 1.12.x 对应 flink-connector-mysql-cdc 1.4.x

三. 上手流程3.1 Maven 依赖

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd">
    <modelVersion>4.0.0modelVersion>
    <groupId>com.ganggroupId>
    <artifactId>com-ant-example-mysqlartifactId>
    <version>0.0.1-SNAPSHOTversion>
    <dependencies>
        
        <dependency>
            <groupId>org.apache.flinkgroupId>
            <artifactId>flink-coreartifactId>
            <version>1.14.2version>
        dependency>
        <dependency>
            <groupId>org.apache.flinkgroupId>
            <artifactId>flink-javaartifactId>
            <version>1.14.2version>
        dependency>
        
        <dependency>
            <groupId>org.apache.flinkgroupId>
            <artifactId>flink-shaded-guavaartifactId>
            <version>30.1.1-jre-14.0version>
        dependency>
        
        <dependency>
            <groupId>org.apache.flinkgroupId>
            <artifactId>flink-streaming-java_2.12artifactId>
            <version>1.14.2version>
        dependency>
        
        <dependency>
            <groupId>com.ververicagroupId>
            <artifactId>flink-connector-mysql-cdcartifactId>
            <version>2.3.0version>
        dependency>
        <dependency>
            <groupId>org.apache.flinkgroupId>
            <artifactId>flink-connector-jdbc_2.12artifactId>
            <version>1.14.2version>
        dependency>
        
        <dependency>
            <groupId>com.alibabagroupId>
            <artifactId>fastjsonartifactId>
            <version>1.2.47version>
        dependency>
        <dependency>
            <groupId>org.projectlombokgroupId>
            <artifactId>lombokartifactId>
            <version>1.18.30version>
        dependency>
    dependencies>
    <build>
        <plugins>
            
            <plugin>
                <groupId>org.apache.maven.pluginsgroupId>
                <artifactId>maven-compiler-pluginartifactId>
                <version>3.8.1version>
                <configuration>
                    <source>1.8source>
                    <target>1.8target>
                configuration>
            plugin>
            
            <plugin>
                <groupId>org.apache.maven.pluginsgroupId>
                <artifactId>maven-shade-pluginartifactId>
                <version>3.2.4version>
                <executions>
                    <execution>
                        <phase>packagephase>
                        <goals>
                            <goal>shadegoal>
                        goals>
                        <configuration>
                            <createDependencyReducedPom>falsecreateDependencyReducedPom>
                            <transformers>
                                <transformer
                                        implementation="org.apache.maven.plugins.shade.resource.ManifestResourceTransformer">
                                    <mainClass>com.ant.flink.FlinkMySQLExampleMainmainClass>
                                transformer>
                            transformers>
                        configuration>
                    execution>
                executions>
            plugin>
        plugins>
    build>
project>