Kafka与Flink的整合 -- sink、source

news/2024/12/22 0:50:06/

1、首先导入依赖：

        <dependency><groupId>org.apache.flink</groupId><artifactId>flink-connector-kafka</artifactId><version>1.15.2</version></dependency>

2、 source：Flink从Kafka中读取数据

public class Demo01KafkaSource {public static void main(String[] args) throws Exception{//构建环境StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();//构建kafka source 环境KafkaSource<String> source = KafkaSource.<String>builder()//指定broker列表.setBootstrapServers("master:9092,node1:9092,node2:9092")//指定topic.setTopics("bigdata")//指定消费组.setGroupId("my-group")//指定数据的读取的位置，earliest指的是读取最早的数据，latest：指定的读取的是最新的数据.setStartingOffsets(OffsetsInitializer.earliest())//读取数据格式：.setValueOnlyDeserializer(new SimpleStringSchema()).build();//使用kafka数据源DataStreamSource<String> kafkaSourceDS = env.fromSource(source, WatermarkStrategy.noWatermarks(), "Kafka Source");kafkaSourceDS.print();//启动flinkenv.execute();}
}

启动生产kafka：

kafka-console-producer.sh --broker-list master:9092,node1:9092,node2:9092 --topic bigdata

3、sink：Flink向Kafka中写入数据

public class Demo02KafkaSink {public static void main(String[] args) throws Exception{//构建flink的环境StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();//读取数据文件：DataStreamSource<String> studentDS = env.readTextFile("flink/data/students.txt");//创建kafka sinkKafkaSink<String> sink = KafkaSink.<String>builder()//指定flink broker列表.setBootstrapServers("master:9092,node1:9092,node2:9092")//指定数据的格式：.setRecordSerializer(KafkaRecordSerializationSchema.builder()//指定topic，如果topic不存在就会自动的创建一个分区是1个副本是1个的topic.setTopic("student")//指定数据的格式.setValueSerializationSchema(new SimpleStringSchema()).build())//指定数据处理的语义：.setDeliverGuarantee(DeliveryGuarantee.AT_LEAST_ONCE).build();//执行flinkstudentDS.sinkTo(sink);//构建flink环境env.execute();}
}

启动消费kafka：

kafka-console-consumer.sh --bootstrap-server  master:9092,node1:9092,node2:9092 --from-beginning --topic student

Kafka与Flink的整合 -- sink、source

1、首先导入依赖：

2、 source：Flink从Kafka中读取数据

启动生产kafka：

3、sink：Flink向Kafka中写入数据

启动消费kafka：

相关文章

verilog——移位寄存器

ESP32网络开发实例-Web服务器RGB LED调光

PDF Expert for mac(苹果电脑专业pdf编辑器)兼容12系统

为什么HTTP用得很好的，开始普及HTTPS呢？

星岛专栏｜从Web3发展看金融与科技的融合之道

京东数据分析（京东销量）：2023年9月京东投影机行业品牌销售排行榜

8.spark自适应查询-AQE之自适应调整Shuffle分区数量

MySQL进阶_2.存储引擎