一、Flink面试问题集
1、flink+kafka 如何保证精准一次
- 配置
- 两阶段提交
2、Flink提交方式, 使用pre-job还是yarn-session模式,以及Application模式,好处?
- Flink提交模式
- 模式对比
3、Flink UV统计实现
- set
- 布隆过滤器+redis 有误差
- HyperLogLog
4、Flink的CEP实现延迟支付提醒
- Flink CEP 编程
5、Flink Join方式
- 官方介绍
6、Time-Watermark
7、动态表
8、Flink数据倾斜如何处理
二、Spark面试问题集
三、数据仓库
1、数仓搭建规范说一下,表命名规范、数仓分层、数仓主题、数据域、业务域等
2、结合自己负责的业务主线,详细简述一个主题,业务流程、概念模型、实体节点
3、主题域-一级主题-业务过程 ,描述自己在这个过程中做了哪些事情