flink 标签 - 浪浪山下那个村

2023年09月20日浏览 1.26K 大数据

【Flink】Flink基本架构

Flink 的 Master 节点包含了三个组件: Dispatcher、ResourceManager 和 JobManager。 Dispatcher: 负责接收用户提供的作业，并且负责为这个新提交的作业拉起一个新的 JobManager 服务； R ......

2023年09月10日浏览 1.2K 大数据

Flink Checkpoint/Savepoint对比

Flink 为作业的容错提供 Checkpoint 和 Savepoint 两种机制。保存点机制（Savepoints）是检查点机制一种特殊的实现，它允许你通过手工方式来触发Checkpoint，并将结果持久化存储到指定路径中，主要用于避免Flink集群在 ......

2023年08月27日浏览 1.29K 大数据

【Flink】【更新中】状态后端和checkpoint

状态后端和checkpoint详解，包括常见checkpoint问题处理。

2023年07月01日浏览 1.28K 大数据

Flink 常见问题总结

Flink大数据常见问题总结。

2023年05月22日浏览 2.38K 大数据

记录一次由于Jar包冲突导致的神奇问题

今天同事找我帮忙看一个Flink的问题，现象是前几天还能提交的客户端，就在今天突然提交不了作业了，报错提示大概如下（公司的东西涉密）， Caused by: org.apache.flink.api.common.InvalidProgramExcepti ......

2023年02月11日浏览 1.55K 大数据

Flink双流Join底层原理

底层原理简介 LState:存储左边数据流中的数据。 RState：存储右边数据流中的数据。当左边数据流数据到达的时候会保存到LState，并且到RState中进行Join。将Join生成的结果数据发送到下游。右边数据流中数据到达的时候，会保存到R ......

2023年01月29日浏览 1.48K 大数据

Flink SQL 优化

设置空闲状态保留时间不设置空闲状态保留时间会导致状态爆炸。 FlinkSQL 的 regular join inner 、 left 、 right ），左右表的数据都会一直保存在状态里，不会清理！要么设置 TTL ，要么使用 Flink SQL 的 ......

2023年01月15日浏览 1.41K 大数据

Flink数据倾斜理解

数据倾斜原理数据倾斜就是数据的分布严重不均，流入部分算子的数据明显多余其他算子，造成这部分算子压力过大。影响单点问题数据集中在某些分区上（Subtask），导致数据严重不平衡。 GC 频繁过多的数据集中在某些 JVM（TaskManager）， ......

2023年01月06日浏览 1.49K 大数据

Flink作业反压处理

简介反压（backpressure）是实时计算应用开发中，特别是流式计算中，十分常见的问题。反压意味着数据管道中某个节点成为瓶颈，处理速率跟不上上游发送数据的速率，而需要对上游进行限速。由于实时计算应用通常使用消息队列来进行生产端和消费端的解耦，消费 ......

2023年01月02日浏览 1.33K 大数据

Flink状态后端和CheckPoint 调优

RocksDB 介绍 RocksDB 是嵌入式的 Key-Value 数据库，在 Flink 中被用作 RocksDBStateBackend 的底层存储。如下图所示，RocksDB 持久化的 SST文件在本地文件系统上通过多个层级进行组织，不同层级之间会 ......

【Flink】Flink基本架构

Flink Checkpoint/Savepoint对比

【Flink】【更新中】状态后端和checkpoint

Flink 常见问题总结

记录一次由于Jar包冲突导致的神奇问题

Flink双流Join底层原理

Flink SQL 优化

Flink数据倾斜理解

Flink作业反压处理

Flink状态后端和CheckPoint 调优

访问最多的文章

存档

公告

分类

标签

访问最多的文章

存档