2023年11月05日浏览 2.13K 大数据

【Hadoop】nameNode启动过程源码分析

简介本章详细介绍NameNode启动过程。主要是代码级别的解释。 nameNode的启动主要是有NameNode.java主导的，由main函数开始了解。下面是main函数里面的主要内容，可以看到主要由createNameNode实现NameNode的 ......

2023年09月20日浏览 1.12K 大数据

【Flink】Flink基本架构

Flink 的 Master 节点包含了三个组件: Dispatcher、ResourceManager 和 JobManager。 Dispatcher: 负责接收用户提供的作业，并且负责为这个新提交的作业拉起一个新的 JobManager 服务； R ......

2020年05月24日浏览 1.8K 大数据

Kafka深入解析

Kafka中消息是以topic进行分类的，生产者生产消息，消费者消费消息，都是面向topic的。 topic是逻辑上的概念，而partition是物理上的概念，每个partition对应于一个log文件，该log文件中存储的就是producer生产的数据。 ......

2020年05月24日浏览 1.35K 大数据

Kafka概述

Kafka是一个分布式的基于发布/订阅模式的消息队列，主要应用于大数据实时处理领域。

2020年05月17日浏览 1.72K 大数据

Kafka API操作实践

Kafka的Producer发送消息采用的是异步发送的方式。在消息发送的过程中，涉及到了两个线程——main线程和Sender线程，以及一个线程共享变量——RecordAccumulator。main线程将消息发送给RecordAccumulator， ......

2020年05月15日浏览 1.71K 大数据

Flink 写入数据到 Kafka

通过Flink官网可以看到Flink里面就默认支持了不少sink，比如也支持Kafka sink connector（FlinkKafkaProducer），那么这篇文章我们就来看看如何将数据写入到Kafka。

2020年05月05日浏览 1.52K 大数据

自定义Data Sink

上一篇文章介绍了 Flink Data Sink，也介绍了 Flink 自带的 Sink，那么如何自定义自己的 Sink 呢？这篇文章将写一个 demo 教大家将从 Kafka Source 的数据 Sink 到 MySQL 中去。

2020年05月04日浏览 1.6K 大数据

Data Sink 介绍

Source 就是数据的来源，中间的 Compute 其实就是 Flink 干的事情，可以做一系列的操作，操作完后就把计算后的数据结果 Sink 到某个地方。（可以是 MySQL、ElasticSearch、Kafka、Cassandra 等）。这里我说下 ......

2020年05月04日浏览 1.44K 大数据

如何自定义 Data Source

在 Data Source 介绍文章中，我给大家介绍了 Flink Data Source 以及简短的介绍了一下自定义 Data Source，这篇文章更详细的介绍下，并写一个 demo 出来让大家理解。

2020年05月03日浏览 1.91K 大数据

Data Source 介绍

Data Sources 是什么呢？就字面意思其实就可以知道：数据来源。 Flink 做为一款流式计算框架，它可用来做批处理，即处理静态的数据集、历史的数据集；也可以用来做流处理，即实时的处理些实时数据流，实时的产生数据流结果，只要数据源源不断的过来，Fl ......

【Hadoop】nameNode启动过程源码分析

【Flink】Flink基本架构

Kafka深入解析

Kafka概述

Kafka API操作实践

Flink 写入数据到 Kafka

自定义Data Sink

Data Sink 介绍

如何自定义 Data Source

Data Source 介绍

访问最多的文章

存档

公告

分类

标签

访问最多的文章

存档