Loading...
0 前言 Flink 有非常灵活的分层 API 设计,其中的核心层就是 DataStream/DataSet API。由于新版本已经实现了流批一体,Dat...
1 系统架构 对于数据处理系统的架构,最简单的实现方式当然就是单节点。当数据量增大、处理计算 更加复杂时,我们可以考虑增加 CPU 数量、加大内存,也就是...
0 前言 本文会用一个最简单的示例来说明 Flink 代码怎样编写:统计一段文字中,每个单词出现的频次。这就是传说中的 WordCount 程序——它是大...
0 前言 省流:小孩子才做选择。 谈到大数据处理引擎,不能不提 Spark。Apache Spark 是一个通用大规模数据分析引擎。它提出的内存计算概念...
1 Flink 流处理简介 1.1 Flink 是什么 Apache Flink 是第三代分布式流处理器,它拥有极富竞争力的功能。它提供准确的大规模流处理...