Loading...
1.1 传统数据处理架构 数十年来,数据和数据处理在企业中无处不在。多年来,数据的收集和使用一直在增长,公司已经设计并构建了基础架构来管理数据。大多数企业...
1 Zookeeper 入门 1.1 概述 Zookeeper是一个开源的分布式的,为分布式应用提供协调服务的Apache项目。 Zookeeper从设计...
1 Shell概述 Shell是一个命令行解释器,它接收应用程序、用户命令,然后调用操作系统内核。 Shell还是一个功能相当强大的编程语言,易编写、易...
1 共享变量 1.1 广播变量 # coding:utf8 import time from pyspark import SparkConf, Spa...
1 SparkSQL概述 1.1 SparkSQL简介 SparkSQL 是Spark的一个模块, 用于处理海量结构化数据。 SparkSQL是非常成熟...