分类 BigData 下的文章

PySparkCore（pyspark的RDD算子）API汇总

1 为什么需要RDD 分布式计算需要: 分区控制 Shuffle控制数据存储\序列化\发送数据计算API 等一系列功能这些功能, 不能简单的通过...

2022 年 08 月 22 日

Spark简介、特点、框架模块及运行模式介绍

入门概念 Spark是什么 Apache Spark是用于大规模数据（large-scala data）处理的统一（unified）分析引擎。Spark ...

2022 年 08 月 22 日

Kafka工作流程、文件存储机制与组成单位原理

1 kafka工作流程及文件存储机制 Kafka中消息是以topic进行分类的，生产者生产消息，消费者消费消息，都是面向topic的。 topic是逻辑上...

2022 年 08 月 22 日

Kafka基本概述与三大命令

1 Kafka概述 1.1 定义 Kafka是一个分布式的基于发布/订阅模式的消息队列（Message Queue），主要应用于大数据实时处理领域。 1....

2022 年 08 月 22 日

Hive文件压缩方法与特点

1 压缩 1.1 压缩概述压缩技术能够有效减少底层存储系统（HDFS）读写字节数。压缩提高了网络带宽和磁盘空间的效率。在运行MR程序时，I/O操作、网络...

2022 年 08 月 22 日

巴涅波赫夫
模型直接用官方的，自己训练的准确率应该就上去了吧，理论上准确度...
Xiao
大佬，准确度比用yolo命令行出来的低了很多，是什么原因造成的...
君菇
大佬牛批
小有名气的道士
牛的，实现了。|´・ω・)ノ
Evan
hello之前的文章呢