为什么要对数仓进行分层
根据项目中的介绍,谈谈为什么要对数仓进行分层?。
根据项目中的介绍,谈谈为什么要对数仓进行分层?。
Hdfs 写数据流程也介绍一下。
那 Hdfs 读数据流程你了解吗?
Spark 执行流程详解。
ORC 与 Parquet 的较量。
本文介绍 MapReduce Shuffle
与 Spark Shuffle
的详情和区别。
本文介绍一些 hive
的常见优化方案。
窗口函数也叫OLAP函数(Online Anallytical Processing),可以对数据进行实时分析处理。窗口函数是面试中考察的重点。窗口函数通常用来解决统计汇总、排名、TopN、连续登录天数等问题。
本文会详解 MapReduce
工作流程。
求英雄的出场排名 top3
的出场次数及出场率。names
代表英雄名字。