这是从大厂,特别是互联网大厂几百份面试题中挑选各个知识点高频,又有一定难度的面试题,包含了大量每次面试经常问的面试题,吃透这份面试题,可以覆盖大部分八股文面试题。
目录
请详细说一说 Java 中的四种引用:强引用、软引用、弱引用、虚引用
Hadoop 的 Combiner 的作用,什么情况下不能用 Combiner
hadoop ha 当一个 namenode 挂掉。会有数据丢失吗。如果有,有什么解决方法
HDFS 的常见数据格式,列式存储格式和行存储格式异同点,列式存储优点有哪些
HDFS的块默认大小,64M和128M是在哪个版本更换的?怎么修改默认块大小?
MapReduce Shuffle为什么要将数据写入环形缓冲区
说下为什么要使用Hive?Hive的优缺点?Hive的作用是什么?
Hive的三种自定义函数是什么?实现步骤与流程?它们之间的区别?作用是什么?
Hive的cluster by、sort by、distribute by、order by区别?
Hive 的 join 操作原理,left join、right join、inner join、outer join 的异同
Hive row_number,rank,dense_rank 的区别
在删除 HBase 中的一个数据的时候,它什么时候真正的进行删除呢?当你进行删除操作,它是立马就把数据删除掉了吗?
Spark on standalone 模型、YARN 架构模型
Spark 的 RDD 是什么?具体解释下弹性是怎么实现的?
Spark Streaming的双流join的过程,怎么做的?
SparkStreaming和StructuredStreaming的区别
Flink的窗口了解哪些,都有什么区别,有哪几种?如何定义?
Flink的Checkpoint底层如何实现的?savepoint和checkpoint有什么区别?
Flink和Spark的区别?什么情况下使用Flink?有什么优点?
Flink backPressure反压机制,指标监控你是怎么做的?如何处理背(反)压?
请详细说一说 Java 中的四种引用:强引用、软引用、弱引用、虚引用
- 强引用
- 定义:强引用是最常见的引用类型,如通过
Object obj = ne
- 定义:强引用是最常见的引用类型,如通过