首页 > 其他分享 >双非本科大厂完全没机会?爆砍40w+年薪案例!

双非本科大厂完全没机会?爆砍40w+年薪案例!

时间:2024-04-07 12:32:38浏览次数:26  
标签:Flink Hive Kafka 40w 如何 双非 Hbase 数据 爆砍

今天的主人公也是大数据训练营中一个双非本科拿到满意offer的案例。

下面是一些聊天记录和面经,这名同学做的非常好的一个点,他把个人项目中的所用到的技术栈和项目具体的业务流程图以及用到的技术难点都做了总结。

Offer情况

从3月底到4月底,共接到约50次面试,很多面试官表达了简历写的很不错。
在这里插入图片描述

需要提醒的一点,现在的招聘和以前不一样,每个面试都要认真对待,不能存在"试一试"的心理,尤其是中大厂/大的甲方平台的面试机会。

一些面经

应该同学要求,公司做了隐藏处理。这些技术点都不难,咱们的大数据训练营都有提及。

某头部大厂

一面

  1. Yarn中的资源调度模型

  2. MapReduce的工作流程

  3. Hive中的小文件如何处理

  4. 离线数仓业务中的数据是如何采集的,业务数据与行为数据分别存放在哪里,这些原始数据存储之后如何处理

  5. 业务开发的时候拉链表

  6. 从云平台拉取数据到Hive中需要注意什么

  7. 最终模型的粒度

  8. 主流数据库了解哪些

二面

  1. LeetCode原题:有效的电话号码、三数之和

  2. DataStream API介绍

  3. 实时集成:实时数据如何实现数据实时对账,如何通过数据自动化修复来保证数据一致性

  4. 内部某个环节导致程序短暂中断(但是并不是由于数据源导致的数据中断),然后将程序改正确之后如何保证数据一致性

  5. 如何确保实时程序运行过程中没有丢失数据或者漏掉数据的,如何识别

  6. 如果有丢失数据的情况是如何补救数据的

  7. Java多线程

  8. Hbase的rowkey设计原则,项目中如何设计

  9. Hbase的版本控制如何控制

  10. Spark数据倾斜如何解决

  11. ClickHouse的优缺点

  12. 项目调试Shell脚本用什么参数,500行的shell脚本,一段一段进行调试该怎么调试

  13. Shell脚本如何进行后台调用

深圳某大厂

  1. 介绍一下自己的项目经历

  2. 数仓分层和星型模型和雪花模型

  3. 传统的维度建模如何做

  4. 实时数仓项目介绍,流关联类型,广播流?

  5. CheckPoint的原理和作用,项目中的配置

  6. 自定义算子实现EOS语义

  7. 任务挂掉之后如何找到对应的checkpoint

  8. Flink CDC有用过吗

  9. MySQL的数据同步使用Flink CDC会吗

  10. Flink CDC的实现原理

  11. MySQL的Binlog被清理之后该如何做Flink CDC全量的处理

  12. Flink的会话窗口使用过吗,一般用在哪种业务场景下

  13. 滑动窗口、滚动窗口、会话窗口的区别是什么

  14. Flink的CEP用过吗,是用来干什么的呢

  15. 项目处理的量级,对应的集群规模,这个规模是一个集群管理呢还是多个集群管理

  16. 开发的时候遇到过哪些问题吗,技术上的问题

  17. 有了解过一些新版Flink的特性吗

某大型科技公司
一面

  1. 自我介绍

  2. HDFS的读写原理

  3. Hive的内部表和外部表的区别

  4. Hive的引擎有哪些

  5. MapReduce与Spark的区别

  6. Spark中的宽依赖和窄依赖有什么区别

  7. Kafka如何保证数据一致性的

  8. Kafka本主题在生产数据,Flink在消费数据,有的Flink消费快,有的Flink消费慢,有什么办法去检查这个A、B、C、D四个消费者的消费情况

  9. Hbase中写入数据的方式

  10. Kafka的数据通过Flink SQL写入到Hive中如何写入

  11. Flink的水位线主要解决什么问题的

  12. Hive的调优有什么思路吗

  13. Java中重载和重写的区别是什么

  14. Java中继承和多态的特点

  15. 往shell脚本中传入两个参数怎么传

  16. shell脚本中写个死循环如何实现:每个五秒钟,打印一句话

  17. Linux如何查看CPU的使用率

二面

  1. 项目的架构

  2. Kafka的基本问题:Kafka的理解,Kafka的问题是变相问的,不是直接问的,Kafka的性能瓶颈,cpu、memory、disk三方面来讨论

  3. Hbase的读写流程

  4. Hbase的大合并与小合并的区别

  5. Hbase的大合并与小合并对应的触发机制、对应的粒度

  6. 批量处理之类的脚本会写吗

  7. 会经常操作Linux吗,经常操作的Linux的指令对应的功能是什么

  8. 如何查看端口的占用情况

  9. 知道AWK是什么指令吗

  10. 查看CPU的命令还有印象吗

  11. 有处理过一些平台级别的故障吗

某大型科技公司2

  1. 自我介绍

  2. Flink的四大基石了解吗

  3. 讲一下Flink的watermark机制

  4. 了解窗口的触发器嘛Trigger

  5. Trigger和watermark之间是有什么区别的呢

  6. Kafka到Flink的端到端精准一次是怎么实现的

  7. Flink的状态过期如何处理

  8. 计算一个商品的营业额,10秒一次进行更新

  9. 乱序迟到数据的三种解决方法

  10. Flink的提交方式有哪些

  11. Kafka的分区策略有哪些

  12. Kafka的AR、ISR、OSR

  13. 什么情况下ISR中的follower会放到OSR中

  14. ClickHouse为什么查询速度快

  15. Spark的性能调优

  16. Hive的数据倾斜

  17. Hive的分区分桶机制

  18. Hbase的读写流程

  19. Hbase的数据热点问题如何解决

  20. HDFS的架构了解吗

  21. Hadoop的高可用是怎么实现的

  22. Java的多线程

  23. Java的锁机制,悲观锁、乐观锁、轻量级锁、重量级锁

  24. Java Spring MVC的运行流程

  25. 进程相关的Linux命令

  26. 网络传输协议的七层

  27. udp与tcp的区别

  28. tcp/ip协议

  29. http协议

  30. 二叉树——如何查询二叉树的高度

  31. 给一个数组实现一个循环的链表

  32. 项目中的计算链路

  33. 各个项目中Kafka的峰值数据

  34. 实时故障告警中涉及到的告警字段有哪些印象深刻的

  35. 实时级别是秒级还是分钟级

某信息公司

  1. Flink运行在哪儿,Yarn还是k8s上

  2. Flink提交任务都是使用的什么模式,Session、Per-Job、Application这三种模式之间的区别是什么

  3. Flink有什么机制能够保证在消费Kafka数据的时候不会造成数据丢失和数据重复

  4. ClickHouse中的表引擎使用的是哪种,为什么这么选择

  5. Kafka->Flink->Kafka->Flink->ClickHouse是如何实现端到端的Eos

  6. Flink中的Checkpoint的原理

  7. Flink任务的并行度如何做优化和调整的,Source端怎么考虑,Transform端怎么考虑,或者可以通过哪些指标来进行判断吗,判断哪些并行度设置大了或者设置小了

  8. Flink反压的优化,如何解决反压

  9. Flink数据倾斜的优化,如何解决数据倾斜,什么时候会出现数据倾斜

  10. Flink中两个比较大的数据量的流进行join需要考虑什么

在使用Union对侧输出迟到的数据以及合并后的数据再进行合并时还会造成数据丢失吗,会对程序的时效性造成影响吗

  1. ClickHouse这种OLAP型引擎为什么查询速度快

  2. 其他的OLAP型引擎了解过吗,比如doris或者stackRocks

  3. Flink是运行在Yarn上的,那么Yarn集群或者底层的HDFS组件出现过什么问题吗,会由于底层的故障导致Flink任务的失败吗

  4. 在使用Redis当作Hbase的二级缓存来实现Flink对应任务的这个场景下,为什么考虑Redis当作二级缓存,有考虑过Flink本身的缓存机制吗

  5. 维度建模的方法,事实表和维度表的设计有了解过吗

  6. 维度表的一些属性需要不需要冗余到事实表中,哪些需要冗余到事实表,哪些需要在做具体查询的时候做一个关联有考虑过吗?

总结

我在跟这个同学一对一聊简历的时候的明显感觉:

  • 该同学各个方面的背景并不是十分突出,不是名校。但是为找工作做了充足的准备,包括项目中的难点梳理和可能遇到的面试问题,所有工作都做在了前面。
  • 目标非常明确,行动力强。愿意花时间去研究训练营中项目用到的技术栈和原理。根据建议去对应的技术模块下整理知识点。
  • 这个同学自己总结了一个文档,根据训练营中的项目,以及个人项目总结面试点。包括:业务知识、架构图、项目流程图、项目中的集群数据规模、开发中遇到的技术问题等等。下面是一些截图:
    在这里插入图片描述

最后

《面向大厂的大数据训练营》正在进行中,项目内容来自一线大厂的真实线上项目,技术深度对标一线大厂大数据领域最前沿,最有深度的内容。来自阿里、字节的线上真实业务场景和源代码,全网唯一,本人亲自授课和一对一指导。适合在职提升、技术瓶颈期想进阶、脱离sql boy低级阶段、目前是头部一二线大厂的同学们学习。

过往同学拿到的大厂offer包括:阿里、蚂蚁金服、字节电商、字节商业化、快手、哔哩哔哩、比亚迪、吉利汽车、Shopee等,年薪40w~150w不等。

目标是想进入国内外一线top公司或者希望从基层开发者跃迁到大数据专家、架构师的同学可以联系我。个人vx:whispererrr。

个人主页:https://xrqg0udsbb.feishu.cn/wiki/Z3HBwWsxqi4pVQkiQyVcEmk0n1c

标签:Flink,Hive,Kafka,40w,如何,双非,Hbase,数据,爆砍
From: https://blog.csdn.net/u013411339/article/details/137459223

相关文章

  • 技嘉水雕II 360水冷散热器评测:稳压340W i9-14900K
    一、前言:极简卡扣连锁风扇设计再多风扇也只需2根线如今这个年代,DIY主机几乎都会配大量的RGB风扇,然而“光污染”虽然带来了视觉感官享受,在理线方面却非常繁琐。就拿360水冷来说,每个风扇必须要有专门的5VRGB接口和4Pin风扇供电接口,因而支持ARGB的360水冷散热器必须要8条线(包括水冷......
  • 双非ACMER成长记录
    博主自述:我是一名很普通的大一生,就读于广东普通一本的计算机专业(虽然学校是ACM名校,但博主本人0基础且天赋一般甚至有点差,所以debuff叠满)。暑假期间,接触到了校ACMQQ群,也认识了不少ACM队的学长,且参加了8月初举行为期14天的暑假新生ACM训练营。在此之前,自学了基本的C语言语法,也上洛......
  • 当985硕士有双非本科的“案底”……
    本文首发自公粽hao「林行学长」,欢迎来撩,免费领取20个求职工具资源包。了解校招、分享校招知识的学长来了!秋招逐渐结束,回看自己的秋招之旅,相信大家感慨颇多。而频繁上热搜的第一学历之痛更让一部分人觉得荒谬:辛苦读研三年,一朝求职仍看本科。从“唯学历论”到“唯第一学历论”,咱们这......
  • 双非18线小城市二本,成功上岸阿里P7(Android岗)
    前言双非一本、二本能进大厂么?能!自我介绍我,双非18线小城市二本,今年上岸阿里的P7岗(Android)但是作为一个错过秋招,学历不漂亮,实习转正被忽悠,从18线小城市到北京实习,投了上百份简历的苦逼双非学生,还是想说一句:进大厂太难难难难了!!!据说有6成的大学生都相信在毕业十年内能年薪过百万,而......
  • 2024双非网安保华五(中科大)电子信息经验分享
    为保证阅读效果,可移步我的CSDN查看个人情况本科:西部双非网安(转专业fw)rk:绩点rk2,综排rk1竞赛:计设国一,两个PPT大赛省一,发明专利一座,无国奖科研:无项目:两个目标检测省创,一篇边缘计算C会在投,还有个拿不上台面的恶意流量检测项目英语和专业课:四级562,六级495(建议六级500+),专业课......
  • 双非本科求职经验分享
    求职经验分享前言历时半个月时间,终于找到了一份.net开发的工作。双非本科。。。求职软件我手机下载了应届生求职不常用Boss直聘常用前程无忧不常用智联招聘常用猎聘不常用拉勾招聘不常用最常用的是Boss直聘,最后也是在Boss直聘上找到的工作,然后其次是智联招聘......
  • Intel正式发布雷电5:120Gbps带宽、240W充电逆天!玩法远胜USB4 2.0
    Intel正式发布了全新一代的Thunderbolt5接口标准,也就是雷电5,无论传输速度还是连接能力,都实现了一次巨大的飞跃,更是展示了基于雷电5的新一代笔记本、扩展坞原型。这里,我们就看看雷电5到底带来了哪些变化,可以如何改变我们的工作、生活和娱乐方式,以及Intel在背后有怎样的思考,做出了......
  • B0540W 肖特基二极管 品牌厂家 现货直供
    肖特基二极管,常用二极管之一,对于电子工程师来说,并不陌生。肖特基二极管,又称肖特基势垒二极管、热载流子二极管,英文SchottkyBarrierDiode,缩写SBD,是利用金属-半导体(M-S)接触特性制成,有点接触型和面结合型两种管芯结构。肖特基二极管SBD是一种低功耗、超高速半导体器件、广泛应用于......
  • 年薪40W,如何高效准备大厂AI算法岗面试?
    如果说求职是人生的一道坎,那么面试就是最难翻越的那一块砖。当你经历过大大小小的面试之后,就会发现不同的公司、不同的面试官问的问题都大同小异,因为企业对于挑选人才是有一些共性的要求的,只要在面试前根据高频问题提前准备,命中率几乎等于100%!但是,为什么还有很多技术精湛、经验丰富......
  • 入职就40W起,推荐系统何以成为算法皇冠?
    最近推荐系统越来越火爆了BOSS直聘2020年四季度人才吸引力报告显示,推荐算法已经连续2年成为平均薪资最高的岗位,平均年薪高达近40W。大厂必备核心——推荐系统从商业角度来讲,互联网主要起到平台作用,构建多方沟通桥梁,例如淘宝对应卖家和卖家,头条是信息产出方和读者,除了要满足用户本身......