首页 > 编程语言 >大模型算法方向实习会经常提问哪些问题?看完手撕面试官拿下offer!

大模型算法方向实习会经常提问哪些问题?看完手撕面试官拿下offer!

时间:2024-07-09 10:01:31浏览次数:13  
标签:面试官 offer AI 模型 项目 完手 面试 算法 原理

现互联网研发一枚,曾拿过多个算法/研发岗SP offer,简要介绍一下大模型算法岗面试内容和如何准备面试。大模型算法岗的面试内容,实际上可以拆解成两部分,一是算法岗通用的面试内容,二是大模型专有相关部分。

算法岗通用面试内容这部分内容很重要,因为通用的面试内容可以适用于不同的研发岗,包括算法、后端开发、数据开发等等,可以“一稿多用”;此外这部分基础掌握的好,也能给面试官留下基础扎实、高潜力的印象。

通用的面试内容,通常分为个人经历介绍、手撕代码、原理考察、创新性问题几部分。个人经历个人经历主要是自我介绍,接着面试官会根据简历和自我介绍中的项目提问。

因此需要详细准备自己的项目内容,可以用STAR方法整理,即背景是什么,项目的目标是什么,采取了什么行动,最终达成了什么结果。

举个例子:我负责了课题组的风力发电机故障诊断的项目,这个项目背景是风力发电机的运维成本极高(背景),需要对风力发电机故障进行实时诊断和提前预警(项目目标),因此利用了风力发电机100w+传感器数据,应用ResNet方法构建了风力发电机的故障诊断模型(行动),最终实现了提前预警,诊断精度提升了x%,发表了一篇一作SCI论文(结果)。

这样,面试官就会问关于项目的详细内容,例如如何提取故障特征,为什么使用ResNet,ResNet的原理是什么等等问题。

因此有必要准备一个自己非常熟悉的项目,把算法的原理、项目流程(数据预处理、特征选择、模型和数据)烂熟于心。

手撕代码第一部分项目介绍结束后,面试官会给1~2道算法题让面试者完成,来考察面试者的基本功。因此有必要多刷一些力扣题(leetcode),至少刷完力扣hot 100题。力扣100题基本上是各企业面试常考的题。要做到快速手撕代码,在刷题之前,也要熟悉基本的算法和数据结构。

例如数组、链表、堆、栈、队列、树、图等数据结构;以及排序算法(快速排序、归并排序、二分搜索)、搜索算法(深度优先搜索、广度优先搜索等;还要学会分析代码的时间复杂度和空间复杂度、优化代码。

一般手撕代码写不出来的话,可以先考虑写一个暴力解,再去思考如何优化。当然有些很硬核的公司(例如Optiver,NVIDIA等外资),可能不仅局限于把力扣上的题写出来,还会涉及用代码实现一个底层逻辑(例如实现一个卷积核)。原理考察这部分仍然是看基础。

例如对于深度学习、自然语言处理、大模型的算法工程师,可能就会问例如反向传播算法的原理、ResNet、Transformer的原理;对于风控算法工程师,则会考察如LightGBM、Xgboost和随机森林算法的原理。可以结合岗位JD来看自己需重点准备哪些机器学习算法的原理。

当然在手撕代码环节没有考察到的数据结构和算法,也可能被问到,例如快速排序、堆排序算法的原理。创新性问题这类问题就比较发散了,重点是看面试者在解决方案未知下的思考能力,一般会结合业务给一个问题。例如,对于风控算法面试,会提问如何基于数据构建一个好的风控模型,如果没有人行征信数据,又怎么构建好的风控模型?

大模型专有面试内容专有面试内容则包含了大模型的相关的知识,依据个人项目的相关性会给出不同的问题。个人经历如果个人经历中有大模型相关的项目,那么就会问项目细节。和上面通用的问题一样,需要应用STAR法则来梳理,并且熟悉项目中应用的算法原理。

未来可以不从事相关方向的工作,但紧跟时代前沿技术总是没有错的,说不定就赶上了新时代的风口~手撕代码这个环节和上面一样,但硬核的公司可能会要写一些模型底层的逻辑,例如用代码实现Encoder和Decoder。原理考察这里重点考察自然语言模型、深度学习模型、大语言模型相关的原理。例如Transformer的原理、Bert等自然语言模型的原理、ChatGPT的原理。可以通过岗位的JD来了解我们需要掌握什么内容。例如这是我在boss直聘上找到的JD。这里要求熟悉CNN、LSTM、BERT、GPT的原理,就可以从这几个知识点来准备。创新性问题这部分问题会结合应用场景和大模型来提问,例如公司需要一个医疗客服机器人,那么说说如何用大模型实现的思路。如何准备大模型算法岗面试1.打好基础1)熟悉基本的数据结构和算法,刷力扣题目。2)结合岗位JD学习所需要的深度学习模型、自然语言模型和大语言模型的原理、关键概念3)尽量尝试记住它的代码实现(不是必要)2.理论结合实践1)参加一些大模型相关的项目和竞赛,利用大模型技术解决实际问题。2)如果没有条件参加大模型相关的项目,也可以去Kaggle、Github等网站上找一些开源的项目来学习,熟悉项目内容。3)充分熟悉自己的项目,并思考如何用类似的流程来解决一些行业内的问题(创新型问题)。

如何学习AI大模型?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

在这里插入图片描述

标签:面试官,offer,AI,模型,项目,完手,面试,算法,原理
From: https://blog.csdn.net/2401_84204207/article/details/140287142

相关文章

  • 面试官:Java线程可以无限创建吗?
    哈喽,大家好......
  • 面试官:如何打破双亲委派机制?
    面试连环call双亲委派机制是什么?如何打破双亲委派机制?JVM都有哪些类加载器?如何构造一个自定义类加载器?Tomcat的类加载机制?Spring的类加载机制Class.forName()和ClassLoader.loadClass()区别?在开始讲述之前简单回顾一下之前的类加载过程类加载过程:加载->连接->初始化。......
  • 面试官:Java类是如何被加载到内存中的?
    面试连环callJava类是如何被加载到内存中的?Java类的生命周期都有哪些阶段?JVM加载的class文件都有哪些来源?JVM在加载class文件时,何时判断class文件的格式是否符合要求?类生命周期一个类从被加载到虚拟机内存开始,到卸载出内存为止,它的整个生命周期将会经历加载、验证、准备、......
  • 手工转测试开发成功秘籍揭秘:从裁员到入职18k+,收获4个Offer,道阻且长不怯步
    我之前是在一家金融公司工作,每天过得很安逸,同事也很互助和友爱,但是我的工作能力方面却一直没有很大的提升。大部分工作时间都是在做功能测试,每个季度会有一个接口自动化的考核目标。正是因为这样的环境,我开始意识到这是一个温水煮青蛙的环境,如果我一直维持现状,离开这家公司时,不论......
  • 【剑指offer】JZ23-链表中环的入口节点-Python解法
    1.题目描述2.解题思路(Python版)方法:双指针法思路:根据题目描述,需要找到一个链表环的入口节点,这个题目可以拆分成三个小问题:(1)如何确定一个链表中是否包含环?(2)如果有环,环中节点的数目如何计算?(3)如何找到环的入口?接下来分别解决上述三个问题:(1)如何确定一个链表中是否包含环:有......
  • 面试官:JVM调优,主要针对是哪一个区域?JVM内存结构是怎样的?
    作为一个Java程序员,在日常的开发中,不必像C/C++程序员那样,为每一个内存的分配而操心,JVM会替我们进行自动的内存分配和回收,方便我们开发。但是一旦发生内存泄漏或者内存溢出,如果对Java内存结构不清楚,那将会是一件非常麻烦的事情!本文笔者将为大家详解Java内存结构。面试tips聊聊......
  • 面试官:你了解git cherry-pick吗?
    事情要从一次不规范的代码开发开始说起背景故事时间2024年某个风平浪静的周五晚上地点中国,北京,西二旗,某互联网大厂会议室人物小杰,小A,小B,老K对话老K:昨天提交的代码被测试打回来了!为什么小B没开发完的内容也一起提交上去了?小B:啊?我不清楚啊,我在开发分支B开发完一部......
  • 【剑指offer】JZ22-链表中倒数第k个节点-Python解法
    1.题目描述2.解题思路(Python版)方法一:遍历两次思路:1.首先计算链表的长度L;2.第二次开始从头依次遍历,找到链表的第(L-k+1)个节点,即为所找的节点。参考代码:#classListNode:#def__init__(self,x):#self.val=x#self.next=None##代码中的......
  • 大厂面试官问我:在同步binlog的时候主库是一个时间,从库是一个时间,底层是怎么解决的?【后
    本文为【Mysql日志八股文合集(2)】初版,后续还会进行优化更新,欢迎大家关注交流~大家第一眼看到这个标题,不知道心中是否有答案了?在面试当中,面试官经常对项目亮点进行深挖,来考察你对这个项目亮点的理解以及思考!这个时候,你如果可以回答出面试官的问题,甚至是主动说出自己的思考,那在......
  • 面试官:告诉我为什么static和transient关键字修饰的变量不能被序列化?
    一、写在开头在上一篇学习序列化的文章中我们提出了这样的一个问题:“如果在我的对象中,有些变量并不想被序列化应该怎么办呢?”当时给的回答是:不想被序列化的变量我们可以使用transient或static关键字修饰;transient关键字的作用是阻止实例中那些用此关键字修饰的的变量序列化;当......