首页 > 编程语言 >211本硕二战腾讯大模型算法岗,已凉......

211本硕二战腾讯大模型算法岗,已凉......

时间:2025-01-16 13:58:01浏览次数:3  
标签:211 AI 免费 ...... 学习 本硕 CSDN 文末 模型

01

背景

本弱鸡 211 本硕,nlp,无论文有实习(老板没资源且放养),本科有 acm 经历(1 铜),面试 pcg 日常实习。

02

技术一面(时长1h)

Q1:了解什么机器学习算法,讲一下原理?

当时只记得实体识别用到了隐马尔可夫模型,讲了讲怎么怎么定义观测状态和隐藏状态、前向传播、解码和应用场景。

Q2:讲一下 Bert 的结构和怎么训练的,怎么用 bert 做下游任务?

八股,双向 transformer encoder 结构,预训练任务包括 MLM 和 NSP,详细讲了讲。下游任务做过文本分类、关系提取等,用 cls 做预测;也可以做摘要生成等任务。

Q3:有没有了解过 LLM,有自己调过吗,了解 RLHF 过程吗?

自己训练过 llama3 和 glm(8、9B),跑过 sft 和 dpo,有看过一些技术报告。当时用 deepspeed 跑的,然后讲了讲 RLHF 三个过程,最后 PPO 四个模型的作用。

Q4:有了解强化学习吗?能不能详细说说 PPO 是什么?

只通过 RLHF 了解过一点,好像跟面试官想要的答案不一致,跳过。

Q5:怎么扩展大模型的最大输入长度?

改变 transformer 结构(GQA,MQA,flash attention等),旋转位置编码 RoPE 等(只看过论文,自己用的很少,就想到啥说啥)

Q6:有了解过模型训练方法吗(当时没理解到该说啥,结果是问有没有了解过模型并行、流水线并行这些),有了解过 megatron 吗?

没用过(感觉要凉)

Q7:有了解过文生图吗?(这不是面试 nlp 吗,后续面试官说是部门里也有相关工作,像看看适合什么,从这感觉面试要挂了)

有了解过一些项目,diffusion 和 clip 原理,之前有自己跑过 unet+diffusion+vae 做文生图任务,讲了下为什么这么做。

Q8:手撕快排

当天晚上收到了参加二面的邮件,小激动。

03

二面

二面没有手撕代码,问了问项目:

  • 讲一下微调大模型是怎么做的,数据集怎么构建,数据怎么处理

  • 看项目中用了 RAG,讲一下设计流程

  • 其中文本 chunk 怎么做的,为什么这么做

  • 中间有没有遇到什么困难,怎么提高召回,如果文本输入大模型后效果不好怎么办

  • 怎么提高大模型的外推性

  • 有了解过文生图任务吗(怎么又问这个)

然后草草结束,一天后流程结束(挂了,继续努力)

如何学习AI大模型 ?

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】

标签:211,AI,免费,......,学习,本硕,CSDN,文末,模型
From: https://blog.csdn.net/m0_70486148/article/details/145111155

相关文章

  • JSP开放实验室预约管理系统2118f--(程序+源码+数据库+调试部署+开发环境)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容一、研究背景与意义随着教育和科研的不断发展,实验室资源的有效管理和开放共享成为重要议题。传统的人工管理方式存在效率低、资源浪费等问题,无法满......
  • Centos7.8安装Gitlab.211208
    公司为了合规性考虑,需要自己搭建私有化版的github。那不用想,肯定要上GitLab了。项目背景:服务器:华为云ECS,需要上公网,并在安全组打开80端口访问。用户:关闭公开注册,新建用户后,手动改密码,不用安装邮件服务。步骤:1.安装gitlab-ce仓库和安装包curlhttps://packages.gitlab.com/i......
  • 免费的FTP软件Filezilla终极使用方法.221111
    FTP是两台异地终端传输大文件的利器。最火也是最好用的FTP软件,当属FileZilla。使用方法:一.安装FileZilla服务器端安装server版,客户端安装正常版,下载地址:https://filezilla-project.org/二.服务器端配置:1.更改FTP端口,并在服务器端放开端口,不要使用默认的21.2.创建用户,指......
  • docker-compose安装mysql.211216
    0.安装docker-compose参见本站另外文章1.目录结构:按以下目录结构mkdir文件夹和相关文件**mysql目录下的data为数据目录,mysql的数据表、二进制日志文件就在这里。.env文件包含了一些变量,这些变量可以在docker-compose.yml文件中通过${variable_name}来引用。2.创......
  • mysql忘记密码的终极解决方案(docker-compose).211216
    MYSQL8的安全性能有所提高,装好后,各种不适应,需要各种调试。1.首先,root密码忘记或是更改,操作步骤:vimysql/config/my.cnf在[mysqld]的段中加上一句:skip-grant-tables=1保存并且退出vi。2.docker-composerestart进入bash,运行mysql-uroot-p,回车,直接进入。下面很重要,特别......
  • vivado学习笔记1211
                      ......
  • win10重装如何跳过微软账号直接设置本地帐户.221111
    ​在添加你的帐户界面,选择脱机帐户2.第二个页面,选择有限的体验3.第三个页面,设置自己本地的用户名4.第四个页面,设置自己本地的密码......
  • 升贴水的概念.221111
    是指在确定远期汇率时,是通过对汇率走势的分析确定其上升还是下跌。如果远期汇率比即期汇率贵则为升水,反之,便宜的话则为贴水,相应的涨跌的价格就是升水金额和贴水金额。在直接标价下:远期汇率=即期汇率+升水数(-贴水数)在间接标价下:远期汇率=即期汇率-升水数(+贴水数)升贴水数可以用......
  • 211. 大学生HTML5期末大作业 ―【 可爱的宠物狗主题网页(22页)】 Web前端网页制作 html5
    目录一、网页概述二、网页文件三、网页效果四、代码展示1.html2.CSS3.JS五、总结1.简洁实用2.使用方便3.整体性好4.形象突出5.交互式强欢迎来到我的CSDN主页!Web前端网页制作、大学生期末大作业、课程设计、毕业设计、网页模版源码、学习资料等,更多优质博客文章......
  • 使用js写个方法计算5000年内有多少个对称日,如:20211202,反过来也是一样
    要编写一个JavaScript函数来计算5000年内有多少个对称日,你可以按照以下步骤进行:确定起始和结束日期。遍历这个日期范围内的每一天。对于每一天,将其转换为YYYYMMDD格式的字符串。检查该字符串是否是对称的。如果是对称的,则计数器加一。以下是一个实现这个功能的JavaScript......