【面试经验】滴滴大模型面经

时间：2024-10-12 22:48:06浏览次数：8

标签：1w pt 模型 sft 面经 rlhf 面试 rm 滴滴

本人只做点业务数据sft, 做的更加偏向于粗糙业务，直接被拷打麻了，望佬看到可以给我指点一下

现在有一个非常完备的sft指令集，你只能选择1w条，你如何选择数据来使模型的能力更加提升+完备？
我们知道sft的时候尽量不要注入知识给模型，因为只希望sft可以提升模型的指令遵循的能力，注入知识的话，可能会导致后面使用的时候模型容易出现幻觉，那我们怎么确保自己选择的这1w条数据没注入知识给模型呢？
7b和13b模型微调同一批数据，学习率哪个大？
Pretrain/sft/ppo学习率怎么变换？
学习率和batch大小变化一致吗？
做表征学习的时候，模型坍塌的原因？
为什么做rm的时候，用不同的小模型大模型来采样生成后训练出来的rm会比以前那种方法奏效？这很反直觉，因为按照直觉来说的话，这种方式可能会让rm偏向某个权威的模型
现在有很多种方法，有做完pt直接做rlhf的，也有按班就步的pt-sft-rlhf的，还有直接不做rlhf的，你觉得为什么这些方法都有效，你觉得是什么原因造成的？

标签：1w,pt,模型,sft,面经,rlhf,面试,rm,滴滴
From： https://blog.csdn.net/litterfinger/article/details/142890818

【面试经验】滴滴机器学习基础平台面经
量化的工作介绍；W4A8；SIMD中浮点数和整数指令；量化的逻辑，如果计算；W怎么计算到4位，A怎么计算到8位；量化校准策略；其他量化方法；FP16训练精度损失问题如何解决；增大BS为什么会减少通信次数；更新和保存的overlap如何做；GPT-2迁移后如何验证是对的；激活值、梯度、权......
JAVASE进阶面试题大总结
面向对象1.解释一下什么是继承在编程领域，“继承”是面向对象编程中的一个重要概念。继承是指一个类（称为子类或派生类）可以从另一个类（称为父类或基类）获取属性和方法。通过继承，子类能够重用父类的代码和功能，同时还可以添加新的属性和方法，或者修改父类中已有的方法的实现，以......
面试官：说下你的vue项目的目录结构，如果是大型项目你该怎么划分结构和划分组件呢？
一、为什么要划分使用vue构建项目，项目结构清晰会提高开发效率，熟悉项目的各种配置同样会让开发效率更高在划分项目结构的时候，需要遵循一些基本的原则：文件夹和文件夹内部文件的语义一致性单一入口/出口就近原则，紧耦合的文件应该放到一起，且应以相对路径引用公共的文件应该......
面试宝典--一般HR面会聊哪些软性素质
关注我，持续分享逻辑思维&管理思维&面试题；可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导；推荐专栏《10天学会使用asp.net编程AI大模型》，目前已完成所有内容。一顿烧烤不到的费用，让人能紧跟时代的浪潮。从普通网站，到公众号、小程序，再到AI大模型网站。干货满满。学成后可......
LLM面试问题
1、大模型LLM的训练目标大语言模型（LLM）的训练目标通常是最大似然估计。最大似然估计是一种传统方法，用于从给定数据中估计概率模型的参数。在LLM的训练过程中，使用的数据通常是大量的文本语料库。训练目标是最大化模型生成训练数据中观察到的文本序列的概率。具体来说，对于每......
AIGC产品经理面试，看这里！送你20道高频面试题及分析PDF文件！
作者简介小6，世界五百强产品出身，从0到1搭建公司IT团队，现任深圳某互联网公司IT负责人，<极客时间>课程讲师。愿景：希望可以让你在这里从对产品经理的一无所知到至少能找份相关工作！聊点AI面试的，这两年最火的产业，分享20道AIGC产品经理高频面试题，文章后面会有送PDF文件的方式......
【AIGC产品经理】面试7家，拿到2个offer，薪资中上水平
Hello，大家好，我是一名不知名的5年B端金融产品经验的产品经理，成功转行AI产品经理，前期面试了北京百度、阿里、理想汽车、百川智能、华为、OPPO等多家大厂面试，但是由于已定居成都，主动终止了后续需要线下的面试流程。最终，入职一家成都人工智能科技公司，做AI产品经理，薪资在当地算......
优秀的面试官！通过一个问题考察了所有网络编程知识点
一、写在开头本文的主题是和大家一起探讨学习：“在浏览器中输入URL开始后，计算机所做的几件事”，这个问题是好几年前自己面试的时候，面试官考问过的，当时准备十分不充分，回答的一塌糊涂，今天拿出来再整理学习一遍，一同进步！其实这个问题本身倒是不难，但它巧妙的是可以将我们所学过的网络编......
Java并发编程常见面试题
1.简要描述线程和进程的关系,区别以及优缺点进程:操作系统为程序分配的资源集合,每个进程拥有独立的地址空间。线程:同一个进程可以包含多个线程,他们共享线程的地址空间和资源。一个进程中可以有多个线程，多个线程共享进程的堆和方法区资源，但是每个线程有自己的程序......
递归算法的时间复杂度（通过一道面试题来讲解）
本篇通过一道简单的面试题，逐步分析递归算法的时间复杂度，最后找到最优解同一道题目，同样使用递归算法，既可以写出时间复杂度为O(n)的代码,也可以写出时间复杂度为O(logn)的代码。why?这是因为对递归算法的时间复杂度理解不够深入。下面通过一道面试题，来逐步分析递归算法的时间复......

【面试经验】滴滴大模型面经

相关文章

赞助商

阅读排行