首页 > 编程语言 >面了美团大模型算法岗,问的贼细。。。

面了美团大模型算法岗,问的贼细。。。

时间:2024-08-19 22:51:47浏览次数:10  
标签:BERT 方式 美团 通俗易懂 面试 算法 讲解 模型

最近这一两周看到不少互联网公司都已经开始秋招提前批面试了。

不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。

最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。

《AIGC 面试宝典》圈粉无数!
《大模型面试宝典》(2024版) 发布!

喜欢本文记得收藏、关注、点赞。更多实战和面试交流,文末加入我们


今天分享我们一星球成员面试美团大模型面经:

一面

  • 文档大模型是一个独立的模型,会整合到一个大模型还是分离式的

  • 目前用的多大的模型

  • 是一个什么结构,对结构的一些了解 flamingo或者blip2的结构上的对比

  • 足够资源的情况下,哪个结构是最优的

  • 分辨率是如何解决的,文档的分辨率比较高

  • QA对匮乏如何解决的

  • ocr的性能目前是低于多模态大模型

  • 如何解决bbox感知力差的问题

  • 充足的算力,数据如何获取,如何有效的清洗

  • fuyu这种结构有什么优化的空间

  • 简单介绍下Transformer

  • 大概讲一下Transformer的Encoder模块?

  • 为什么transformer块使用LayerNorm而不是BatchNorm?

  • Transformer为何使用多头注意力机制?

算法题:手写multi-head attention;寻找两个正序数组的中位数 (LeetCode 4);只出现一次的数字 III (LeetCode 260)

二面

  • 请描述BERT的微调过程及其重要性

  • 解释什么是自注意力机制,以及它在BERT模型中的作用。

  • BERT与其它预训练模型(如GPT)有什么不同?

  • 如何评估BERT模型在特定NLP任务上的性能?

  • 如何解决BERT训练中的过拟合问题?

  • OCR文档大模型

  • Instruction tuning的决定性因素,哪些Instruction tuning策略效果更好,如何评估复杂度的性能

  • 如何保证数据集的多样性和复杂度

  • 分层的Instruction tuning数量的影响,数量和质量

  • 不同类型数据的影响,对下游任务的影响,自动化的数据配比,自动化的指标去做类似的事情

  • 专门优化的指标不再是一个好的指标

  • 使用其他的指标来引导模型的优化,而不是使用下游的指标,LLM使用的loss,作为指标,而不是benchmark的分数

  • 合理的评估指标是什么,openAI的压缩理论,training loss代表优化目标

  • AGI的几个阶段,deepmind发表

算法题:根据字符出现频率排序 (LeetCode 451); 只出现一次的数字 (LeetCode 136)

技术交流

在这里插入图片描述

用通俗易懂的方式讲解系列

标签:BERT,方式,美团,通俗易懂,面试,算法,讲解,模型
From: https://blog.csdn.net/m0_59596990/article/details/141336671

相关文章

  • Python 加载 TensorFlow 模型
    1.SavedModel和HDF5加载TensorFlow模型为了加载一个TensorFlow模型,我们首先需要明确模型的格式。TensorFlow支持多种模型格式,但最常见的两种是SavedModel和HDF5(对于Keras模型)。这里,我将分别给出加载这两种模型格式的示例代码。1.1加载SavedModel格式的TensorFlow模型SavedModel......
  • 层次聚类算法原理及Python实现
    层次聚类算法(HierarchicalClusteringMethod)是一种基于簇间相似度在不同层次上分析数据,从而形成树形聚类结构的算法。它主要分为两种形式:凝聚层次聚类(自下而上)和分裂层次聚类(自上而下)。以下将详细介绍凝聚层次聚类的原理与步骤:一、原理凝聚层次聚类算法的基本思想是将每个样......
  • 谱聚类算法原理及Python实现
    谱聚类算法(SpectralClustering)是一种基于图论的聚类算法,其原理与步骤可以详细阐述如下:一、原理谱聚类算法建立在谱图理论基础上,它将聚类问题转化为图的最优划分问题。具体来说,算法将数据集中的每个对象看作是图的顶点V,将顶点间的相似度量化作为相应顶点连接边E的权值,从而得......
  • 大模型agent开发之提示词选择器
    有时候单一的提示词模版无法满足复杂的任务需求,因此需要结合选择器使大模型有更加准确的判断,尤其是在高度上下文依赖性的对话或生成任务时,动态的选择最合适的示例或者提示词时尤其重要。本文同样使用langchain组件开发多用选择器方法。 长度智能选择器在langchain组件中Length......
  • 算法备案流程中的痛点攻克指南
    主体信息填报的难点主要包括以下几个方面:1.《落实算法安全主体责任基本情况》的填写:需要详细描述企业在算法安全方面的组织架构、专职机构设置、以及相关责任人的职责分配。2.算法安全责任人工作证明:必须提供算法安全责任人的身份证明和工作职责证明,这可能需要企业内部的详......
  • TCPIP路由技术第一卷第七章第三部分Eigrp邻居发现以及DUAL算法
    普通情况下eigrp每5秒发一次hello.在多点的x.25、帧中继和atm接口上,由于他们介入链路速率通常是t1或更低的速率,他们的hello数据包是以单播方式每60s发送一次的.hello包5秒一次常见接口ethernet,point-to-point,point-to-point子接口帧中继.hello包60秒一次常见接口nbmafra......
  • TCPIP路由技术第一卷第七章第四部分DUAL算法
    eigrp三张表neighbortoplogy目的网络的可行距离所有的可行后续路由器每一个可行后续路由器所通告的到达目的网络的通告距离.本地路由器所计算的经过每一个可行后续路由器到达目的网络的距离,也就是基于可行后续路由器所通告的到达目的子网的距离和本地路由器与该可行后续路......
  • tcp与udp的总结+connect阻塞+tcp三次握手、四次挥手+常见的服务器IO(发送数据+接收数
    一,TCP与UDP的基本总结TCP(传输控制协议)和UDP(用户数据报协议)是两种主要的传输层协议。TCP是面向连接的,提供可靠、顺序的传输,适用于需要高可靠性的应用,如网页浏览和文件传输。它通过重传机制和流量控制确保数据完整性。UDP是无连接的,速度快但不保证数据的可靠性和顺序,适用于对实时性......
  • yolov8双目测距(包含有前端的源码和无前端的源码Sgbm双目测距算法)-内含测距代码,视差图
    YOLOv8:YOLOv8是一个目标检测模型,它是YOLO(YouOnlyLookOnce)系列的一部分,用于实时物体检测。YOLOv8能够快速准确地检测视频或图像中的对象。双目测距:双目测距是指使用两个摄像头(或一个立体相机)从不同角度拍摄同一场景,通过比较两个摄像头捕捉到的图像差异来计算物体的距......
  • 数据结构与算法——滑动窗口
    目录引言核心思想使用场景解题步骤经典例题1、无重复字符的最长子串(LeetCode3)2、找到字符串中所有字母异位词(LeetCode438)引言定义:滑动窗口是指通过左右两个指针(或索引)来标记窗口的左右边界,随着指针的移动,窗口内的元素不断变化,从而实现对数组或字符串中连续子序列的......