最近这一两周看到不少互联网公司都已经开始秋招提前批了。
不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。
最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。
总结链接如下:
喜欢本文记得收藏、关注、点赞。更多实战和面试交流,文末加入我们
大家好,今天我们继续聊聊 AI 科技圈发生的那些事。内容包括:AI 科技圈最新动态和最新面试题总结。
Meta 推新一代 SAM 2
图像识别再进化!Meta 推新一代SAM 2
官方链接:https://ai.meta.com/blog/segment-anything-2/
SAM 2 特点总结如下:
-
具有快速精准的对象分割能力,可在静态图像和动态视频中轻松应对。
-
实时追踪对象的能力使其在视频编辑和互动媒体内容制作领域具有广泛应用前景。
-
具有零样本泛化能力,能准确识别和分割未经训练的对象或场景。
EchoMimic
前段时间,建国和老拜同志对唱的视频比较火,今天分享一个类似的开源项目。
EchoMimic,不仅能够单独通过音频和面部标志生成人像视频,还能够通过音频和选定的面部标志相结合来生成肖像视频。官方地址:https://badtobest.github.io/echomimic.html
EchoMimic 已在各种公共数据集和我们收集的数据集上与替代算法进行了全面比较,显示出在定量和定性评估方面的卓越性能,其他可视化和源代码访问可以位于 EchoMimic 项目页面上。
AIGC 高频面试题
最近 AIGC 相关的面试题猛增,特别是爆火的LLM、多模态、扩散模型等考察的知识点越来越多。
有球友跟我反馈,上周面试了 AIGC 岗位,差点崩溃。
在这里我特别整理了一些代表性面试题,下图中的题目,你会几题?!
Diffusion
-
常见的采样方式以及原理?
-
扩散模型中添加的是高斯噪声,能否使用其他噪音的加噪方式?
-
如何加速Diffusion?
-
DDPM和DDIM的关系?推演DDPM公式。
-
GAN和Diffusion的区别?
-
训练Stable Diffusion时为什么要使用offset Noise?
-
介绍一下classifier-free guidance和classifier guidance的区别?
-
实现DDPM是否需要什么条件?
-
为什么DDPM加噪声的幅度不是一致的?
AIGC 高频题
-
细致讲从 DALLE 1 如何发展到 DALLE 3,每个算法的核心原理,每次的创新是什么
-
介绍MoE和变体
-
介绍LoRA和变体
-
介绍CLIP的模型架构与损失函数。谈谈AE,VAE和VQ-VAE的区别。
-
Stable Diffusion是如何训练的?
-
介绍一下最新版的 SD 和 Dall-E 两者的异同。
-
谈谈Stable Diffusion中的交叉注意力机制。
-
如何改善GAN的模式坍塌?
-
谈谈Lora/Dreambooth/Textual Inversion, 原理以及差异。
-
介绍一下CLIP的核心原理,模型怎么训练的?
-
CLIP 有哪些变体?
-
谈谈CLIP编码特征的优点缺点。