首页 > 编程语言 >NLP算法工程师面试题及复习资料

NLP算法工程师面试题及复习资料

时间:2022-11-03 14:00:46浏览次数:44  
标签:NLP 面试题 模型 这部分 复习资料 学习 算法 基础理论

机器学习AI算法工程   公众号:datayx


本文主要记录本人对 NLP 相关知识的积累,之前笔记做的很多,考虑到秋招已至, 在复习的过程中, 慢慢将这些知识屡清楚,然后将相关的知识笔记整理成专题,来帮助我更好的复习。


NLP算法工程师面试题及复习资料_机器学习


NLP算法工程师面试题及复习资料_机器学习_02


推荐使用 Typora 编辑器打开, 所见即所得。


本文相关代码 项目获取方式:

关注微信公众号 datayx  然后回复  面试  即可获取。



目录

1. 编程语言基础

该文件夹下主要记录 python 和 c++ 的一些语言细节, 毕竟这两大语言是主流,基本是都要会的,目前还在查缺补漏中。

  • C++面试题
  • Python 面试题

2. 数学基础

该文件夹下主要记录一些数学相关的知识,包括高数,线性代数,概率论与信息论, 老宋亲身经历,会问到, 目前尚在查缺补漏中。

  • 概率论
  • 高等数学
  • 线性代数
  • 信息论

3. 计算机基础理论知识

这部分内容一般不怎么考,因此,没有把重心放在上面,至少现在几乎没有遇到问这方面的, 有意思的是,投了阿里某部的NLP算法,居然来了个不懂NLP的来面,全程真的瞎聊,全是开发。

4. 机器学习基础

这部分已经开始进入正题了,事实证明,部分大厂会提及一些基础的机器学习算法知识,因此,这部分我觉得几个核心的模型是要会的。

  • 机器学习项目流程
  • 判别模型 vs 生成模型
  • 频率派 vs 贝叶斯派
  • 数据预处理
  • 特征工程
  • 特征工程-关联规
  • 模型 - SVM
  • 模型 - 聚类算法
  • 模型 - 决策树
  • 模型 - 逻辑回归
  • 模型 - 朴素贝叶斯
  • 模型 - 随机森林
  • 模型 - 线性回归

5. 深度学习基础

这部分主要讲述深度学习方面的基础知识,是核心点,但很多情况下,很多面试官的题基本差不多,不过我个人觉得,有这种全局的,全面的知识框架是有益的。

  • 深度学习项目流程

5.1 基础理论部分

  • 基础理论 - 多任务学习
  • 基础理论 - 集成学习
  • 基础理论 - 分类问题评估指标
  • 基础理论 - 距离度量方法
  • 基础理论 - 目标函数,损失函数,代价函数
  • 基础理论 - 偏差 vs 方差,欠拟合 vs 过拟合
  • 基础理论 - 数据角度看深度学习
  • 基础理论 - 梯度消失,梯度爆炸问题
  • 基础理论 - 维数灾难问题
  • 基础理论 - 指数加权平均
  • 基础理论- 局部最小值,鞍点
  • 基础理论 - 集成学习
  • 基础理论 - 集成学习

5.2 基本单元

  • 基本单元 - CNN
  • 基本单元 - MLP
  • 基本单元 - RNN

5.3 调参相关

  • 调参 - 超参数调优
  • 调参 - 激活函数
  • 调参 - 权重初始化方案
  • 调参 - 优化算法

5.4 Tricks

  • Trick - Dropout
  • Trick - Normalization
  • Trick - 融合训练集,验证集,测试集
  • Trick - 提前终止
  • Trick - 学习率衰减
  • Trick - 正则化

6. 统计自然语言处理

这部分前期的笔记做的不多,因此还没怎么开始。

7. 深度学习自然语言处理

这部分算是核心的知识了,这部分还需要逐渐完善,时间有点紧啊。

  • 文本数据预处理
  • 各大任务的评价指标
  • 改进 NLP 模型的一些思路

7.1 词向量三部曲

  • 词向量 - Word2Vec
  • 词向量 - Glove
  • 词向量 - FastText

7.2 预训练语言模型

  • 预训练语言模型 - BERT改进研究
  • 预训练语言模型 - 融入知识图谱
  • 预训练语言模型 - 自然语言生成

7.3 Attention 机制

7.4 文本分类

7.5 语义匹配

7.6 阅读理解

8. 源码阅读

这部分主要推荐一些自己阅读过的一些源码,有些源码是 NLP 相关, 有些是深度学习相关的,部分源码我个人有做注释,会相应的列出来。



不断更新资源

深度学习、机器学习、数据分析、python

 搜索公众号添加: datayx  

NLP算法工程师面试题及复习资料_机器学习_03



机器学习算法资源社群

不断上传电子版PDF资料

技术问题求解

 QQ群号: 333972581  


标签:NLP,面试题,模型,这部分,复习资料,学习,算法,基础理论
From: https://blog.51cto.com/u_15404184/5819457

相关文章

  • vue常见面试题
    vue路由跳转有几种方式vue中router和routr的区别vue路由有那两种模式,这两种模式的区别vue中scoped的原理防抖节流的理解vuex的5个组成部分vue中如何生命全局变量计......
  • CSS面试题
    1、盒模型答:分为标准盒模型和怪异盒模型(IE盒模型)标准盒模型:宽高(content)+padding+border+margin怪异盒模型(IE盒模型):宽高(content+padding+border)+margin2、bo......
  • 微信小程序面试题
    1、简单描述下微信小程序的相关文件类型?答:微信小程序项目结构主要有四个文件类型,如下.json、.wxml、.wxss、.js、json主要是小程序设置,如页面的tabBar,页面标题,页面......
  • 深度学习相关面试题
    人工智能大数据与深度学习 公众号:datayx1.CNN的特点以及优势改变全连接为局部连接,这是由于图片的特殊性造成的(图像的一部分的统计特性与其他部分是一样的),通过局部连接和参......
  • 卧槽!这个价值百万的Github开源项目绝对要火!涵盖OCR、目标检测,NLP,语音合成多方向
    今天为大家推荐一个相当牛逼的AI开源项目,当前Star3.8k,但是大胆预判,这个项目肯定要火,未来Star数应该可以到 10k甚至20k!着急的,可以到GitHub直接去看源码传送门:​​ht......
  • Vue面试题43:Vue3性能提升体现在哪些方面?(总结自B站up主‘前端杨村长’视频,仅供自用学习
    分析vue3在设计时有几个目标:更小、更快、更友好,这些改进多数和性能相关,因此可以围绕介绍;思路总述和性能相关的新特性;逐个说细节;能说点原理更佳;回答范例......
  • 前端经典面试题
    HTML&CSS方面1、CSS选择器权重!important>行内样式>id选择器>类选择器>标签选择器>通配符>继承 2、盒模型在我们HTML页面中,每一个元素都可......
  • 【自然语言处理(NLP)】基于BiLSTM的关系抽取
    【自然语言处理(NLP)】基于BiLSTM的关系抽取作者简介:在校大学生一枚,华为云享专家,阿里云专家博主,腾云先锋(TDP)成员,云曦智划项目总负责人,全国高等学校计算机教学与产业实践资源建......
  • 你需要知道的webpack高频面试题
    谈谈你对webpack的看法webpack是一个模块打包工具,可以使用它管理项目中的模块依赖,并编译输出模块所需的静态文件。它可以很好地管理、打包开发中所用到的HTML,CSS,JavaScr......
  • 合格vue开发者应该知道的面试题
    Vue子组件和父组件执行顺序加载渲染过程:父组件beforeCreate父组件created父组件beforeMount子组件beforeCreate子组件created子组件beforeMount子组件mou......