首页 > 其他分享 >【干货】大厂数据分析师面试,最常犯的2个技术错误

【干货】大厂数据分析师面试,最常犯的2个技术错误

时间:2025-01-10 10:31:28浏览次数:3  
标签:共线性 CDA 小伙伴 矩阵 问题 算法 干货 大厂 常犯

01专家简介

徐杨老师,CDA数据科学研究院教研副总监,主要负责CDA认证项目以及机器学习/人工智能类课程的研发与授课,负责过中国人民银行结算中心数据分析内训、华夏银行数据分析内训、苏州银行总行数据挖掘内训项目,英国影子银行风险监管分析,纽约市场对香港市场高频交易分析项目。

在大厂的技术面试中,有两个地方是非常有难度的。很多小伙伴都折在的这两个地方。

1、算法的笔试题

我们知道大部分人在写算法的时候,通常都是把函数的前几个字母打出来,或者变量名的前几个字母打出来。按一下Tab或者按一下快捷键,就可以带出整个的函数名,然后自己就可以继续往后去写了。

比如说,之前就有一位小伙伴在笔试的时候拿到了一个手写算法的题。

那么分类算法比较好的有什么?有XGBoost,对吧?于是,小伙伴大笔一挥写下了import XGBoost

扣分的原因是什么

sklearn里那个包的名字叫什么?叫XGBoost吗?不是,那个包的名字叫XGBClassifier

这是一个很让人痛苦的事情,算法你会,但是你写不出来。

那就要求大家在日常的学习与工作中,一定要把常用的算法语句用的滚瓜烂熟,才可以让我们在这样的问题上有比较好的回答成果。

CDA数据分析师的能力测试大家可以抽空做做,提高一下自己对模型、函数的敏感度。

2、技术问题深挖掘

第二个在大厂面试中的难点是,把一个技术问题往下深挖好几次。

比如说最简单的一个算法回归分析。有可能在面试的时候面试官问你:

—— 同学,线性回归会吗?

—— 线性回归不能有共线性,你知道吗

Ok,开始提问

你解释了一下。我相信大部分小伙伴都可以解释的很清楚。

下面再往下挖一层:怎么检测共线性

有的小伙伴可能直接就说,共线性嘛,系相关系数就可以啊。

结果被扣分了。为什么

我们现在要检测的是线性回归里的相关性,那是要考虑偏相关问题的。只用相关技术矩阵可以吗?不够用的,应该用一些更加深入的指标,比如说VIF值等等去检测。

比如说这个问题你正确的回答了出来,检测变量之间的相关性,可以使用VIF值。

那就再往下挖,为什么要检测变量之间的相关性呢

如果我不考虑这个问题会有怎样的结果出现,那么你不能只回答,如果不考虑共线性问题的话,我这个模型预测效果不好。

显然面试官想要的不是这么直接的回答,他想问你的是这个问题的技术细节。

所以你在这个地方应该回答出的是

如果我们不处理共线性的问题,就会导致最后最小二乘法所需要的逆矩阵在被计算的时候,这个矩阵的行列式的值就会非常小。于是导致我们求出来的逆矩阵就会非常的大。这是一个非常不好的结果。你求出的矩阵,用这个矩阵算出来的所有参数的取值全都趋近于正无穷,你觉得这个效果能好吗?显然有问题。

如果到这儿你仍然可以准确的回答出来,这已经被挖了三次了,但是你要知道这个问题还可以继续往后挖。

我们再往后挖就是,如果普遍检测出了一共10个变量,这10个变量普遍VIF值都比较高,我们有什么好的方法来处理

有同学可能马上就会说,正则化方法嘛。

正则化方法又可以问问题了。

正则化方法有偏还是无偏?用完了以后效果怎么样?哪个包可以实现?

我们发现这种技术问题,面试官可以就一个点给你一直往下深挖好几层。

我看过一个调查,同一个问题,当一般往下深挖到第5层的时候,大部分人就已经回答不出来了

所以这就要求大家平时在学习与工作中,要把每一个技术细节都掌握好,要把技术细节之间的联系找到。因为往下深挖,其实挖的就是这些技术点之间的联系,这是第二个在大场面之中非常容易折的一个点。

CDA数据分析师认证考试的一级和二级都注重对基础概念和知识的挖掘,这些考点都是结合给大厂、银行、金融机构内训总结出来的工作中最实用的技能和知识点。

抓住机遇,狠狠提升自己

随着各行各业进行数字化转型,数据分析能力已经成了职场的刚需能力,这也是这两年CDA数据分析师大火的原因。和领导提建议再说“我感觉”“我觉得”,自己都觉得心虚,如果说“数据分析发现……”,肯定更有说服力。想在职场精进一步还是要学习数据分析的,统计学、概率论、商业模型、SQL,Python还是要会一些,能让你工作效率提升不少。备考CDA数据分析师的过程就是个自我提升的过程。


如果你也想进一步提升职场竞争力,抓住时代红利,那么强烈建议考一个CDA证书。快人一步,点击下方卡片链接,了解证书含金量,获取题库及相关备考资料。

标签:共线性,CDA,小伙伴,矩阵,问题,算法,干货,大厂,常犯
From: https://blog.csdn.net/yoggieCDA/article/details/145050363

相关文章

  • 从上千份大厂面经呕心沥血整理:大厂高频手撕面试题(数据结构和算法篇 ,C++实现亲试可跑)
    目录 怎么判断两个链表是否相交?怎么优化?(字节跳动、货拉拉)手撕冒泡排序(美团)手撕快速排序(作业帮)手撕堆排序(美团)手撕归并排序(美团)手撕二分查找(VIVO)字符串的全排列(要求去重)(字节跳动)求一个字符串中最长不重复子串的长度(字节跳动) 反转字符串的单词:如何在原字符串上翻转......
  • Java集合面试题集——2025最新大厂面试
    1.集合框架2. ArrayList和LinkedList2.1 源码分析成员变量<spanstyle="color:#000000"><spanstyle="background-color:#282c34"><codeclass="language-java"><spanstyle="color:#5c6370">//Defaultinitial......
  • 【干货】2年银行数据分析师:大数据部门工作重点及技能要求
    持证人简介郭畅,CDA数据分析师二级持证人,安徽大学毕业,目前就职于徽商银行总行大数据部,两年工作经验,主要参与两项跨部门项目建设,项目中主要负责模型开发,数据分析,模型运营优化等工作。01银行大数据部工作重点风控是互联网信贷的工作重心,机器学习算法在做逾期客户以及防作......
  • 这份4577页的Java面试PDF,让我成功斩获阿里、字节等大厂offer!
       我为大家准备了一份超级全面的Java学习面试笔记,这份电子版笔记涵盖了诸多后端技术栈的面试题和答案,相信可以帮助大家在最短的时间内复习Java后端的大多数技术点和面试题,从而拿到自己心仪的offer。共4577页。整体还是比较清爽的,大家拿到后具体看就知道了。本手册目前......
  • Stable Diffusion完整入门指南,保姆级教程!干货满满
    前言AI绘画真的火了!最近观察员打开各大平台刷到的基本上都是用AI生成的画像、插画,甚至建筑设计这份完整版的AI绘画全套学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】区别于早几年的人工智能如今的AI只需要给它一......
  • TikTok营销实操干货:如何让你的外贸生意快速出圈?
    TikTok,作为全球下载量最高的短视频平台,已经成为外贸企业获取海外客户的强大工具。相比传统社交媒体,TikTok凭借其短视频传播的高效性和娱乐性,为外贸营销提供了新的增长机会。那么,外贸人应该如何玩转TikTok,让生意快速出圈?今天就分享一套TikTok营销实操干货技巧,助你打造爆款内容,精......
  • 《docker高级篇(大厂进阶):1.Docker复杂安装详说》包括:安装mysql主从复制、安装redis集群
    @目录二、高级篇(大厂进阶)1.Docker复杂安装详说1.1安装mysql主从复制1.2安装redis集群1.2.1面试题:1~2亿条数据需要缓存,请问如何设计这个存储案例哈希取余分区一致性哈希算法分区哈希槽分区1.2.23主3从redis集群扩缩容配置案例架构说明整体流程图知识点总结图使用步骤:注意点说明......
  • 深度学习小白初学者入门干货!
    前言:主要内容阐述了深度学习中常见的实验问题与实验技巧,包括消融实验、对比实验的做法及相关指标,数据集的分配问题,深度学习改进实验的顺序,预训练权重对改进和精度的影响,YAML模型结构图的绘制,训练的可重现性,pytorch模块内结构图的绘制,创新性,模块加入结构的方法,判断模型收敛与......
  • 干货!12个程序员证书​,含金量超高。从零基础到精通,收藏这篇就够了!
    近来IT行业成为了发展前景好高薪资的大热门,越来越多的人选择参加各种各样的计算机考试,就是为了拿含金量高的证书,提升自己的职场竞争力。那么程序员有哪些含金量高的证书可以考?下面小编将详细介绍一下含金量高的IT证书,避免大家在不需要的考试上浪费时间。01软考软考,全称......
  • 程序员如何设计logo,如何找Icon和插画(绝对干货)
    今天给大家带来点儿干货,真真儿的干货。作为一个程序员,不管你是平时要自己做博客网站、写文章,还是独立开发一些产品,基本上会用到一些图片资源,比如Logo、插画、icon,哪怕是写PPT,也是会用到的。Logo几乎做所有的产品都需要一个Logo,不管是APP还是Web应用,亦或者是浏览器插件、I......