首页 > 其他分享 >数据类岗位简历优化指南

数据类岗位简历优化指南

时间:2024-06-04 17:56:27浏览次数:19  
标签:指南 优惠券 简历 岗位 准确率 随机 随机变量 模型 描述

描述数据类项目:

  1. 描述数据源
    在描述数据源时,将数据具体化。量化结果时,对于模型项目,可以将最后的准确率与随机准确率相比,对于分析项目,可以将最终的提升幅度与项目预期或同期的其他项目相比。
    | 描述 | 改进后 |
    | --- | --- |
    | 从大量/海量数据中... | 从300万元的店铺销售额数据中.... |
    | 显著提升 | 3%的转化率提升|
    | 模型准确率达90% | 模型准确率达90%,与随机准确率45%相比,有了100%的提升;某品牌最终销售额提高3%,与预定的2%相比,有了50%的提升。

  2. 项目实现描述
    应从整体的角度来描述,而不是对分析、挖掘的过程展开详细的描述,忽略了迭代的过程。

flowchart TD A[沟通、理解需求]-->B[数据分析、挖掘实现] C[分析结果并进行迭代]-->B D[上线并监控效果]-->C B-->D
  1. 技术点描述
    相对于罗列技术,使用以下说法可能效果更好:
    使用Python中的sklearn完成XXX 、运用R中的ggplot2完成XX
    使用随机森林模型完成订单分类、使用K-Means聚类完成用户的划分

同时,写技术点的细节要适量,否则项目失去重点,过犹不及。在模型部分,不需要把所有模型都写上,如“利用线性回归、逻辑回归、决策树、随机森林等算法完成xxx”
这些具体的技术点是面试重点,因此需要在这方面精心准备

  1. 项目描述demo
  • 通过与xx的沟通,明确项目需求,选取最近X天的x条历史数据进行训练;
  • 通过Hive从数据库中提取X个备选变量,利用Python中的XGBoost包进行训练优化,并根据重要性筛选出X个变量;
  • 模型上线后,在召回率为X%的基础上,准确率从随即准确率为X%,提升至X%,涨幅达到X%;
  • 上线后自动化生成监控报表,并根据变量的重要性,随着时间的变化,进行周期为X天/周/月的迭代过程。

项目丰富途径

  • 大厂竞赛 :如阿里巴巴的天池大赛、华为codecraft算法竞赛等
  • 自媒体:在各大平台发表技术类文章,形成自己的专栏或成为公众号号主。

面试技巧:

  1. 提前熟悉业务场景、企业同行情况

数据类岗位准备方向

数据分析: 统计学、机器学习、数据库、业务
数据仓库:数据库

数据倾斜、窗口函数、维护数据字典、L1L2范数、AB测试

面试题汇总

数分:

  • 划分连续型随机变量和离散型随机变量的依据
  • 常见分布的分布函数/概率密度函数,以及分布的特性,如指数分布的无记忆性
  • 随机变量常用特征的解释(期望、方差等)
  • 中位数是否等于期望
  • 常见分布的特征值
  • 如何给没有学过统计学的人解释正态分布
  • 列举常用的大数定律及其区别
  • 阐述中心极限定理和正态分布的直接关系
  • 如何利用编程语言设计实验证明中心极限定理
  • 阐述假设检验的原理
  • 在假设检验中原假设和备择假设选择的依据
  • 阐述假设检验中的两类错误
  • 解释P-value、显著性水平、检验效能
  • 解释z检验和t检验
  • 贝叶斯派统计和频率派统计的区别
  • 贝叶斯定理和全概率公式的应用
  • 贝叶斯定理解释“三门问题”

数据挖掘:

  • 数据集的划分方式,及各种数据集的作用
  • 阐述欠拟合和过拟合,解释产生的原因
  • 常用的模型分类方法有哪些,如监督/非监督、参数/非参数有哪些
  • 模型中参数和超参数的区别
  • 线性回归模型对误差所做的假设
  • 线性回归模型调优的方法
  • 线性回归模型的优缺点
  • 逻辑回归和线性回归的异同点
  • 逻辑回归中L1、L2正则解释及其区别
  • 决策树选择分支的几种方式及其区别
  • 随机森林预测结果优于决策树的原因
  • 随机森林与GBDT模型的异同点
  • 针对预测、二分类、多分类的模型评估方法
  • 解释准确率和召回率
  • 阐述ROC和AUC的联系
  • 简述混淆矩阵

基础知识

统计知识

1. 随机变量

  • 概念
    随机实验: 在相同条件下对某随机现象进行大量重复观测。
    举个栗子,APP给用户发放优惠券,以提升用户活跃度,促进用户消费。用户收到优惠券后是否会使用可以看作随机现象,将所有用户的优惠券使用情况进行汇总,计算优惠券的转化率,可以视为随机试验。
    随机变量(X): 描述随机试验的结果,如抛硬币朝上的次数、优惠券的转化率,

  • 类型
    离散型随机变量
    连续性随机变量

1.2 离散型随机变量
  1. 伯努利分布(0-1分布)

\[\begin{equation} \begin{split} Pr(X=1)=p \\ Pr(X=0)=1-p \end{split} \end{equation} \]

  1. 二项分布(n重伯努利分布)
    n个重复独立的伯努利分布(重复独立:每个伯努利分布事件发生的概率均为p;各个试验的结果互相独立,不受其他试验的干扰)
1.3 连续性随机变量

标签:指南,优惠券,简历,岗位,准确率,随机,随机变量,模型,描述
From: https://www.cnblogs.com/Gimm/p/18218959

相关文章

  • 个人求职简历(精选8篇)
    HR浏览一份简历也就25秒左右,如果你连「好简历」都没有,怎么能找到好工作呢?如果你不懂得如何在简历上展示自己,或者觉得怎么改简历都不出彩,那请你一定仔细读完。互联网运营个人简历范文>男22本科AI简历市场营销[email protected]个人概述以互联网运营为......
  • 22240定级指南小结
    信息安全技术,网络安全等级保护定级指南一、基本概念和定级要素等级的含义:角度:从重要性等级的角度进行定级。1.对国家安全、经济建设、公共利益等方面的重要性。2.被破坏后造成的严重程度。概念解释:1.等级保护对象:网路安全等级保护工作的作用对象,主要包括通信网络设施......
  • PySpark JDBC 读写 MySQL 数据库保姆级指南
    目录1.环境准备1.1安装PySpark1.2MySQLJDBC驱动2.PySparkJDBC连接配置2.1JDBCURL......
  • 瑞云渲染动画:新用户专属100元渲染券领取指南
    瑞云渲染作为业界知名的云渲染服务提供商,始终为用户提高高效、稳定的渲染解决方案。为庆祝“动画”新用户的加入,特上线新人专属福利——100渲染通用劵。这不仅是对新用户的热情,更是对提升创作效率的承诺。下面一起来看看如何轻松领取这份专属好礼把。活动时间:2024.5.31起,长期有......
  • 使用 G-Suite 传统账户指南
    我有一个个人域名,主要是为了获得电子邮件地址而购买的。该域名的所有电子邮件都被转发到我使用多年的谷歌账户。托管我域名的公司被另一家公司收购,新公司不再支持免费电子邮件。我有一个从未真正使用过的G-Suite传统帐户。我使用我的个人域名创建了该账户;但是,......
  • tg机器人怎么做简单:快速上手tg机器人制作的简易指南
    对于初学者来说,制作一个TG机器人可能会显得有些复杂。但是,只要掌握了一些基本的步骤和技巧,你就可以轻松地上手并制作出属于自己的TG机器人。本文将为你提供一个简易的指南。一、明确需求在开始制作机器人之前,你需要明确你的需求。专属定制前往TG&broang,&改成@即可打造你的完......
  • Git操作指南:多人协作提交代码的规范
    操作指南以TortoiseGit以例,多人或多台电脑之间同步协作少用gitpull,而是要通过以下方法右键点击gitsync,选择Fetch&Rebase等待Fetch完之后,在弹出来的选项中选择Rebase在Rebase窗口,点击StartRebaseFetch这步可以换成pull吗?因为rebase的时候,也是要merge的,不如提前me......
  • CSS 权威指南 第4版 (it-ebooks)高清电子版阅读
    书:pan.baidu.com/s/1rBHxL2rPDZHMMiXRpWBefA提取码:393j我的阅读笔记CSS基础知识: 书中涵盖了CSS的基本概念,包括选择器、盒模型、布局、浮动等。CSS3新特性: 针对CSS3的新特性,包括过渡(transitions)、变换(transforms)、动画(animations)等进行了详细的讲解。响应式设计: 介绍了响......
  • Vue渲染函数与JSX指南
    title:Vue渲染函数与JSX指南date:2024/6/3下午6:43:53updated:2024/6/3下午6:43:53categories:前端开发tags:Vue渲染JSX基础性能优化组件对比ReactJSX大项目测试策略第1章:Vue.js入门Vue.js的历史和背景Vue.js是一个用于构建用户界面的JavaScript框架,旨......
  • 淘宝商品评论数据接口(Taobao.item_review)丨淘宝实时API接口指南
    淘宝商品评论数据接口(Taobao.item_review)是淘宝开放平台提供的一个API,用于获取商品的评论信息。该接口对于商家分析商品反馈、顾客满意度以及进行市场研究具有重要意义。下面将介绍如何高效利用这一接口:一、注册和获取权限注册开发者账号:在淘宝开放平台注册一个开发者账号,......