首页 > 其他分享 >数据类岗位简历优化指南

数据类岗位简历优化指南

时间：2024-06-04 17:56:27浏览次数：19

标签：指南优惠券简历岗位准确率随机随机变量模型描述

描述数据类项目：

描述数据源
在描述数据源时，将数据具体化。量化结果时，对于模型项目，可以将最后的准确率与随机准确率相比，对于分析项目，可以将最终的提升幅度与项目预期或同期的其他项目相比。
| 描述 | 改进后 |
| --- | --- |
| 从大量/海量数据中... | 从300万元的店铺销售额数据中.... |
| 显著提升 | 3%的转化率提升|
| 模型准确率达90% | 模型准确率达90%,与随机准确率45%相比，有了100%的提升;某品牌最终销售额提高3%，与预定的2%相比，有了50%的提升。
项目实现描述
应从整体的角度来描述，而不是对分析、挖掘的过程展开详细的描述，忽略了迭代的过程。

flowchart TD A[沟通、理解需求]-->B[数据分析、挖掘实现] C[分析结果并进行迭代]-->B D[上线并监控效果]-->C B-->D

技术点描述
相对于罗列技术，使用以下说法可能效果更好：
使用Python中的sklearn完成XXX 、运用R中的ggplot2完成XX
使用随机森林模型完成订单分类、使用K-Means聚类完成用户的划分

同时，写技术点的细节要适量，否则项目失去重点，过犹不及。在模型部分，不需要把所有模型都写上，如“利用线性回归、逻辑回归、决策树、随机森林等算法完成xxx”
这些具体的技术点是面试重点，因此需要在这方面精心准备

项目描述demo

通过与xx的沟通，明确项目需求，选取最近X天的x条历史数据进行训练；
通过Hive从数据库中提取X个备选变量，利用Python中的XGBoost包进行训练优化，并根据重要性筛选出X个变量；
模型上线后，在召回率为X%的基础上，准确率从随即准确率为X%，提升至X%,涨幅达到X%；
上线后自动化生成监控报表，并根据变量的重要性，随着时间的变化，进行周期为X天/周/月的迭代过程。

项目丰富途径

大厂竞赛：如阿里巴巴的天池大赛、华为codecraft算法竞赛等
自媒体：在各大平台发表技术类文章，形成自己的专栏或成为公众号号主。

面试技巧：

提前熟悉业务场景、企业同行情况

数据类岗位准备方向

数据分析：统计学、机器学习、数据库、业务
数据仓库：数据库

数据倾斜、窗口函数、维护数据字典、L1L2范数、AB测试

面试题汇总

数分:

划分连续型随机变量和离散型随机变量的依据
常见分布的分布函数/概率密度函数，以及分布的特性，如指数分布的无记忆性
随机变量常用特征的解释(期望、方差等)
中位数是否等于期望
常见分布的特征值
如何给没有学过统计学的人解释正态分布
列举常用的大数定律及其区别
阐述中心极限定理和正态分布的直接关系
如何利用编程语言设计实验证明中心极限定理
阐述假设检验的原理
在假设检验中原假设和备择假设选择的依据
阐述假设检验中的两类错误
解释P-value、显著性水平、检验效能
解释z检验和t检验
贝叶斯派统计和频率派统计的区别
贝叶斯定理和全概率公式的应用
贝叶斯定理解释“三门问题”

数据挖掘:

数据集的划分方式，及各种数据集的作用
阐述欠拟合和过拟合，解释产生的原因
常用的模型分类方法有哪些，如监督/非监督、参数/非参数有哪些
模型中参数和超参数的区别
线性回归模型对误差所做的假设
线性回归模型调优的方法
线性回归模型的优缺点
逻辑回归和线性回归的异同点
逻辑回归中L1、L2正则解释及其区别
决策树选择分支的几种方式及其区别
随机森林预测结果优于决策树的原因
随机森林与GBDT模型的异同点
针对预测、二分类、多分类的模型评估方法
解释准确率和召回率
阐述ROC和AUC的联系
简述混淆矩阵

基础知识

统计知识

1. 随机变量

概念
随机实验：在相同条件下对某随机现象进行大量重复观测。
举个栗子，APP给用户发放优惠券，以提升用户活跃度，促进用户消费。用户收到优惠券后是否会使用可以看作随机现象，将所有用户的优惠券使用情况进行汇总，计算优惠券的转化率，可以视为随机试验。
随机变量(X)：描述随机试验的结果，如抛硬币朝上的次数、优惠券的转化率，
类型
离散型随机变量
连续性随机变量

1.2 离散型随机变量

伯努利分布(0-1分布)

\[\begin{equation} \begin{split} Pr(X=1)=p \\ Pr(X=0)=1-p \end{split} \end{equation} \]

二项分布(n重伯努利分布)
n个重复独立的伯努利分布(重复独立：每个伯努利分布事件发生的概率均为p；各个试验的结果互相独立，不受其他试验的干扰)

1.3 连续性随机变量

标签：指南,优惠券,简历,岗位,准确率,随机,随机变量,模型,描述
From： https://www.cnblogs.com/Gimm/p/18218959

相关文章

个人求职简历（精选8篇）
HR浏览一份简历也就25秒左右，如果你连「好简历」都没有，怎么能找到好工作呢？如果你不懂得如何在简历上展示自己，或者觉得怎么改简历都不出彩，那请你一定仔细读完。互联网运营个人简历范文>男22本科AI简历市场营销[email protected]个人概述以互联网运营为......
22240定级指南小结
信息安全技术，网络安全等级保护定级指南一、基本概念和定级要素等级的含义：角度：从重要性等级的角度进行定级。1.对国家安全、经济建设、公共利益等方面的重要性。2.被破坏后造成的严重程度。概念解释：1.等级保护对象：网路安全等级保护工作的作用对象，主要包括通信网络设施......
PySpark JDBC 读写 MySQL 数据库保姆级指南
目录1.环境准备1.1安装PySpark1.2MySQLJDBC驱动2.PySparkJDBC连接配置2.1JDBCURL......
瑞云渲染动画：新用户专属100元渲染券领取指南
瑞云渲染作为业界知名的云渲染服务提供商，始终为用户提高高效、稳定的渲染解决方案。为庆祝“动画”新用户的加入，特上线新人专属福利——100渲染通用劵。这不仅是对新用户的热情，更是对提升创作效率的承诺。下面一起来看看如何轻松领取这份专属好礼把。活动时间：2024.5.31起，长期有......
使用 G-Suite 传统账户指南
我有一个个人域名，主要是为了获得电子邮件地址而购买的。该域名的所有电子邮件都被转发到我使用多年的谷歌账户。托管我域名的公司被另一家公司收购，新公司不再支持免费电子邮件。我有一个从未真正使用过的G-Suite传统帐户。我使用我的个人域名创建了该账户；但是，......
tg机器人怎么做简单：快速上手tg机器人制作的简易指南
对于初学者来说，制作一个TG机器人可能会显得有些复杂。但是，只要掌握了一些基本的步骤和技巧，你就可以轻松地上手并制作出属于自己的TG机器人。本文将为你提供一个简易的指南。一、明确需求在开始制作机器人之前，你需要明确你的需求。专属定制前往TG&broang，&改成@即可打造你的完......
Git操作指南：多人协作提交代码的规范
操作指南以TortoiseGit以例，多人或多台电脑之间同步协作少用gitpull，而是要通过以下方法右键点击gitsync，选择Fetch&Rebase等待Fetch完之后，在弹出来的选项中选择Rebase在Rebase窗口，点击StartRebaseFetch这步可以换成pull吗？因为rebase的时候，也是要merge的，不如提前me......
CSS 权威指南第4版 (it-ebooks)高清电子版阅读
书：pan.baidu.com/s/1rBHxL2rPDZHMMiXRpWBefA提取码：393j我的阅读笔记CSS基础知识：书中涵盖了CSS的基本概念，包括选择器、盒模型、布局、浮动等。CSS3新特性：针对CSS3的新特性，包括过渡（transitions）、变换（transforms）、动画（animations）等进行了详细的讲解。响应式设计：介绍了响......
Vue渲染函数与JSX指南
title:Vue渲染函数与JSX指南date:2024/6/3下午6:43:53updated:2024/6/3下午6:43:53categories:前端开发tags:Vue渲染JSX基础性能优化组件对比ReactJSX大项目测试策略第1章：Vue.js入门Vue.js的历史和背景Vue.js是一个用于构建用户界面的JavaScript框架，旨......
淘宝商品评论数据接口（Taobao.item_review）丨淘宝实时API接口指南
淘宝商品评论数据接口（Taobao.item_review）是淘宝开放平台提供的一个API，用于获取商品的评论信息。该接口对于商家分析商品反馈、顾客满意度以及进行市场研究具有重要意义。下面将介绍如何高效利用这一接口：一、注册和获取权限注册开发者账号：在淘宝开放平台注册一个开发者账号，......

赞助商

阅读排行