base上海，数据科学，数据挖掘，数据分析等岗位求收留

时间：2024-06-10 11:59:30浏览次数：18

裁员了，base上海，数据科学，数据挖掘，数据分析等岗位，期望30k~40k，求推荐求收留

1，6年数据算法工作，做过指标体系搭建，用户画像，货品定价，社区分析，销量预测，车货匹配，运筹优化等项目；
2，熟悉回归，分类，聚类等机器学习算法，熟练掌握python，MySQL和Clickhouse等数据库，Hadoop大数据生态，Pytorch深度学习框架；
3，项目推动力好，能跨部门协调和资源整合，拥有0-1项目落地经验；
4，数理功底扎实，较强的逻辑分析能力，一流的数学建模思维，将复杂业务问题抽象成数学模型并工程化，英语不错，有2年带过5人团队经验，敏锐的商业洞察，做事踏实肯干；
5，有房地产和供应链物流领域垂直经验；

后面的内容是项目经验
——————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————

包钢厂内路网安全监控(运钢网) 2023.05~2024.01

为了对路网路段刻画和车辆司机精细化管理，特别是对车辆超速的预防管控，基于历史轨迹数据搭建DBScan+KDTree等机器学习算法技术绘制包钢厂内路网，在路网之上构建了疲劳，接打电话，分神，抽烟和超速五位一体的司机画像，按日，周和月跨度对司机驾驶行为进行监控输出BI报表，提升车队车辆的运营效率和安全保障。
1，包钢路网路段监控大屏作为标杆展示；
2，司机车辆，路网路段，分公司，车队等的分时BI报表；
3，为包钢厂内路网安全监控申请了专利；

轨迹相似度算法(运钢网) 2023.05~2024.01

来自中交兴路和，手机app，车联网的车辆定位数据会存在一些差异，对运单轨迹的对比展示非常不友好，容易对审计局对运单审查是造成误导，业务人员很难跟有关审计局人员解释，故需要一个来刻画不同轨迹相似度的算法，先后开发出基于余弦相似度算法，基于缓冲原理的相似度算法，基于图像切割的相似度算法，最后融合第二种和第三种算法优点形成一个稳健相似度算法服务，能够客观科学的评估任意2条运单轨迹的相似度；

智慧航空物流系统(吉祥) 2021.01~2023.01

为运营中心预测次日所有航班的可供货邮体积和可供货邮重量，从信息部接入近3年的航班信息，起飞降落业载，航空燃油，乘客行李及货邮共5个主题数据，对数据摸底，梳理关键指标，搭建了基于时间序列分析+GBDT+Ridge回归的算法框架，并配合运营中心人工测量搜集近万条航班的货邮行李体积数据作进行校验。
带领团队搭建智慧航空货运系统，完成从0到1的突破工作，攻克乘客人数预测精准度难题，一期验收结果是可供体积通过率92%，可供重量通过率85%，该项目申请了上海市创新项目；

社群内容分析(澜思) 2020.07~2020.12

针对五百多个微信群近二十万粉丝，按周频率对群友聊天记录进行统计分析，包括数据获取与存储，抽取原数据，进行清洗和整理，利用 NLP 算法技术构建楼盘人群画像，挖掘高频词，热门楼盘，用户关注价格区间，地理分布，形成专业的研究周报。梳理了报告内容和侧重点，丰富了报告内容，实现报表半自动化，提高了报告效率，节约了50%制作报告时间；

城市租售系统(易居) 2018.07~2020.04

为了搭建城市租售系统，系统全面梳理业务逻辑，完成业务调研和需求分析，跨部门内外获取数据，数据整理及量化，搭建完备且有层次的指标体系，为新产品上线提供准确可靠的数据支撑。
1，跨部门获取内外部数据；
2，从0到1搭建数据指标体系；
3，为研究报告等增值服务提供数据可视化和数据模型结论支撑；
4，获得集团创新产品奖；

标签：数据分析,轨迹,算法,base,相似,数据挖掘,数据,路网,搭建
From： https://blog.csdn.net/zengbowengood/article/details/139575138

kettle_Hbase
kettle_Hbase☀Hbase学习笔记读取hdfs文件并将sal大于1000的数据保存到hbase中前置说明：1.需要配置HadoopConnect将集群中的/usr/local/soft/hbase-1.4.6/conf/hbase-site.xml复制至Kettle中的Kettle\pdi-ce-8.2.0.0-342\data-integration\plugins\pentaho-big-data......
Zabbix 7.0 LTS OVF (build with LNMP based on Rocky 8.10) - VMware 虚拟机模板
Zabbix7.0LTSOVF(buildwithLNMPbasedonRocky8.10)-VMware虚拟机模板Zabbix7.0LTS|企业级开源监控解决方案请访问原文链接：https://sysin.org/blog/zabbix-7-ovf/，查看最新版。原创作品，转载请保留出处。作者主页：sysin.orgZabbix简介全方位监控获取整个IT......
腾讯冷启动论文阅读《Enhancing User Interest based on Stream Clustering and Memor
背景用户冷启动一直是推荐系统中的一个难题，新用户（或非活跃用户）由于缺少行为数据，模型预估不准确。为了改善用户冷启动，腾讯提出了UserInterestEnhancement(UIE)模型（论文中提到也可以用于item的冷启动）。基本思想是先对用户聚类，然后用userembedding检索最相似的k个聚类中心来表示......
Day4—电商日志数据分析
项目要求：根据电商日志文件，分析：1.统计页面浏览量（每行记录就是一次浏览）2.统计各个省份的浏览量（需要解析IP）3.日志的ETL操作（ETL：数据从来源端经过抽取（Extract）、转换（Transform）、加载（Load）至目的端的过程）为什么要ETL：没有必要解析出所有数据，只需要解析出有价值的字段即可。......
python-数据分析-Pandas-2、DataFrame对象
如果使用pandas做数据分析，那么DataFrame一定是被使用得最多的类型，它可以用来保存和处理异质的二维数据。这里所谓的“异质”是指DataFrame中每个列的数据类型不需要相同，这也是它区别于NumPy二维数组的地方。DataFrame提供了极为丰富的属性和方法，帮助我们实现对数据的重塑、......
seaborn常用的10种数据分析图表
内置示例数据集seaborn内置了十几个示例数据集，通过load_dataset函数可以调用。其中包括常见的泰坦尼克、鸢尾花等经典数据集。#查看数据集种类importseabornassnssns.get_dataset_names()importseabornassns#导出鸢尾花数据集data=sns.load_dataset('ir......
python-数据分析-Pandas-1、Series对象
Pandas是WesMcKinney在2008年开发的一个强大的分析结构化数据的工具集。Pandas以NumPy为基础（实现数据存储和运算）提供了专门用于数据分析的类型、方法和函数，对数据分析和数据挖掘提供了很好的支持；同时pandas还可以跟数据可视化工具matplotlib很好的整合在一起，非常轻松......
python-数据分析-Numpy-3、数组的运算
数组的运算使用NumPy最为方便的是当需要对数组元素进行运算时，不用编写循环代码遍历每个元素，所有的运算都会自动的矢量化。简单的说就是，NumPy中的数学运算和数学函数会自动作用于数组中的每个成员。#-*-coding:utf-8-*-#数组的运算#使用NumPy最为方便的是当需要对数组......
安装MySQL数据库时遇到sample Databases,select databases that should be created:有
SakilaDatabase：Sakila是一个经典的示例数据库，设计用于模拟电影租赁服务的业务流程。Sakila数据库包含电影、顾客、租赁、支付等表，可以用于练习SQL查询和了解数据库的关系模型。如果你想练习处理类似于电影租赁等实际业务场景的查询和数据操作，选择创建Sakila数据库是一......
python-数据分析-Numpy-2
数组对象的方法应用#-*-coding:utf-8-*-#数组对象的方法importmatplotlib.pyplotaspltimportnumpy#1、获取描述统计信息array1=numpy.random.randint(1,100,10)print(array1)#随机数组[64841052366431797]#计算总和、平均值、中位数pr......