岗位职责:
1、负责设计、开发、维护爬虫系统;
2、参与多平台信息的抓取和分析;
3、建立完整的数据获取、解析、入库和监控流程,并不断优化迭代完善;
4、设计爬虫反屏蔽规则,提升网页抓取的效率和质量;
5、利用主流的大数据相关技术,对抓取后的网页数据进行清洗、存储等;并持续优化平台,以便满足各种爬取业务需求。
任职资格:
1、熟悉RUST语言,熟练掌握js反混淆,有实操经验优先;
2、实操过akamai,datadom,cloudflare等国外cdn供应商防护优先;
3、熟悉linux开发环境,熟练掌握java或python编程语言,熟悉js语言;
4、熟悉 web/app 常见的反爬机制,精通各种反爬破解,包括但不限于:Js防护、混淆、逆向分析、App防破解、防逆向、加固技术等技能;
5、有电商类网站爬虫经验优先,有高频爬虫工作经验者优先。
工作时间&地点:
(请仔细阅读以下事项安排,可接受的再投递简历!!!)
1、工作性质为全职,大部分时间可远程居家办公。
2、双休,每周工作5天休息2天,休息日可在周一到周五内自行选择休息2天或公司安排指定2天。
3、每周周一到周五需要有3个下午时间即14:00-18:00来公司工作 现场沟通。(其余时间和周末均可远程)
4、工作时间周中14:00-24:00,周末9:00-20:00。
5、法定节假日错峰调休。
6、因为做海外票务平台项目 业务高峰期和常规工作时间有一定时差, 非销售岗位。 公司接受远程办公主要是为了在这样特殊工作时间安排体系下能够尽可能为员工提供便利。
————————————————
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/yyw111111/article/details/143279786
标签:00,20,爬虫,抓取,工作,优先,30K From: https://www.cnblogs.com/yyy111-/p/18512930