logo of netease

网易资深爬虫开发工程师(杭州/广州)

社招全职5年以上网易职能地点:杭州状态:招聘

任职要求


1. 本科及以上学历,计算机相关专业,至少5年及以上项目开发经验,扎实的技术理论基础,数据结构以及算法等;
2. 熟练掌握 Python编程语言,掌握 Selenium、Scrapy、PlayWright等框架的用法,熟悉任意开源爬虫框架。
3. 熟悉 HTMLJavaScript,懂得分析常见 Web界面结构,掌握基本 jQueryCSS、XPath等语法。
4. 熟悉 App逆向分析、调试、加固、混淆等技术;有 ollvm、unicorn开发经验优先。
5. 熟悉 HTTP、TCP等网络协议,精通 httpClient/jSoup/xpath/正则表达式/验证码处理/代理池等爬虫相关技术。
6. 掌握 Charles等抓包工具。
7. 了解 AndroidiOS系统底层原理及机制,熟悉汇编语言和加解密算法。
8. 有深入的大规模分布式爬虫集群实践经验。
9. 对新技术保持热情,持续学习并乐于分享,勇于技术创新与技术改进。
10. 具备良好的沟通能力,积极主动、自驱力强,有强烈的团队意识和执行力。

工作职责


1. 设计、开发、维护、重构分布式网络爬虫,从各种网站、APP中抓取并清洗结构化数据。
2. 负责持续运营和更新爬虫程序,识别和解决数据源变化和其他问题。
3. 爬虫性能优化,包括处理性能、爬取策略、占用带宽、反爬虫机制等方面。
4. 能够统计和分析爬虫数据,与其他团队合作,如数据工程师、数据分析师协作,以确保数据采集系统的有效性和可靠性。
包括英文材料
学历+
数据结构+
算法+
Python+
Selenium+
HTML+
JavaScript+
Web+
jQuery+
CSS+
HTTP+
Android+
iOS+
相关职位

logo of didi
社招3年以上技术

1、负责分布式爬虫系统架构的设计和开发; 2、负责对采集数据进行清洗、去重、结构化处理; 3、负责对反爬机制的研究分析,提升采集数据的成功率; 4、负责对系统的性能监控和调优,确保系统的高可用性和稳定性;

更新于 2025-09-18
logo of hello
社招技术

1. 负责公司的爬虫平台建设与业务支撑; 2. 负责公司爬虫的技术调研以及策略优化; 3. 负责制定相关的反爬虫安全策略。

更新于 2024-01-29
logo of ctrip
社招2年以上住宿业务开发

1.负责分布式网络爬虫系统的设计与开发工作。2.对多平台数据源(WEB/APP/H5/小程序等)进行数据采集及分析。3.通过逆向、图像识别、行为分析等技术提升爬虫核心技术突破。4.设计数据采集策略,提升数据采集效率及质量。

更新于 2025-03-21
logo of bytedance
社招2年以上A248307

1、遵循Robots协议,参与爬虫系统的建设与优化,满足各类业务数据需求; 2、负责分布式爬虫系统的建设,优化数据调度、抓取、解析、存储全栈流程; 3、帮助团队攻克各种爬虫技术难关,提升海量数据系统的抓取效果与性能。

更新于 2023-04-24