logo of netease

网易资深爬虫开发工程师(杭州/广州)

社招全职5年以上网易职能地点:杭州状态:招聘

任职要求


1. 本科及以上学历,计算机相关专业,至少5年及以上项目开发经验,扎实的技术理论基础,数据结构以及算法等;
2. 熟练掌握 Python编程语言,掌握 Selenium、Scrapy、PlayWright等框架的用法,熟悉任意开源爬虫框架。
3. 熟悉 HTMLJavaScript,懂得分析常见 Web界面结构,掌握基本 jQuery、CSS、XPath等语法。
4. 熟悉 App逆向分析、调试、加固、混淆等技术;有 ollvm、unicorn开发经验…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 设计、开发、维护、重构分布式网络爬虫,从各种网站、APP中抓取并清洗结构化数据。
2. 负责持续运营和更新爬虫程序,识别和解决数据源变化和其他问题。
3. 爬虫性能优化,包括处理性能、爬取策略、占用带宽、反爬虫机制等方面。
4. 能够统计和分析爬虫数据,与其他团队合作,如数据工程师、数据分析师协作,以确保数据采集系统的有效性和可靠性。
包括英文材料
学历+
数据结构+
算法+
Python+
Selenium+
HTML+
JavaScript+
还有更多 •••
相关职位

logo of didi
社招3年以上技术

1、负责分布式爬虫系统架构的设计和开发; 2、负责对采集数据进行清洗、去重、结构化处理; 3、负责对反爬机制的研究分析,提升采集数据的成功率; 4、负责对系统的性能监控和调优,确保系统的高可用性和稳定性;

更新于 2025-09-18北京
logo of zhihu
社招5年以上

1. 负责知乎客户端(包括且不限于 PC/H5、Android、IOS、小程序等)反爬升级,保护业务资产不被非法获取。 2. 负责推动防护能力迭代升级,推动反爬治理能力有效落地。

更新于 2025-11-13北京
logo of hello
社招技术

1. 负责公司的爬虫平台建设与业务支撑; 2. 负责公司爬虫的技术调研以及策略优化; 3. 负责制定相关的反爬虫安全策略。

更新于 2024-01-29上海
logo of ctrip
社招2年以上住宿业务开发

1.负责分布式网络爬虫系统的设计与开发工作。2.对多平台数据源(WEB/APP/H5/小程序等)进行数据采集及分析。3.通过逆向、图像识别、行为分析等技术提升爬虫核心技术突破。4.设计数据采集策略,提升数据采集效率及质量。

更新于 2025-03-21上海