logo of didi

滴滴资深爬虫开发工程师(J250918019)

社招全职3年以上技术地点:北京状态:招聘

任职要求


1、本科及以上学历,三年以上后端开发经验,能力突出者可放宽要求;
2、精通javapython,掌握异步编程、多线程/多进程同步等技术;
3、熟悉web,app抓取的技术原理,熟悉常用的爬虫框架和组件;
4、熟悉反爬技术,对设备指纹、验证码识别、js混淆等有一定的了解;
5、熟悉常用的数据库:MysqlRedisESKafka等,有大数据开发经验优先;

加分项
1、有前端开发经验者优先;
2、有通用爬虫设计经验者优先;
3、有手机群控后端开发经验者优先;

工作职责


1、负责分布式爬虫系统架构的设计和开发;
2、负责对采集数据进行清洗、去重、结构化处理;
3、负责对反爬机制的研究分析,提升采集数据的成功率;
4、负责对系统的性能监控和调优,确保系统的高可用性和稳定性;
包括英文材料
学历+
后端开发+
Java+
Python+
多线程+
Web+
JavaScript+
MySQL+
Redis+
ElasticSearch+
Kafka+
大数据+
前端开发+
相关职位

logo of netease
社招5年以上网易职能

1. 设计、开发、维护、重构分布式网络爬虫,从各种网站、APP中抓取并清洗结构化数据。 2. 负责持续运营和更新爬虫程序,识别和解决数据源变化和其他问题。 3. 爬虫性能优化,包括处理性能、爬取策略、占用带宽、反爬虫机制等方面。 4. 能够统计和分析爬虫数据,与其他团队合作,如数据工程师、数据分析师协作,以确保数据采集系统的有效性和可靠性。

更新于 2025-06-20
logo of hello
社招技术

1. 负责公司的爬虫平台建设与业务支撑; 2. 负责公司爬虫的技术调研以及策略优化; 3. 负责制定相关的反爬虫安全策略。

更新于 2024-01-29
logo of ctrip
社招2年以上住宿业务开发

1.负责分布式网络爬虫系统的设计与开发工作。2.对多平台数据源(WEB/APP/H5/小程序等)进行数据采集及分析。3.通过逆向、图像识别、行为分析等技术提升爬虫核心技术突破。4.设计数据采集策略,提升数据采集效率及质量。

更新于 2025-03-21
logo of bytedance
社招2年以上A248307

1、遵循Robots协议,参与爬虫系统的建设与优化,满足各类业务数据需求; 2、负责分布式爬虫系统的建设,优化数据调度、抓取、解析、存储全栈流程; 3、帮助团队攻克各种爬虫技术难关,提升海量数据系统的抓取效果与性能。

更新于 2023-04-24