携程爬虫开发工程师(MJ027783)
社招全职2年以上住宿业务开发地点:上海状态:招聘
任职要求
1.计算机相关专业,本科及以上学历,有2年以上爬虫相关经验。 2.掌握至少一种开发语言Java/Python,具备良好的编码能力、扎实的数据结构知识 。 3.熟悉TCP/IP,HTTP及相关网络协议。 4.了解各种Web前端技术,包括XHTML/XML/CSS/JavaScript/AJAX等。 5.有反爬相关问题处理…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.负责分布式网络爬虫系统的设计与开发工作。 2.对多平台数据源(WEB/APP/H5/小程序等)进行数据采集及分析。 3.通过逆向、图像识别、行为分析等技术提升爬虫核心技术突破。 4.设计数据采集策略,提升数据采集效率及质量。
包括英文材料
学历+
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
数据结构+
https://www.youtube.com/watch?v=8hly31xKli0
In this course you will learn about algorithms and data structures, two of the fundamental topics in computer science.
https://www.youtube.com/watch?v=B31LgI4Y4DQ
Learn about data structures in this comprehensive course. We will be implementing these data structures in C or C++.
https://www.youtube.com/watch?v=CBYHwZcbD-s
Data Structures and Algorithms full course tutorial java
TCP/IP+
[英文] What is TCP/IP?
https://www.techtarget.com/searchnetworking/definition/TCP-IP
TCP/IP stands for Transmission Control Protocol/Internet Protocol and is a suite of communication protocols used to interconnect network devices on the internet.
HTTP+
https://developer.mozilla.org/zh-CN/docs/Web/HTTP
超文本传输协议(HTTP)是一个用于传输超媒体文档(例如 HTML)的应用层协议。它是为 Web 浏览器与 Web 服务器之间的通信而设计的,但也可以用于其他目的。
Web+
https://web.dev/learn
Explore our growing collection of courses on key web design and development subjects.
还有更多 •••
相关职位
社招5年以上网易职能
1. 设计、开发、维护、重构分布式网络爬虫,从各种网站、APP中抓取并清洗结构化数据。 2. 负责持续运营和更新爬虫程序,识别和解决数据源变化和其他问题。 3. 爬虫性能优化,包括处理性能、爬取策略、占用带宽、反爬虫机制等方面。 4. 能够统计和分析爬虫数据,与其他团队合作,如数据工程师、数据分析师协作,以确保数据采集系统的有效性和可靠性。
更新于 2025-11-21杭州
社招网易数智
1、采集互联网公开的信息,满足各类业务数据需求; 2、负责分布式爬虫系统的建设,优化数据调度、抓取、解析、存储全栈流程; 3、帮助团队攻克各种爬虫技术难关,提升海量数据系统的抓取效果与性能。
更新于 2025-06-06杭州
社招3-5年数据开发岗
1.负责海外电商平台的数据爬取、清洗与结构化存储,支持价格监控、竞品分析、商品推荐等业务需求; 2.解决反爬机制(如验证码、IP封禁、动态加密等),确保数据抓取的稳定性与效率; 3.参与爬虫框架的选型与开发,维护现有爬虫系统,提升代码可扩展性和健壮性; 4.分析目标网站结构及数据接口,动态调整爬取策略,应对网站改版或反爬策略升级; 5.与数据团队协作,确保数据质量及实时性,提供自动化数据监控与报警机制。
更新于 2025-06-17北京