影石Python开发工程师(爬虫)-2026校招
校招全职地点:深圳状态:招聘
任职要求
1. 本科及以上学历,计算机或相关专业; 2. 熟悉Python、HTML、JavaScript等编程语言,熟悉常见后端框架及爬虫框架如Scrapy、Selenium等; 3. 熟悉MySQL、MongoDB等主流数据库,熟练掌握SQL语句编写; 4. 熟悉Linux环境,能使用常用的Linux命令; 5. 熟悉网络基础,了解TCP/IP网络协议,熟悉HTTP协议; 6. 掌握爬虫原理,掌握正则表达式、XPath的使用,掌握常见抓包分析工具如Fiddler、Charles、Postman等,熟悉常见反爬机制及逆向手段; 7. 具备较强的抗压能力,有责任心,注重工作效率和代码质量。
工作职责
1. 负责根据业务需求和规划开展爬虫开发工作,包括数据解析与清洗,数据链路优化等,同时对现有爬虫进行维护和完善; 2. 参与爬虫核心技术研究,维护和升级现有技术体系,快速定位并修复现有软件缺陷,对线上问题进行及时响应并解决 3. 参与爬虫监测体系建设,及时监控及解决运行过程中出现的问题,确保数据的稳定性和准确性; 4. 参与公司内部爬虫平台的架构设计与开发,并结合业务场景及NLP等技术,实现产品化。
包括英文材料
学历+
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
HTML+
https://developer.mozilla.org/zh-CN/docs/Learn_web_development/Core/Structuring_content
[英文] Learn HTML
https://web.dev/learn/html
JavaScript+
https://developer.mozilla.org/zh-CN/docs/Learn_web_development/Core/Scripting
[英文] Learn JavaScript
https://learnjavascript.online/
The easiest way to learn & practice modern JavaScript
[英文] Learn JavaScript
https://web.dev/learn/javascript
https://www.youtube.com/watch?v=zuKbR4Q428o
Write bulletproof JavaScript code with unit testing!
Selenium+
https://www.youtube.com/watch?v=j7VZsCCnptM
Learn Selenium by building a web scraping bot in Python.
https://www.youtube.com/watch?v=mOAXEQevCAE&list=PLhW3qG5bs-L_s9HdC5zNshE5Ti8jABwlU
SQL+
https://liaoxuefeng.com/books/sql/introduction/index.html
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。
https://sqlbolt.com/
Learn SQL with simple, interactive exercises.
https://www.youtube.com/watch?v=p3qvj9hO_Bo
In this video we will cover everything you need to know about SQL in only 60 minutes.
MySQL+
https://juejin.cn/post/7190306988939542585
这是一篇 MySQL 通关一篇过硬核经验学习路线,包括数据库相关知识,SQL语句的使用,数据库约束,设计等。
[英文] MySQL Tutorial
https://www.mysqltutorial.org/
your go-to resource for mastering MySQL in a fast, easy, and enjoyable way.
https://www.youtube.com/watch?v=5OdVJbNCSso
MySQL SQL tutorial for beginners
https://www.youtube.com/watch?v=7S_tz1z_5bA
This beginner-friendly course teaches you SQL from scratch.
MongoDB+
https://learnxinyminutes.com/mongodb/
MongoDB is a NoSQL document database for high volume data storage.
https://studio3t.com/academy/#courses
The fastest way to learn MongoDB
https://www.youtube.com/watch?v=c2M-rlkkT5o
This video will give you and introduction to MongoDB in 1 Hour. Afterwards I recommend exploring aggregation, replication, and sharding.
https://www.youtube.com/watch?v=ExcRbA7fy_A&list=PL4cUxeGkcC9h77dJ-QJlwGlZlTd4ecZOA
You'll learn how to use MongoDB (a NoSQL database) from scratch. You'll also learn how to integrate it into a simple Node.js API.
Linux+
https://ryanstutorials.net/linuxtutorial/
Ok, so you want to learn how to use the Bash command line interface (terminal) on Unix/Linux.
https://ubuntu.com/tutorials/command-line-for-beginners
The Linux command line is a text interface to your computer.
https://www.youtube.com/watch?v=6WatcfENsOU
In this Linux crash course, you will learn the fundamental skills and tools you need to become a proficient Linux system administrator.
https://www.youtube.com/watch?v=v392lEyM29A
Never fear the command line again, make it fear you.
https://www.youtube.com/watch?v=ZtqBQ68cfJc
TCP/IP+
[英文] What is TCP/IP?
https://www.techtarget.com/searchnetworking/definition/TCP-IP
TCP/IP stands for Transmission Control Protocol/Internet Protocol and is a suite of communication protocols used to interconnect network devices on the internet.
HTTP+
https://developer.mozilla.org/zh-CN/docs/Web/HTTP
超文本传输协议(HTTP)是一个用于传输超媒体文档(例如 HTML)的应用层协议。它是为 Web 浏览器与 Web 服务器之间的通信而设计的,但也可以用于其他目的。
相关职位

校招技术类
1、负责公司爬虫攻防的技术调研、需求开发、难点攻关和运维优化; 2、实时监控爬虫的运行状态和预警处理; 3、参与数据层建设,进行多平台信息的抓取和红蓝分析,实现数据去重、解析、清洗、入库、统计分析等需求; 4、负责持续跟踪分析爬虫/反爬系统的技术缺陷,对策略架构做出合理地调整和改进,提升公司相关产品与服务的竞争力。

社招技术类
【广州】 方向一: 1、参与分布式爬虫和数据采集系统的架构设计和开发; 2、负责网络数据抓取规划、定期爬取指定网站的数据; 3、设计爬虫策略和防屏蔽规则,提升网页抓取的效率和质量; 4、参与数据层建设,专注于垂直领域数据爬取,进行多平台信息的抓取和分析; 5、实现数据提取、清洗、结构化、入库、统计分析等需求; 6、研究优化算法,提升爬虫系统的稳定性、可扩展性; 7、根据业务需要,完成上级安排的其他市场调研/数据分析/方案设计等工作。 方向二: 1、负责游戏自动化测试工具及平台的后台开发工作,dev-ops+测试自动化; 2、根据业务需要,完成上级安排的市场调研/数据分析/方案设计等其他工作。 【武汉】 1、参与Python分布式爬虫和数据采集系统的架构设计、开发和维护; 2、参与Python数据平台、Web服务、机器学习等相关开发工作; 3、根据业务需要,完成上级安排的市场调研/数据分析/方案设计等其他工作。
更新于 2025-08-11
社招3年以上内容-技术类
1.参与分布式爬虫系统的设计与开发; 2.负责平台外部数据覆盖,并解决高并发爬取、海量存储等问题; 3.负责监控框架的迭代和改进,维护所需资源池,并探索最新的技术能力; 4.负责部分硬件SDK开发(安卓或C++方向)。
更新于 2025-09-02