快手数据采集工程师
社招全职3-5年J0012地点:北京状态:招聘
任职要求
1、 本科及以上学历,计算机相关专业,有强烈的好奇心和技术敏锐度,对AI大模型和采集相关技术有浓厚的兴趣; 2、熟悉Java、Python等语言,具备扎实的编码能力;熟悉主流采集…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、遵循robots协议,采集互联网上允许搜索爬虫采集的公开非敏感信息,满足大模型、电商、本地等公司核心业务数据需求; 2、负责分布式采集系统的建设与迭代优化,负责数据调度、采集、数据结构化、持久化全链路核心流程迭代升级; 3、帮助团队攻克各种采集技术难关,提升系统的采集效果与效率。
包括英文材料
学历+
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
还有更多 •••
相关职位
校招J1014
1、遵循robots协议,采集互联网上允许搜索爬虫采集的公开非敏感信息,满足大模型、电商、本地等公司核心业务数据需求; 2、负责分布式采集系统的建设与迭代优化,负责数据调度、采集、数据结构化、持久化全链路核心流程迭代升级; 3、帮助团队攻克各种采集技术难关,提升系统的采集效果与效率。
更新于 2025-07-30北京
社招3年以上研发技术类
从公共、合成和人工来源获取和汇集数据集。 -自动化数据收集、清理和注释工作流程。 -审查和充实数据的质量和相关性。 -设置和管理注释工具和指南。 -维护数据集版本控制和文档编写。 -整合用户和产品的反馈,以改进数据。 - 与算法工程师、产品经理和其他团队合作。
更新于 2025-07-22上海
社招3-5年数据引擎
【数据采集工程师】 工作职责 1、负责分布式爬虫系统的设计与优化 2、负责大规模广域爬虫引擎的部署、开发、维护 3、负责大规模网页数据采集系统开发,互联网资源清洗和结构化,网页转码,网页聚合,信息抽取,网页分类 【数据解析工程师】 工作职责: 1、负责百亿级搜索内容解析系统建设,持续提升解析效果和性能 2、应用大模型技术,提升数据解析质量和成功率 3、负责互联网海量数据(网页、文档、富媒体等)的去重、清洗、结构化导入、分类、信息抽取与价值评估
更新于 2026-02-10北京|上海
