logo of deepseek

深度求索高级数据采集工程师

社招全职DeepSeek地点:杭州状态:招聘

任职要求


1. 具备扎实的编程能力、优秀的设计能力和代码品味,具有强烈的责任心;
2. 熟练掌握HTMLJavaScriptPython、Scrapy等,能快速完成采集脚本的编写;
3. 了解主流网络数据采集技术和框架工具,如Selenium/…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 遵循robots 协议,对互联网公开信息进行采集;
2. 负责网页信息抽取技术算法的研究和开发,提升数据采集的效率和质量;
3. 负责设计和开发分布式的网络数据采集技术,能独立解决实际开发过程碰到的各类问题(优化调度、并发、覆盖率等) ,提升数据采集的效果与性能;
4. 负责数据采集解析入库、系统异常监控与警报等。
包括英文材料
HTML+
JavaScript+
Python+
脚本+
Selenium+
还有更多 •••
相关职位

logo of ctrip
社招住宿业务AI &

1、负责离线和在线数据的采集、清洗和加载; 2、负责通过专项分析,输出专项分析报告,为业务决策和监控提供数据支持; 3、负责携程大量商户/用户数据的分析和提炼。

更新于 2025-03-31上海
logo of bilibili
社招2年以上技术类

1. 负责公司内部商业化数据的开发和维护,为产品和营销团队提供数据支持和分析服务; 2. 设计和开发商业化数据仓库和数据集市,实现数据的采集、清洗、存储和分析; 3. 负责数据架构的设计和维护,确保数据准确性、完整性和安全性; 4. 参与业务需求分析和数据建模工作,编写SQL语句完成数据提取、转换和加载(ETL); 5. 能够独立完成数据问题的排查和处理,解决数据质量和性能问题; 6. 具有良好的沟通能力和团队协作能力,与不同部门的业务人员和技术人员合作,推进数据项目的进展。

更新于 2025-04-07上海
logo of kuaishou
社招D2816

1、建设全站的基础数据能力,提供丰富、稳定的短视频社区公共基础数据,探索更多数据能力的增量价值; 2、通过业务数据需求,提供数据采集埋点方案,跟进埋点全流程,交付结果,推进埋点质量相关建设; 3、各类数据专题体系(如房产、快聘等业务)的建设,通过数据+算法+产品,赋能业务,提供全链路、可分析、可复用的数据能力,提供更直观、更具分析指导性的产品化能力; 4、建设公司层面的核心数据资产,与业务场景深度结合,为社区服务提供数据服务化、数据业务化的数据&产品解决方案; 5、建设全站数据治理和管理体系,结合业务+元数据+技术,保障公司各个业务服务的数据质量和产出稳定。

更新于 2025-04-17北京
logo of kuaishou
社招3-5年D8193

1、参与各类通用地理位置相关服务的设计和开发; 2、参与海量位置相关数据的分析和挖掘,建设位置相关的数据仓库; 3、参与在线大流量高并发服务系统设计与开发; 4、分析现有系统的不足,定位系统瓶颈,提高系统性能和稳定性; 5、根据业务实际需求,为团队引入新技术和新方案; 6、以自身良好的项目管理与协调沟通能力,负责跨团队的重点项目的推进工作。

更新于 2025-08-19北京