
同程旅行高级数据采集工程师
社招全职地点:苏州状态:招聘
任职要求
1、了解项目目标,确定信息搜寻方向,为数据分析提供数据支持; 2 、自动化完成针对演唱会休闲玩乐等地域性信息收集,竞品信息收集,及其他相关影响因素数据收集,并跟踪实时变化动态; 3、参与分布式网络爬虫系统的架构设计和开发; 4 、和团队配合一起研究新技术与方法,解决爬虫稳定性问题。负责核心业务的反爬技术突破与攻坚。
工作职责
1、本科及以上学历,3年及以上相关工作经验; 2、熟悉常用开源爬虫框架,如crapy/pypider/elenium,具备多线程开发思维,了解线程安全相关知识; 3、熟悉常用的信息抽取技术,熟练使用正则表达式,熟悉JS混淆.逆向分析.抓包.伪装证书等技能; 4、熟悉常见的反爬虫技术,熟悉代理使用,有一定的对抗能力; 5、好钻研相关技术,能够主动提出技术设想者加分。
包括英文材料
数据分析+
[英文] Data Analyst Roadmap
https://roadmap.sh/data-analyst
Step by step guide to becoming an Data Analyst in 2025
系统设计+
https://roadmap.sh/system-design
Everything you need to know about designing large scale systems.
https://www.youtube.com/watch?v=F2FmTdLtb_4
This complete system design tutorial covers scalability, reliability, data handling, and high-level architecture with clear explanations, real-world examples, and practical strategies.
相关职位
社招系统
1. 遵循robots 协议,对互联网公开信息进行采集; 2. 负责网页信息抽取技术算法的研究和开发,提升数据采集的效率和质量; 3. 负责设计和开发分布式的网络数据采集技术,能独立解决实际开发过程碰到的各类问题(优化调度、并发、覆盖率等) ,提升数据采集的效果与性能; 4. 负责数据采集解析入库、系统异常监控与警报等。
更新于 2025-02-08
社招D2816
1、建设全站的基础数据能力,提供丰富、稳定的短视频社区公共基础数据,探索更多数据能力的增量价值; 2、通过业务数据需求,提供数据采集埋点方案,跟进埋点全流程,交付结果,推进埋点质量相关建设; 3、各类数据专题体系(如房产、快聘等业务)的建设,通过数据+算法+产品,赋能业务,提供全链路、可分析、可复用的数据能力,提供更直观、更具分析指导性的产品化能力; 4、建设公司层面的核心数据资产,与业务场景深度结合,为社区服务提供数据服务化、数据业务化的数据&产品解决方案; 5、建设全站数据治理和管理体系,结合业务+元数据+技术,保障公司各个业务服务的数据质量和产出稳定。
更新于 2025-04-17
社招D11761
1、建设全站的基础数据能力,提供丰富、稳定的短视频社区公共基础数据,探索更多数据能力的增量价值; 2、通过业务数据需求,提供数据采集埋点方案,跟进埋点全流程,交付结果,推进埋点质量相关建设; 3、支持消费、本地生活等业务的数据建设,通过数据+算法+产品,赋能业务,提供全链路、可分析、可复用的数据能力,提供更直观、更具分析指导性的产品化能力; 4、建设公司层面的核心数据资产,与业务场景深度结合,为社区服务提供数据服务化、数据业务化的数据&产品解决方案; 5、建设全站数据治理和管理体系,结合业务+元数据+技术,保障公司各个业务服务的数据质量和产出稳定。
更新于 2025-03-07