logo of ctrip

携程高级/资深爬虫工程师(MJ026823)

社招全职2年以上住宿业务开发地点:上海状态:招聘

任职要求


1.计算机相关专业,本科及以上学历,有2年以上爬虫相关经验。2.掌握至少一种开发语言Java/Python,具备良好的编码能力、扎实的数据结构知识 。3.熟悉TCP/IPHTTP及相关网络协议。4.了解各种Web前端技术,包括XHTML/XML/CSS/JavaScript/AJAX等。5.有反爬相关问题处理经验,熟悉常用的爬虫技术及架构设计。6.对分布式、多线程缓存消息队列等常用互联网技术有一定了解。7.热爱技术开发,善于学习,善于团队协作,能积极主动地参与公司产品研发等相关工作。8.熟悉移动端APP安全及逆向技术、图像识别技术、WebKit或其他浏览器引擎、JavaScript逆向技术,有相关经验者优先考虑。

工作职责


1.负责分布式网络爬虫系统的设计与开发工作。2.对多平台数据源(WEB/APP/H5/小程序等)进行数据采集及分析。3.通过逆向、图像识别、行为分析等技术提升爬虫核心技术突破。4.设计数据采集策略,提升数据采集效率及质量。
包括英文材料
学历+
Java+
Python+
数据结构+
TCP/IP+
HTTP+
Web+
XML+
CSS+
JavaScript+
AJAX+
系统设计+
多线程+
缓存+
消息队列+
相关职位

logo of didi
社招3年以上技术

1. 深入理解滴滴海外业务模式、流程和系统架构,和相关产品技术、业务运营高效沟通,设计合理的数据仓库架构。 2. 充分利用滴滴现有的各种数据仓库及反作弊处理平台,设计、开发和维护高效、可扩展的大数据处理系统,以支持安全反作弊业务的数据驱动决策和业务发展。设计并优化离线/实时数仓模型(如 ODS、DWD、DWS、ADS 分层),支持实时报表、监控和风控等场景。 3. 对多源异构数据(日志、事件消息、API、爬虫数据等)进行清洗、解析和结构化处理,提取关键业务信息。解决数据清洗中的 脏数据、格式混乱、缺失值、重复数据 等问题,提升数据质量。与数据开发、算法、业务团队协作,理解需求并构建高效的数据处理流程。 4. 跟踪大数据领域的新技术、新工具,不断探索并引入以提升团队的技术能力和项目效率。优化流式计算任务的 资源利用率(如 Flink 任务调优、Kafka 分区策略调整)。 5. 国际化安全反作弊技术团队其他开发工作。

更新于 2025-06-16
logo of didi
社招3年以上技术

1. 深入理解滴滴海外业务模式、流程和系统架构,和相关产品技术、业务运营高效沟通,设计合理的数据仓库架构。 2. 充分利用滴滴现有的各种数据仓库及反作弊处理平台,设计、开发和维护高效、可扩展的大数据处理系统,以支持安全反作弊业务的数据驱动决策和业务发展。设计并优化离线/实时数仓模型(如 ODS、DWD、DWS、ADS 分层),支持实时报表、监控和风控等场景。 3. 对多源异构数据(日志、事件消息、API、爬虫数据等)进行清洗、解析和结构化处理,提取关键业务信息。解决数据清洗中的 脏数据、格式混乱、缺失值、重复数据 等问题,提升数据质量。与数据开发、算法、业务团队协作,理解需求并构建高效的数据处理流程。 4. 跟踪大数据领域的新技术、新工具,不断探索并引入以提升团队的技术能力和项目效率。优化流式计算任务的 资源利用率(如 Flink 任务调优、Kafka 分区策略调整)。 5. 国际化安全反作弊技术团队其他开发工作。

更新于 2025-08-27
logo of ctrip
社招住宿业务AI &

1、负责离线和在线数据的采集、清洗和加载; 2、负责通过专项分析,输出专项分析报告,为业务决策和监控提供数据支持; 3、负责携程大量商户/用户数据的分析和提炼。

更新于 2025-03-31
logo of ctrip
社招住宿业务AI &

1、 对OTA领域及其商户和用户行为建模有兴趣 2、 参与业务分析、特征构建、模型建立、算法实现等过程,实现算法效果逐步迭代并跟进业务效果 3、 负责机器学习、深度学习等前沿问题的探索和研究,分析和解构实际应用场景,提供全面的技术解决方案

更新于 2025-10-09