logo of huolala

货拉拉大数据开发工程师(离线)(J18341)

社招全职3年以上地点:北京状态:招聘

任职要求


1、本科及以上学历,3年及以上的大数据工作经验;
2、熟悉Hadoop\Hive\Spark\Flink\Hbase\Kafka大数据生态常用组件;
3、具有较强的编码能力,对代码风格自我要求严格,精通HiveSql编写及调优,熟练使用Java/Python等至少其中一门语言;
4、精通ETL开发,熟悉数据仓库建设方法论,熟悉大型数据仓库架构和模型设计;
5、对数据质量有着自己一定的理解和想法,能提升平台的数据质量稽核能力;
6、有着优秀的沟通协调能力及团队合作精神,能够积极主动推动需求落地;
7、有风控模型、知识图谱相关工作经验者优先;

工作职责


1、负责数据仓库建设以及指标体系建设工作;
2、负责数据的ETL的设计、开发与性能优化;
3、与上游系统与下游应用同时沟通协作,推动各类需求在数据模型中的落地;
4、负责数据治理、数据质量等方案设计与落地;
5、协助算法工程师进行数据模型构建以及算法特征的数据落地;
6、参与风控场景数据挖掘和模型分析工作;
包括英文材料
学历+
大数据+
Hadoop+
Hive+
Spark+
HBase+
Kafka+
Java+
Python+
ETL+
数据仓库+
相关职位

logo of bytedance
社招A259456A

团队介绍:字节跳动推荐架构团队,负责字节跳动超10亿用户产品推荐系统架构的设计和开发,保障系统稳定和高可用;负责在线服务、离线数据流性能优化,解决系统瓶颈,降低成本开销;抽象系统通用组件和服务,建设推荐中台、数据中台,支撑新产品快速孵化以及为ToB赋能;实现灵活可扩展的高性能存储系统和计算模型,打通离在线数据流,构建统一的数据中台,支持推荐/搜索/广告。 1、为大规模推荐系统设计和实现合理的离线/实时数据架构,打造业界领先的离在线存储、批式流式计算框架等分布式系统,为海量数据和大规模业务系统提供可靠的平台化基础设施; 2、深入推荐系统,探索数据架构如何为业务赋能,提升线上效果; 3、尝试打破现有边界,探索核心框架的演进、新技术的应用、推荐大模型的落地; 4、生产系统的TROUBLE-SHOOTING和成本优化,设计和实现必要的机制和工具保障生产系统整体运行的稳定性与效率。

更新于 2025-05-13
logo of ctrip
社招住宿业务开发

1、负责离线和在线数据的采集、清洗和加载; 2、负责通过专项分析,输出专项分析报告,为业务决策和监控提供数据支持; 3、负责携程大量商户/用户数据的分析和提炼。

更新于 2025-03-31
logo of bytedance
社招A98746

1、参与离线与实时数据仓库的构建,支持国际化本地生活业务的发展; 2、深入业务,理解并合理抽象业务需求,并负责落地实施,与业务团队紧密合作,为业务提供数据解决方案; 3、参与数据模型的设计,ETL实施,ETL性能优化,ETL数据监控以及相关技术问题的解决; 4、参与大数据应用规划和支持,为数据产品、挖掘团队提供技术支持; 5、参与数据治理工作,提升数据易用性及数据质量。

更新于 2025-06-05
logo of hello
社招技术

1、负责离线、实时集群的稳定性和性能调优 2、调研业界先进的存储引擎并引入到现有平台,搭建、开发以及运维 3、规划大数据存储的组件构成和技术方向,负责常规的技术选型 4、针对业务需求对开源工程进行二次研发和Bug修复

更新于 2023-09-08