logo of meituan

美团大数据架构-分布式计算引擎高级工程师

社招全职6年以上核心本地商业-基础研发平台地点:北京状态:招聘

任职要求


1.计算机基础知识良好,熟悉C++Java,对大数据计算或云原生感兴趣;
2.具有主流大数据计算引擎(包括但不限于Spark、Flink、Hudi、Iceberg等)的实际应用经验和原理了解,有引擎优化或平台化的经历;
3.熟悉Kubernetes架构及核心组件(如调度器、Operator)及大数据计算引擎云原生适配原理,有引擎优…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责构建基于Kubernetes的云原生分布式计算平台,支撑离线计算、实时流处理等多场景需求,实现计算资源的弹性伸缩与高效调度;
2.解决数仓生产场景下业务规模增长带来的引擎扩展性问题,通过优化Shuffle服务、向量化执行引擎以及内核改造,支撑每天百万级Spark Job,EB级数据处理,单作业百TB Shuffle,不断提升生产引擎稳定性和扩展性,保障核心数据的稳定产出;
3.综合调度、引擎层内核改造优化等多种技术方案持续提升计算效率,降低计算成本;
4.设计并实现云原生环境下的弹性扩缩容策略,结合K8s编排能力与计算引擎特性,应对流量洪峰与资源碎片化挑战。
包括英文材料
C+++
Java+
大数据+
Spark+
还有更多 •••
相关职位

logo of xiaohongshu
社招3年以上机器学习平台

【业务介绍】 我们是小红书内稠密类模型(LLM/MLLM/SD/CV/NLP)统一的AI平台QuickSilver,负责调度公司内所有稠密类模型训练与推理资源,基于自建的训推引擎,为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务;包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力。 工作职责: 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程,包括模型fine-tuning、推理服务化等 3、构建云原生架构,设计高可用、高性能的微服务体系 4、优化平台性能,提升系统稳定性和可扩展性

北京|上海|深圳
logo of alibaba
社招技术类-开发

业务介绍: 我们是阿里巴巴国际数字商业集团的智能技术团队,负责阿里巴巴旗下多个国际化电商平台的搜索、推荐、广告、用增等技术。团队致力于将最前沿的AI技术与国际化电商业务问题深度结合,为用户打造更好更智能化的网上购物体验,同时赋能百万商家实现更高效的经营。 选择加入我们意味着投身入于高速发展的国际化电商业务,一起打造最先进的AI技术以驱动全球电商业务发展。 岗位描述: 1、负责支持业务迭代:推进来自搜索、推荐、广告、用增各域的产品需求快速落地。 2、负责系统架构设计:负责搜索、推荐、广告引擎的架构设计与优化,支撑多语言场景下的高并发请求处理,满足全球用户低延迟、高可用的服务需求。 3、负责性能调优:针对召回排序、模型训练&推理、特征计算等模块进行工程性能优化(如分布式计算加速、内存管理、GPU资源调度等),提升算法迭代效率。 4、负责工程平台开发:构建算法与工程协同的标准化平台,包括特征实时化平台、在线推理服务框架、AB实验平台等,支持算法快速迭代与业务效果验证。 5、负责大模型工程优化:负责生成式AI技术的工程落地,包含大模型训练、推理加速、多模态内容生成等技术工作。 补充说明:同时也招聘面向25年应届毕业的同学;

更新于 2025-04-02北京|杭州
logo of alibaba
社招3年以上技术类-开发

团队与角色介绍: 我们是国际数字商业集团(AIDC)智能引擎事业群下属的广告引擎团队,致力于构建下一代智能广告技术平台。本岗位将深度参与广告引擎核心系统研发,聚焦在线服务架构优化、算法工程化落地、高并发系统性能调优及稳定性保障体系建设,通过技术创新驱动广告业务增长。 岗位职责: 1. 智能广告引擎架构设计 ○ 主导AIDC广告引擎核心模块的技术架构设计与开发,构建高可用、低延迟的在线服务系统 ○ 推进算法工程化落地,设计与实现特征工程、模型训练、在线推理全链路优化方案 2. 大数据处理平台研发 ○ 开发支持千亿级数据处理的分布式计算框架,优化离线批处理与实时流式计算任务效率 ○ 构建高性能特征存储与计算系统,支持毫秒级实时特征抽取与复杂特征交叉计算 3. 系统工程优化 ○ 主导广告检索/排序/机制模块的性能调优,实现QPS与系统资源利用率的持续提升 ○ 设计多级容灾方案,建立全链路监控体系,保障99.99%+的系统可用性

更新于 2025-04-01北京
logo of ctrip
社招2年以上国际业务开发

1.负责营销触达业务系统的开发,深入理解业务需求,通过打造业界领先的触达推荐用户增长技术体系,支持国际业务的高速发展; 2.系统的部署和维护,持续优化推送系统架构,提高系统在高并发、大流量下的容灾容错能力,保证系统的高可用性(性能、安全、容量); 3.在全域智能化投放的大背景下,参与推送引擎架构的长周期基建,通过算法推荐推高业务天花板。

更新于 2025-03-18上海