logo of dji

大疆中/高级机器学习平台工程师(训练平台)

社招全职算法地点:深圳状态:招聘

任职要求


1. 精通Go/Python,熟悉Kubernetes+Docker云原生技术栈;
2. 深度掌握至少两家主流公有云API;…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 构建多云异构资源调度体系,整合多家云厂商的AI算力资源,设计优先级策略,实现跨平台资源池化管理和高效动态分配;
2. 设计数据智能路由方案,确保训练数据在混合云环境下高效流动,优化跨云数据同步效率;
3. 对接MLOps系统,实现训练任务编排、版本控制、模型监控等功能的深度集成;
4. 开发资源效能监控系统,实时追踪GPU利用率、任务排队时长等核心指标。
包括英文材料
Go+
Python+
还有更多 •••
相关职位

logo of mi
社招5年以上A174123

1. 负责一站式机器学习平台的架构升级,支撑百亿级广告收入规模下的商业化算法模型高效迭代 2. 负责深度学习工作流各环节的深度优化,包括特征和样本生产提效,模型训练加速等 3. 与商业化算法团队密切合作,支撑广告算法前沿技术探索和落地

更新于 2024-08-19北京
logo of alibaba
社招3年以上技术类-开发

团队介绍: "阿里巴巴国际数字商业集团的智能技术团队,负责阿里巴巴旗下多个国际化电商平台的搜索、推荐、广告、用增等技术。团队致力于将最前沿的AI技术与国际化电商业务问题深度结合,为用户打造更好更智能化的网上购物体验,同时赋能百万商家实现更高效的经营。 选择加入我们意味着投身入于高速发展的国际化电商业务,一起打造最先进的AI技术以驱动全球电商业务发展。" 职位描述: 1. 打造行业领先的AI工程平台: 设计并构建支撑算法模型高效迭代的标准化平台体系(特征平台、训练平台、在线推理框架等),打通算法创新与业务验证的“任督二脉”,加速模型价值落地。 2. 攻坚大模型工程化挑战: 深入探索生成式AI(AIGC)技术在实际业务中的规模化落地,主导大模型训练、推理加速、性能优化等核心工程难题的解决。 3. 开拓AI创新应用的边界: 积极探索AI在搜索/推荐/广告(搜推广)等核心场景的颠覆性应用(如生成式召回、生成式排序、行为大模型),以及AI Agent技术在智能运维、资源优化、智能客服助手等领域的创新实践,为业务创造新价值。

更新于 2025-11-25北京
logo of dji
社招算法

1. 负责业界/学界SOTA方案调研和原型验证; 2. 结合公司业务特点,给出AI Infra建设规划(重点是训练&推理优化); 3. 针对不同技术方案的成本、收益,给出方案选型建议; 4. 方案落地过程中进行风险把控和方向纠偏; 5. 指导一线工程师解决新方案落地过程中的卡点。

更新于 2025-04-22上海|深圳
logo of zhihu
社招

1. 负责自研机器学习平台的研发,设计和实现机器学习平台相关的基础设施和工具链; 2. 负责机器学习平台的需求落地,关注模型训练、推理过程中的稳定性、资源利用率等问题; 3. 负责GPU集群的运维工作。

更新于 2025-07-25北京