logo of mi

小米顶尖应届-分布式模型训练优化工程师-汽车

校招全职地点:北京状态:招聘

任职要求


1.熟练掌握 Python DDP及底层技术原理,比如NCCL,RDMA,cuda,triton;
2.了解前沿的训练优化技术方向;
3.有机器学习相关…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.探索分布式训练技术在降低训练成本中的应用。
2.研究如何优化数据并行、模型并行、流水线并行等分布式训练策略,解决分布式训练过程中的通信开销、负载均衡等问题。
3.结合实际业务场景,设计并实现高效的分布式训练方案,缩短模型训练周期,提高计算资源利用率。
4.分析数据对模型训练成本的影响,在保证模型训练效果的同时减少数据获取与处理成本。

【课题名称】
优化模型训练成本
【课题内容】
探索高效、低成本的模型训练策略,为企业降低技术研发成本的同时提升模型性能。
包括英文材料
Python+
CUDA+
还有更多 •••
相关职位

logo of mi
校招

参与大语言模型的核心技术研发,包括但不限于: - 预训练优化(数据合成、长上下文建模、训练动态分析) - 后训练技术(强化学习、奖励模型、推理能力提升) - 代码生成与理解(自动化数据构建、运行反馈优化) - 模型架构创新(MoE、高效推理、稳定性优化) - 探索AI Agent、长序列推理、在线学习等新兴方向

更新于 2025-07-09北京
logo of mi
校招

1. 负责大语言模型线上推理框架的性能优化,解决高并发、低延迟、高可靠性等核心问题,提升服务吞吐量与稳定性; 2. 设计并实现分布式大模型推理系统,优化多卡(如NVIDIA GPU集群)资源调度与通信效率,支持千卡级训练/推理场景; 3. 深度适配NVIDIA GPU硬件架构,利用CUDA、cuDNN等工具链进行算子级优化,提升模型计算效率与显存利用率; 4. 调研并引入前沿技术(如异构计算、AI编译器优化),推动模型量化、蒸馏等轻量化方案落地。 【课题名称】 大模型分布式推理加速 【课题内容】 探索和实现大模型大规模推理加速包括分布式推理架构,模型和算法优化等。

更新于 2025-06-25北京
logo of mi
校招

1. 设计和实现支持大规模分布式训练的集群和框架; 2. 构建高效的推理框架,支持超1T模型大模型的在线和离线推理需求; 3. 研究PD分离、Context Caching、模型量化、推敲编码等推理优化技术。 【课题名称】 大模型训练和推理框架 【课题内容】 1. 模型训练和推理基础设施研发; 2. “训练推理x模型结构x训练算法”co-design。

更新于 2025-05-22北京
logo of alibaba
实习淘天集团2026

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 你的挑战: 攻克LLM全链路训练难题:主导大模型训练,优化模型Scaling Law,结合应用需求突破分布式性能瓶颈,基于RL增强模型推理能力,打造电商领域最懂用户需求的超级大脑(含多模态VLM研发)。 为什么选择淘天? 1.坐拥电商领域最大规模场景:每天处理数亿次用户交互,覆盖搜索/推荐/广告/客服/营销全链路,你将直接面对全球最复杂的电商需求场景。 2.定义未来购物标准:你研发的模型将服务数亿消费者,结合大语言和多模态模型能力满足用户偏好,影响海量商家经营决策。 3.顶级科研配置:超大规模GPU集群支持大规模参数模型训练,自研分布式框架实现训练推理效率大幅提升,顶级会议发表,前沿技术成果即时输血。 加入我们,你将获得: 1.与NLP/多模态领域顶尖团队共创,解锁大模型在商品理解、智能创作、消费决策、购物对话等场景的无限可能。 2.弹性化的技术路线选择权,既可在大模型基础技术方面突破能力上限,也可深入应用层打造现象级AI产品。 3.打通产学研用全链路:支持技术成果转化顶会论文和专利+百万级ai native用户产品。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。

更新于 2025-05-07北京|杭州