小米顶尖应届-大模型训练框架优化工程师-自动驾驶

校招全职2026-06-02地点：北京状态：招聘

扫码手机上打开

任职要求

1、本科及以上学历，扎实的编程基础（Python/C++）与良好的工程习惯；
2、精通深度学习框架底层原理（PyTorch 核心机制如 torch.compile、Autograd、TorchScript、XLA）；
3、熟悉分布式训练框架（Horovod、Megatron-LM、DeepSpeed 等）的实现逻辑；
4、熟悉…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、负责基于现有大模型训练框架分析自动驾驶与机器人模型训练链路，包括数据加载、分布式并行、显存占用、通信开销和算子执行等环节，定位性能瓶颈；
2、围绕训练吞吐、GPU 利用率和模型迭代效率开展优化，推动训练周期缩短和训练资源成本下降；
3、结合 PyTorch、Megatron-LM、DeepSpeed 等技术栈，开展分布式训练策略、混合精度、算子融合、通信优化和 CUDA 高性能算子优化；
4、推进训练框架与 AI 平台、调度系统和监控体系协同，建立训练效率、集群算力利用率和任务稳定性的评估机制；
5、探索 AI Agent 在自动化 profiling、瓶颈定位和代码优化建议中的应用，沉淀可复用的训练优化工具链。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

Python+

C+++

深度学习+

还有更多 •••

登录查看完整学习资料

相关职位

顶尖应届-大模型训练与推理研究员-MiMo

校招

1、设计和实现支持大规模分布式训练的集群和框架； 2、构建高效的推理框架和算子优化，支持超大规模模型的在线和离线推理需求； 3、研究PD分离、Context Caching、模型量化、推敲编码等推理优化技术。

更新于 2026-06-02北京

顶尖应届-具身大模型训练推理工程师-XiaomiRobotics

校招

1、负责具身大模型训练与推理基础设施的架构设计、搭建与优化，支撑大规模预训练、持续训练、强化学习及在线/离线推理任务稳定高效运行。 2、基于Megatron-LM、DeepSpeed、FSDP等分布式训练框架，设计并优化数据并行、张量并行、流水并行、专家并行等策略，支撑大参数量多模态模型训练。 3、深耕大模型训练性能优化，包括显存占用、算力利用率、通信效率、checkpoint与断点续训、训练稳定性等关键问题，提升训练吞吐与资源效率。 4、负责推理系统优化与部署，覆盖自回归模型、Diffusion模型及MoE模型等典型架构，提升推理链路在吞吐、延迟、显存占用和稳定性方面的综合表现。 5、推动量化、算子融合、图优化、显存复用、服务化部署等推理加速技术落地，支撑具身大模型在云端或端上环境的部署。 6、与算法、数据、平台团队紧密协作，完善训练配置、日志监控、指标可视化、故障定位等工具链，提升研发效率与工程标准化水平。

更新于 2026-04-03北京

顶尖应届-大模型应用开发工程师-汽车架构

校招

1、应用包括大模型、Agent、多模态等在内的 AI 技术，推进汽车大数据的智能化应用落地； 2、与业务一起探索和发现 AI 技术的在汽车领域的前沿应用落地场景，针对性进行数据建设、模型训练、模型评估等，优化模型效果，实现效能提升。 3、探索AI技术在车端轻量化部署，优化推理速度。【课题名称】整车大模型应用开发【课题内容】本课题研究大模型在汽车上的应用，利用整车跨域数据结合大模型技术，推进整车智能化进步。

更新于 2025-12-01南京

顶尖应届-大模型算法工程师（安全归因与证据链方向）-汽车架构

校招

1、构建安全事件知识图谱，建立车辆-事件-驾驶行为-零部件-软件版本-环境场景-处置结果的关系模型； 2、研究多源异构安全数据的实体对齐、关系推理和动态图谱更新方法； 3、研发因果发现算法，从观测数据中自动发现安全事件的因果结构； 4、研究小样本学习和可解释AI方法，支撑稀有安全事件的归因和证据链展示； 5、推动模型在事故分析、群体风险识别、安全治理场景中的工程化落地； 6、沉淀可复用算法组件、技术文档、论文与专利。

更新于 2026-06-02南京