小米顶尖应届-大模型训练框架优化工程师-自动驾驶
任职要求
1、本科及以上学历,扎实的编程基础(Python/C++)与良好的工程习惯; 2、精通深度学习框架底层原理(PyTorch 核心机制如 torch.compile、Autograd、TorchScript、XLA); 3、熟悉分布式训练框架(Horovod、Megatron-LM、DeepSpeed 等)的实现逻辑; 4、熟悉…
工作职责
1、负责基于现有大模型训练框架分析自动驾驶与机器人模型训练链路,包括数据加载、分布式并行、显存占用、通信开销和算子执行等环节,定位性能瓶颈; 2、围绕训练吞吐、GPU 利用率和模型迭代效率开展优化,推动训练周期缩短和训练资源成本下降; 3、结合 PyTorch、Megatron-LM、DeepSpeed 等技术栈,开展分布式训练策略、混合精度、算子融合、通信优化和 CUDA 高性能算子优化; 4、推进训练框架与 AI 平台、调度系统和监控体系协同,建立训练效率、集群算力利用率和任务稳定性的评估机制; 5、探索 AI Agent 在自动化 profiling、瓶颈定位和代码优化建议中的应用,沉淀可复用的训练优化工具链。
参与大语言模型的核心技术研发,包括但不限于: - 预训练优化(数据合成、长上下文建模、训练动态分析) - 后训练技术(强化学习、奖励模型、推理能力提升) - 代码生成与理解(自动化数据构建、运行反馈优化) - 模型架构创新(MoE、高效推理、稳定性优化) - 探索AI Agent、长序列推理、在线学习等新兴方向
1、负责具身大模型多模态数据体系建设,覆盖图像、视频、语言、图文交错、动作轨迹、机器人交互等数据类型,支撑模型训练、评测与迭代。 2、设计并搭建大规模数据处理与生产管线,包括数据采集、清洗、标注、筛选、标准化、混合配比、质量评估与版本管理,保障数据全生命周期高效运转。 3、面向预训练、持续训练、SFT、强化学习等不同阶段,制定适配的数据策略与处理方案,提升数据利用效率与训练效果。 4、针对多模态具身大模型任务特点,解决跨模态对齐、时序一致性、动作标注、数据稀疏性与分布不均衡等问题,持续优化数据质量。 5、联合数据平台、模型与机器人团队,建设自动化数据回放、质检、追溯与评测体系,形成可复用、可迭代的数据基础设施。 6、跟踪多模态数据处理、自动标注与数据质量评估等方向的前沿技术,推动数据体系持续升级。
1、面向整车多业务域需求,依托云端车辆大数据完成整车关键零部件诊断、健康问题定义、数据分析、方案设计与落地交付; 2、结合大模型(含多模态/Agent 等)推动关键场景从 0 到 1:数据建设、训练/微调、评测与迭代闭环; 3、建设大模型工程化与体系化能力:训练与推理链路、评测体系、版本管理与稳定性保障,沉淀可复用组件与最佳实践; 4、推进车端/边缘侧轻量化部署与推理优化(压缩/加速/量化等),满足实时性、资源约束与可靠性要求; 5、参与跨团队协作与技术沉淀:推动里程碑交付,参与技术方案评审,输出内部分享、专利与技术文档。