小米自动驾驶 - 大模型训练框架研发工程师
任职要求
1. 本科及以上学历,扎实的编程基础(Python/C++)与良好的工程习惯; 2. 熟悉常用深度学习框架(如PyTorch,TensorFlow等)的架构设计和原理; 3. 有分布式训练优化(数据并行/张量并行/流水线并行)者优先; 4. 有CUDA开发、深度学习编译技术栈、AI开源社区贡献等任一经验者优先; 5. 熟悉自动驾驶感知、端到端算法者优先。
工作职责
1. 负责分析和优化大模型的分布式训练链路,提升训练性能和效率; 2. 对大模型训练优化技术展开研究,并落地到自动驾驶; 3. 负责推进训练框架和AI平台的结合,建立先进的训练调度机制、集群算力利用率评估机制等。
1. 负责分析和优化大模型的分布式训练链路,提升训练性能和效率 2. 对大模型训练优化技术展开研究,并落地到自动驾驶 3. 负责推进训练框架和AI平台的结合,建立先进的训练调度机制、集群算力利用率评估机制等。
1 )开发、部署和维护机器学习工具和平台,开发/优化机器学习模型训练框架,以支持自动驾驶场景下的机器学习模型开发; 2)和自动驾驶算法工程师密切配合,发现、定位模型训练迭代过程中的性能问题并配合分析优化,提升机器学习模型迭代的迭代效率和迭代效果; 3)调研业界先进的机器学习框架及优化手段,借鉴其中先进理念和经验,并应用到日常开发过程中;
1.算法研发与创新: -负责自动驾驶领域基础模型的研发,包括但不限于多模态大模型训练、视觉底座模型构建、多任务学习框架设计、模型蒸馏与轻量化技术等; -探索自监督/半监督/弱监督学习方法,提升模型在复杂场景下的泛化能力与鲁棒性; -参与全球领先的自动驾驶技术研发,推动技术成果转化为高价值专利,并发表高水平学术论文。 2.系统优化与落地: -构建高效的大规模分布式训练框架,优化模型训练效率与资源利用率; -推动算法在车载计算平台或云端系统的工程化部署,解决实际业务场景中的性能瓶颈。 3.数据与模型迭代: -设计并实现大规模数据处理流水线,挖掘高价值数据驱动模型性能提升; -构建场景化评测基准,持续驱动模型在复杂城市路况中的性能迭代。 4.跨团队协作: -与感知、规划、仿真等团队深度合作,推动基础模型在自动驾驶全链路中的技术落地。
1.算法研发与创新: -负责自动驾驶领域基础模型的研发,包括但不限于多模态大模型训练、视觉底座模型构建、多任务学习框架设计、模型蒸馏与轻量化技术等; -探索自监督/半监督/弱监督学习方法,提升模型在复杂场景下的泛化能力与鲁棒性; -参与全球领先的自动驾驶技术研发,推动技术成果转化为高价值专利,并发表高水平学术论文。 2.系统优化与落地: -构建高效的大规模分布式训练框架,优化模型训练效率与资源利用率; -推动算法在车载计算平台或云端系统的工程化部署,解决实际业务场景中的性能瓶颈。 3.数据与模型迭代: -设计并实现大规模数据处理流水线,挖掘高价值数据驱动模型性能提升; -构建场景化评测基准,持续驱动模型在复杂城市路况中的性能迭代。 4.跨团队协作: -与感知、规划、仿真等团队深度合作,推动基础模型在自动驾驶全链路中的技术落地。