小米自动驾驶-深度学习训练框架优化工程师
任职要求
1. 扎实的编程基础(Python/C++)与良好的工程习惯 2. 熟悉常用深度学习框架(如PyTorch,TensorFlow等)的架构设计和原理 3. 有分布式训练优化(数据并行/张量并行/流水线并行)者优先 4. 有CUDA开发、深度学习编译技术栈、AI开源社区贡献等任一经验者优先 5. 熟悉自动驾驶感知、端到端算法者优先
工作职责
1. 负责深度学习训练框架的架构设计、关键技术研究及研发落地 2. 负责自动驾驶模型训练优化,优化低效算子、数据预处理、通信、低精度训练等。 3. 负责推进训练框架和AI平台的结合,建立先进的训练调度机制、集群算力利用率评估机制等。
1、负责具身智能相关模型云侧和端侧模型的性能优化和部署; 2、运用性能分析工具,对模型推理过程进行性能剖析,定位性能瓶颈,提出有效的优化方案,并通过实验验证优化效果; 3、通过量化、剪枝、蒸馏、算子融合、Cuda算子编写等性能优化的手段,结合业务需求,将GPU性能发挥到极致; 4、与算法部门深度合作,进行算法与系统的联合优化。

岗位职责 1. 负责智能驾驶模型训练优化的研究和落地,通过数据并行,模型并行,通信优化,CUDA算子优化等手段,大幅提升模型的训练速度与效率。 2. 解决智能驾驶模型训练和部署工作中遇到的各种工程和性能问题。负责训练相关的工具链和框架的开发,维护,和优化。
1.算法研发与创新: -负责自动驾驶领域基础模型的研发,包括但不限于多模态大模型训练、视觉底座模型构建、多任务学习框架设计、模型蒸馏与轻量化技术等; -探索自监督/半监督/弱监督学习方法,提升模型在复杂场景下的泛化能力与鲁棒性; -参与全球领先的自动驾驶技术研发,推动技术成果转化为高价值专利,并发表高水平学术论文。 2.系统优化与落地: -构建高效的大规模分布式训练框架,优化模型训练效率与资源利用率; -推动算法在车载计算平台或云端系统的工程化部署,解决实际业务场景中的性能瓶颈。 3.数据与模型迭代: -设计并实现大规模数据处理流水线,挖掘高价值数据驱动模型性能提升; -构建场景化评测基准,持续驱动模型在复杂城市路况中的性能迭代。 4.跨团队协作: -与感知、规划、仿真等团队深度合作,推动基础模型在自动驾驶全链路中的技术落地。
1.算法研发与创新: -负责自动驾驶领域基础模型的研发,包括但不限于多模态大模型训练、视觉底座模型构建、多任务学习框架设计、模型蒸馏与轻量化技术等; -探索自监督/半监督/弱监督学习方法,提升模型在复杂场景下的泛化能力与鲁棒性; -参与全球领先的自动驾驶技术研发,推动技术成果转化为高价值专利,并发表高水平学术论文。 2.系统优化与落地: -构建高效的大规模分布式训练框架,优化模型训练效率与资源利用率; -推动算法在车载计算平台或云端系统的工程化部署,解决实际业务场景中的性能瓶颈。 3.数据与模型迭代: -设计并实现大规模数据处理流水线,挖掘高价值数据驱动模型性能提升; -构建场景化评测基准,持续驱动模型在复杂城市路况中的性能迭代。 4.跨团队协作: -与感知、规划、仿真等团队深度合作,推动基础模型在自动驾驶全链路中的技术落地。