小米顶尖应届-Diffusion-based端到端算法工程师-自动驾驶
任职要求
1. 计算机、人工智能、统计、数学相关专业硕士及以上学历; 2. 扎实的深度生成模型理论基础,理解Denoising Diffusion Probabilistic Models、DDIM、Score-based Generative Models等; 3. 有高维连续动作空间建模经验,对轨迹优化与不确定性建模有深入理解; 4. 熟悉端到端自动驾驶建模范式,有自动驾驶或机器人系统经验者优先。 加分项: 1. 在CVPR/ICLR/NeurIPS等会议发表扩散模型/轨迹生成方向论文; 2. 熟悉Diffuser, Trajectory Diffusion, MotionDiffuser等代表性开源项目; 3. 有Transformer-based Planner架构经验(如Wayformer、ViP、UniAD)。
工作职责
1. 设计适用于自动驾驶任务的Diffusion-based行为生成模型,涵盖轨迹预测、控制输出、长时规规划; 2. 研究基于图像和高维环境语义输入的扩散过程,支持条件生成与多模态控制分布建模; 3. 推动该方向模型从仿真到实车的部署,包括实时性优化、鲁棒性评估与反馈机制构建。 【课题名称】 Diffusion-based Nueral Planner 【课题内容】 探索扩散生成模型在端到端自动驾驶规划中的泛化能力和多模态决策潜力。以感知输入(图像、BEV等)直接生成控制信号(steering, acceleration),或隐式轨迹规划中间表示,构建具备不确定性建模、多样性采样和高分辨率行为预测能力的决策系统。参考如DiffPlan、MotionDiffuser、Wayformer+Diffusion等工作,推动视觉到控制的生成式范式演进。
1. 设计适用于自动驾驶任务的Diffusion-based行为生成模型,涵盖轨迹预测、控制输出、长时规规划; 2. 研究基于图像和高维环境语义输入的扩散过程,支持条件生成与多模态控制分布建模; 3. 推动该方向模型从仿真到实车的部署,包括实时性优化、鲁棒性评估与反馈机制构建。 【课题名称】 Diffusion-based Nueral Planner 【课题内容】 探索扩散生成模型在端到端自动驾驶规划中的泛化能力和多模态决策潜力。以感知输入(图像、BEV等)直接生成控制信号(steering, acceleration),或隐式轨迹规划中间表示,构建具备不确定性建模、多样性采样和高分辨率行为预测能力的决策系统。参考如DiffPlan、MotionDiffuser、Wayformer+Diffusion等工作,推动视觉到控制的生成式范式演进。
1. 负责相机画质算法的研发和优化,包括但不限于图像处理、降噪、锐化、超清等方面; 2. 参与相机软硬件系统的设计和开发,提升相机画质表现; 3. 负责相机画质算法的性能测试和模型/方案优化,提高算法效率和稳定性; 4. 跟踪业界最新的相机画质算法技术,包括DeepISP、diffusion大模型等,不断优化和改进公司的相机画质表现。 【课题名称】 拍照解析力生成算法 【课题内容】 1. 研发基础倍率/变焦模式下的纹理细节生成算法; 2. 研发transformer网络做去噪/超分任务的落地方案; 3. 研发运动/失焦deblur、纹理收边、细节增强等拍照后处理算法; 4. 探索图像大模型的小型化落地方案,以及训练数据生成方案。
1、参与具身智能算法模型在技能学习、动作规划、抓取操作等应用上的研发,实现多场景多任务的泛化; 2、设计、训练、部署模仿学习、强化学习、迁移学习、多模态学习等算法,构建机器人各类应用的通用技能; 3、与大模型、运控等团队合作,推动具身智能数据集、机器人平台等各项目落地实施; 4、紧跟最新技术进展,将学术界前沿创新内容进行快速复现并创新,参与相关方向的论文与专利积累。