小米顶尖应届-自动驾驶垂域大模型算法工程师-汽车
任职要求
硕士以上学历,计算机/AI相关专业,有开源贡献/顶会一作论文/AI竞赛获奖者优先。深入理解多模态大模型技术原理及实现细节,具备大模型预训练、微调研发经验。逻辑清晰,能独立解决问题,具备优秀的团队协作和沟通能力。
工作职责
1. 筛选、处理和生产多模态大模型训练集数据; 2. pre/post train多模态大模型; 3. 评测比较开源大模型和训练大模型; 4. 应用多模态大模型到自驾数据挖掘筛选业务。 【课题名称】 自驾垂直领域挖掘筛选多模态大模型 【课题内容】 针对自动驾驶海量数据的挖掘筛选业务,通过pre/post train自驾垂直领域多模态大模型,来提高数据挖掘和筛选的准确率和效率,满足自驾量产模型的数据需求。
1. 基于历史数据构建自动驾驶问题数据库,设计场景标签体系与分类标准; 2. 研发多模态大模型驱动的自动驾驶问题归因算法; 3. 基于问题诊断结果,提出端到端模型优化训练改进建议。 【课题名称】 自动驾驶问题智能诊断(autotriage) 【课题内容】 1. 构建自动驾驶场景认知体系,将真实世界的问题场景标签化; 2. 设计自动驾驶问题的自动化归因机制,建立行业领先的问题分析范式。
1. 参与研究与开发融合视觉与语言理解的端到端自动驾驶新范式; 2. 负责视觉语言大模型(VLA)相关算法的设计、实现与优化,提升模型的环境感知、决策规划能力; 3. 探索如何利用VLA增强自动驾驶系统的泛化能力及人机交互的自然性; 4. 参与相关数据集的构建、处理以及模型在真实场景中的部署与测试; 5. 跟踪VLA及相关领域(多模态学习、大模型等)的前沿技术动态; 6. 发表高水平论文至国际顶会顶刊,参加相关领域的国内外顶级学术会议。 【课题名称】 自动驾驶VLA大模型预研 【课题内容】 探索融合视觉语言行为大模型(VLA)至端到端自动驾驶的新范式,实现更强的自动驾驶泛化能力和更自然的交互方式。
1. 参与研究与开发融合视觉与语言理解的端到端自动驾驶新范式; 2. 负责视觉语言大模型(VLA)相关算法的设计、实现与优化,提升模型的环境感知、决策规划能力; 3. 探索如何利用VLA增强自动驾驶系统的泛化能力及人机交互的自然性; 4. 参与相关数据集的构建、处理以及模型在真实场景中的部署与测试; 5. 跟踪VLA及相关领域(多模态学习、大模型等)的前沿技术动态; 6. 发表高水平论文至国际顶会顶刊,参加相关领域的国内外顶级学术会议。 【课题名称】 自动驾驶VLA大模型预研 【课题内容】 探索融合视觉语言行为大模型(VLA)至端到端自动驾驶的新范式,实现更强的自动驾驶泛化能力和更自然的交互方式。