蔚来智能辅助驾驶大模型算法工程师(生成式AI方向)
任职要求
1. 计算机、人工智能、自动化等相关专业本科及以上学历。 2. 热爱编程,熟练掌握python或c++。 2. 熟练掌握深度学习框架(如TensorFlow、PyTorch),熟…
工作职责
1. 负责智能辅助驾驶场景生成式AI算法的研发与设计,参与世界模型、视频生成、视觉语言模型等前沿算法的探索与落地。 2. 深度参与端到端智能辅助驾驶算法开发,负责实车调试与优化,提升算法性能。 3. 针对特定问题,能够构建训练评测数据,优化神经网络结构,持续提升模型性能。 4. 参与模型部署工程链路建设,保障模型高效落地。
这个世界的运行机制是否是可计算的?世界的复杂性是否唯有用AI的复杂性来应对?人类是否可以造出一台机器让未来就像过去一样历历在目?面对这些未知而又迷人的世界级难题,阿里巴巴旗下高德地图将组建一支卓越的AI队伍向世界模型发起冲击。在这里,你将获得无限制的算力,让想象力在算力的加持下尽情驰骋;在这里,你将和顶级的空间智能专家并肩作战,让专业与专注碰撞出世界模型最精彩的火花;在这里,你将接触到高德积累了20年的海量真实世界数据,让包罗万象的数据发挥它本来应有的价值。 一、团队介绍 我们是阿里巴巴旗下高德视觉技术中心的具身世界模型团队。这里有自由探索、开放交流的技术氛围,让每个有价值的idea都得到充分的展现和验证。这里有来自国内外顶尖院校毕业的研究员,知名AI项目/论文的作者可能就坐在你身边,让顶尖智力一起碰撞出最美妙的火花。我们是一支兼具学术界和产业界视角的团队,仰望星空,脚踏实地。 团队gihub主页:https://github.com/amap-cvlab 二、我们要去哪? 1、打造可交互、可控制、物理一致的世界模型,突破空间智能技术边界 2、通过世界模型加速物理智能体的进化 3、探索下一代时空基座模型 三、岗位职责: 1. 3D动/静态生产: 利用三维重建、生成模型、多模态大模型对单图、视频完成动态物体/静态场景重建、生成、编辑,并得到可交互的3D资产与长时序视频; 2. 结合3D表征的视频生成: 研发基于动作、轨迹等条件控制的视频生成算法,确保生成内容具备严格的3D几何一致性与物理规律遵循,实现对场景视角、物体交互的精细化控制,为具身智能体提供高保真的虚拟训练环境; 3. 空间推理: 赋予模型深度的三维空间理解与物理常识推理能力(如物体可供性、碰撞动力学、场景拓扑),使其能理解场景背后的物理因果,辅助下游的复杂决策与规划; 4. 训练闭环搭建: 构建“生成-仿真-评估-优化”的自动化数据闭环,利用生成数据扩充训练集(Data Augmentation),并通过端到端系统的反馈迭代优化世界模型,实现数据飞轮效应; 5. 世界模型构建: 结合具身智能、自动驾驶等数据探索空间智能的统一范式,完成环境感知、智能体预测、决策规划等任务并得到未来状态和未来传感器信息,为强化学习提供基座; 6. 产线落地与性能优化: 与具身智能、自动驾驶、智能导航等业务协同,完善仿真数据链路,优化模型推理效率与显存占用; 7. 前沿追踪: 跟踪学术界和工业界在生成式AI/世界模型相关领域的最新进展,保持公司在该领域的技术领先地位。
1. 负责研究和开发适合机器人的多模态大模型算法,包括但不限于语言、图像、视频、点云等模态,应用于机器人环境感知、决策、规划控制等领域 2. 负责多模态大模型算法设计、开发以及验证,通过仿真和数据闭环等方式控制和量化算法迭代效果 3. 通过研发世界模型、生成式模型,搭建闭环渲染系统,辅助端到端模型的训练 4. 深入调研前沿算法,探索前沿算法在具体场景中落地的可能性
汽车业务中心:主要负责高德车载导航和高级辅助驾驶地图服务等,“人车共导”,实现车道级导航,助力广大车厂实现智能导航和智能辅助驾驶的突破。 职位描述: 1、主导AI项目的技术探索和可行性分析,负责方案设计、开发、测试和上线维护的整个技术生命周期。 2、需深刻洞察业务目标,制定最有效的技术策略,并应用先进的AI/AIGC技术解决实际业务问题。 3、负责对现有AI产品进行性能调优和功能增强,从而提高整体业务运作的效率和质量。 4、保持对国内外AI技术发展和应用场景的前瞻性关注,主动发掘并驱动AI技术在本业务领域的优化升级与创新实践。