
哈啰端到端模型算法实习生(VLA/VLM方向)-【自动驾驶】
任职要求
1. 本科及以上在校同学,计算机、自动化、软件、车辆工程或相关专业优先; 2. 熟练使用Python编程; 3. 熟悉PyTorch深度学习框架; 4. 掌握主流的VLA/W…
工作职责
1. 负责VLA/WAM算法预研工作; 2. 负责VLA/WAM开源模型复现、部署,并验证算法效果,推动算法落地; 3. 运用vision encoder, LLM, world model等技术,优化模型结构等,提高模型在复杂场景下的效果。
1、自动驾驶多模态算法研究与应用:负责自动驾驶领域的多模态大模型技术研究及算法开发,包括视觉语言模型(VLM)、一段式端到端模型,以及多模态大模型在复杂场景下的技术整合。 2、多模态感知基础模型研究:开展文本(Text)、视觉(Vision)与点云(Point)融合的多模态感知基础模型研究,包括但不限于4D表征、推理(Reasoning)感知、规划等研究方向。 3、视觉-语言-动作(VLA)大模型研究:负责基于视觉-语言-动作(VLA)架构的端到端方案研究,包括数据生产方案、VLA模型架构、效率优化等方向设计与研发。 4、预训练模型研发:研究基于未来帧预测的预训练模型,结合端到端框架设计,探索其在自动驾驶感知、决策与控制闭环中的可行性及性能提升方向。
1、参与自动驾驶感知、规控算法、e2e端到端、vlm、vla前沿研发项目,协助运用算法 - 硬件协同设计、网络结构优化等技术,整理并分析训练部署数据,为业务团队提供基础支持。 2、辅助进行模型轻量化结构设计相关工作,参与模型性能测试,协助雕琢模型性能,为研发高性能预训练模型贡献力量。 3、投身于模型加速领域的学习与实践,参与模型量化、压缩等基础工作,协助完成实验数据收集与整理,助力模型达到效果与速度的平衡。 4、探索模型架构相关知识,研读Scaling Law、Transformer、MoE、vlm、vla、llm等前沿资料,协助开展技术调研,为自动驾驶技术突破提供基础思路。
【关于我们】 小鹏机器人中心致力于研发先进的人形机器人技术,包括机器人的行走、操作、智能导航,以及在大语言模型支持下的人机交互等。我们的软硬件团队覆盖深圳、上海、广州、北京和北美,组成了一支世界一流的跨领域团队。作为本团队的一员,你将成为连接人工智能与物理世界的桥梁,与其他领域的工程师共同解决前沿的科研和工程难题,并在机器人技术的发展中留下自己的印记。 作为小鹏机器人机器学习基础设施团队的工程师,你将参与并探索以下领域 1.研究和应用最新的大模型结构,工程优化和数据优化到机器人领域,提高模型训练效率和训练效果,探索硬件高效的模型设计方案 2.和算法团队以及其它基础设施团队紧密合作,支持多个业务团队的模型迭代 3.调研大模型及相关方向的前沿工程技术以及算法论文,落地最佳实践
1、参与自动驾驶感知、规控算法、e2e端到端、vlm、vla前沿研发项目,协助运用算法 - 硬件协同设计、网络结构优化等技术,整理并分析训练部署数据,为业务团队提供基础支持。 2、辅助进行模型轻量化结构设计相关工作,参与模型性能测试,协助雕琢模型性能,为研发高性能预训练模型贡献力量。 3、投身于模型加速领域的学习与实践,参与模型量化、压缩等基础工作,协助完成实验数据收集与整理,助力模型达到效果与速度的平衡。 4、探索模型架构相关知识,研读Scaling Law、Transformer、MoE、vlm、vla、llm等前沿资料,协助开展技术调研,为自动驾驶技术突破提供基础思路。