小鹏汽车学习与规划融合算法实习生
任职要求
任职要求 - 机器人、计算机科学、人工智能、自动化等相关专业硕士/博士在读; - 熟悉深度学习框架(PyTorch),有模型训练和部署经验; - 熟练掌握Python以及C++编程,有良好的代码能力和工程素养; - 具备良好的论文阅读能力,能够快速复现前沿工作; - 每周至少能保证5天实习时间,实习期不少于6个月。 加分项: - 有人形机器人、机械臂等平台的实际开发与调试经验; - 了解模仿学习基本方法(BC、Diffusion Pol…
工作职责
1. 参与人形机器人Vision-Language-Action (VLA)算法的研发,包括数据采集、模型训练与部署、多模态大模型在机器人操作任务中的应用; 2. 负责机器人动力学建模、轨迹优化、实时运动规划算法开发与调优; 3. 探索VLA模型与传统运动规划算法(RRT、轨迹优化、MPC等)的结合方式; 4. 跟踪Learning for Planning / Planning for Learning领域最新进展,推动技术创新; 5. 参与机器人数据集的构建、清洗与标注流程优化;
1. VLA/VLN算法开发:研究并实现Vision-Language-Action (VLA) / Vision-Language Navigation(VLN)算法,使机器人能够根据自然语言指令以及当前场景进行自主移动; 2. 多模态融合:开发视觉、语言、地图等多模态信息融合模块,提升导航决策的准确性; 3. 场景理解:实现基于视觉和语言的场景语义理解,支持复杂环境下的目标定位与路径规划; 4. 模型训练与优化:负责VLA/VLN模型的训练、调优及推理性能优化; 5. 数据与评测:参与导航数据集构建、评测指标设计及Benchmark开发。
1. 负责企业级智能办公助手AI Agent的架构设计与核心功能开发,打造智能化、自动化的办公体验; 2. 参与大模型微调、强化学习(RLHF)与Agent行为调优,优化Agent任务执行效率与响应质量,提升任务执行准确率与用户体验; 3. 负责Agent系统关键技术攻关,包括但不限于:多轮对话管理与上下文理解、复杂任务分解与规划、多模态交互与工具调用、智能体协同决策机制; 4. 与业务团队紧密协作,深入分析场景需求,设计端到端解决方案,实现Agent能力与业务流程的深度融合; 5. 建立Agent系统的性能和效果的评估体系,包括准确率、实时性、可靠性等关键指标的量化监控; 6. 持续跟踪AI前沿技术(如ReAct、CoT、MCP、A2A),推动新技术在工程场景落地与性能优化。
【团队介绍】 聚焦大模型与高德核心业务的深度融合。围绕用户出行、搜索、导航、POI发现、行程规划等亿级流量场景,我们探索如何通过大语言模型(LLM)、多模态大模型、强化学习与推荐系统的协同创新,提升用户交互体验与业务转化效果。 【岗位职责】 1. 参与高德地图 AI 对话 Agent 相关算法研发,包括对话理解、任务规划、工具调用、多轮对话管理等; 2. 探索大模型在地图场景下的应用,如 Prompt 工程、RAG、SFT、RL Training、Agent 框架优化等; 3. 协助构建高质量对话数据集,参与模型训练、评估与上线迭代; 4. 跟踪前沿技术,复现并改进相关方法,推动技术创新。