logo of xpeng

小鹏汽车空间智能算法实习生

实习兼职地点:广州 | 上海状态:招聘

任职要求


1. 硕士及以上学历,数理基础扎实,系统掌握3D/4D视觉、动态重建、具身智能相关理论;
2. 精通4D重建、动态场景建模(NeRF、4D Gaussian、多视图融合等),熟悉具身智能、世界模型或空间基…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 参与机器人/自动驾驶场景下4D 动态场景重建、空间表征、多模态融合算法研发,攻克动态视图融合、4D 神经场、时空推理等关键技术;
2. 结合具身智能、世界模型、4D 基础模型,构建高保真动态环境表征与仿真能力,提升模型空间理解、场景记忆与时空推理水平;
3. 搭建具身智能合成数据生成与仿真体系,利用生成式AI、4D重建、神经场技术构建大规模训练数据与仿真环境,实现Sim2Real迁移,完善数据-算法-仿真-评估闭环迭代。
包括英文材料
学历+
大模型+
相关职位

logo of meituan
实习核心本地商业-基

深度参与具身智能“感知-决策-行动”技术全链路的技术攻关,在以下一个或多个方向上进行深入研究: 1. 感知与决策规划:提升多模态大模型在具身场景下的能力表现,包括在复杂动态环境中对环境的空间理解,以及对复合任务的任务步骤拆解与任务状态判断能力。 2. 行动与控制:基于真机示教数据、增广数据以及海量互联网视频数据,训练机器人掌握高精度的操作技能。在机器人上研究并实践强化学习算法,优化机器人的动作策略,提升其在物理世界中的动作鲁棒性和技能泛化。 3. 数据增广:通过仿真和world model等方式对真机遥操数据进行规模化增广,探索如何解决真机遥操数据的稀缺问题。

更新于 2025-12-25北京|上海
logo of meituan
实习核心本地商业-基

深度参与具身智能“感知-决策-行动”技术全链路的技术攻关,在以下一个或多个方向上进行深入研究: 1. 感知与决策规划:提升多模态大模型在具身场景下的能力表现,包括在复杂动态环境中对环境的空间理解,以及对复合任务的任务步骤拆解与任务状态判断能力。 2. 行动与控制:基于真机示教数据、增广数据以及海量互联网视频数据,训练机器人掌握高精度的操作技能。在机器人上研究并实践强化学习算法,优化机器人的动作策略,提升其在物理世界中的动作鲁棒性和技能泛化。 3. 数据增广:通过仿真和world model等方式对真机遥操数据进行规模化增广,探索如何解决真机遥操数据的稀缺问题。

更新于 2026-03-30北京|上海
logo of amap
实习高德地图2026

岗位职责: 我们正在寻找充满热情、富有创造力的空间重建与生成算法实习生,加入我们的前沿技术研发团队。您将专注于开发先进的空间重建与生成算法,构建下一代空间智能技术并赋能于多领域创新应用场景。 主要职责包括但不限于: 1. 协助团队完成 空间重建与生成 相关算法的预研与实现; 2. 在mentor指导下,参与视频理解与生成、视频切分、空间语义理解、空间重建等模块的开发与测试; 3. 负责多模态数据(图像/视频/点云)的标注、清洗与小规模数据集搭建; 4. 撰写实验记录与技术报告,输出可复现的实验流程与结果; 5. 跟进前沿论文与开源项目,协助完成小规模原型验证。

更新于 2025-05-29北京
logo of alibaba
实习淘天集团研究型实

1.多模态大模型应用研发:基于多模态大模型(MLLM)强大的世界知识与推理能力,研发复杂场景下的主体识别算法,精准定位视频/图文中的核心主体(如开箱商品、主推款),解决遮挡、多实例干扰等难题。 2.细粒度语义对齐与表征学习: 构建统一的多模态表征空间,负责封面、视频、商品图文之间的细粒度语义对齐,提升跨模态检索与粗筛的召回率。 3.判别模型设计: 设计具备“Thinking with Images”能力的判别式大模型,实现对“挂错品”、“封面党”等高阶语义偏差的精细化验证,并探索模型的可解释性(输出决策依据)。 4.模型蒸馏与落地: 参与大模型到轻量化小模型的知识蒸馏(Model Distillation)工作,设计表征-判别联合蒸馏框架,在保障算法精度的同时满足线上业务的高吞吐与低延时需求。 5.前沿技术探索: 跟踪CV、NLP及多模态领域的SOTA技术,结合业务场景进行创新,有机会将成果发表在CVPR、ICCV、ECCV等顶级会议上。

更新于 2026-01-27北京|杭州