小鹏汽车Research Intern (Spatial Intelligence)
实习兼职地点:深圳状态:招聘
任职要求
职位要求 计算机科学、人工智能、电子工程、机器人学等相关专业硕士及以上学历; 在以下至少一个方向具备研究或工程经验: 3D Vision / Scene Understanding / Trajectory Prediction / Spatial Reasoning Affordance Learning / World Model / Multimodal Perception / Simulation Learning Reinforcement Learning / Planning / Agentic System 熟练使用 PyTorch,了解 ViT / CLIP / SAM / Diffusion / VLM 等现代视觉模型; 熟悉 vLLM / HuggingFace / Ray / Trit…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
我们致力于构建下一代 空间智能(Spatial Intelligence)系统,让AI不仅能“看懂世界”,更能理解空间结构、推理物体关系、规划行动轨迹,并在虚拟或真实环境中持续学习与演化。 你将与团队一起: 研发具备空间理解、物体感知、轨迹预测与交互规划能力的智能体模型; 构建融合 视觉语言模型(VLM)与世界模型(World Model) 的系统,实现3D场景、深度、物理与可供性(Affordance)的联合建模; 使用 Game Engine(Unreal / Unity / Isaac Sim) 搭建高保真虚拟环境,用于数据生成与智能体评测; 基于 vLLM / Ray 构建高效多模态数据管线,实现大规模生成、自动标注与验证; 推动空间智能在机器人与具身智能领域的应用落地。
包括英文材料
学历+
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
vLLM+
https://www.newline.co/@zaoyang/ultimate-guide-to-vllm--aad8b65d
vLLM is a framework designed to make large language models faster, more efficient, and better suited for production environments.
https://www.youtube.com/watch?v=Ju2FrqIrdx0
vLLM is a cutting-edge serving engine designed for large language models (LLMs), offering unparalleled performance and efficiency for AI-driven applications.
Ray+
https://github.com/ray-project/ray
Ray consists of a core distributed runtime and a set of AI Libraries for accelerating ML workloads.
https://www.youtube.com/watch?v=FhXfEXUUQp0
In this video, I'll teach you everything you need to know about Apache Ray!
https://www.youtube.com/watch?v=fMiAyj2kgac
Using powerful machine learning algorithms is easy using Ray.io and Python.
https://www.youtube.com/watch?v=q_aTbb7XeL4
Parallel and Distributed computing sounds scary until you try this fantastic Python library.
Triton Inference Server+
https://docs.nvidia.com/deeplearning/triton-inference-server/user-guide/docs/index.html
Triton Inference Server is an open source inference serving software that streamlines AI inferencing.
CVPR+
https://cvpr.thecvf.com/
还有更多 •••
相关职位
实习
1、面向机器人语音交互,打造行业领先的语音大模型,支撑真实世界中的自然、多轮、低时延、人机语音交互,并可在机器人/边缘设备高效部署。形成持续的技术影响力并引领国际行业发展。
更新于 2025-08-21深圳|上海|北京
实习
1、构建行业领先的世界模型,为具身场景提供生成式仿真能力。强化世界模型的长程时空记忆,物理属性模拟能力,实现可泛化、可落地、可scaling的世界模型,形成持续的技术影响力并引领国际行业发展。
更新于 2025-08-21深圳|上海|北京