小鹏汽车计算机视觉和机器学习实习生(机器人导航)
实习兼职地点:深圳状态:招聘
任职要求
岗位要求: • 研究生及以上在读,计算机相关专业。有一个或多个相关应用领域的背景(比如:计算机视觉,自然语言处理,语音理解等)。 • 熟练掌握编程语言(python / C++),对深度学习框架有丰富的使用经验(Pytorch, Tensorflow等),熟悉视觉-语言模型框架和生成式模型。 • 谦逊开放,思维活跃。能够持续学习,具有团队合作的意识。 加分项: • 对包含视觉的多模态大模型有相关经验。 • 有机器人导航或者自动驾驶的相关背景和经验。 • 能够熟练使用英文写作和交流。
工作职责
小鹏机器人中心致力于研发先进的人形机器人技术,包括机器人的行走,操作,智能导航,在大语言模型支撑下的人机交互等。我们拥有世界一流的软硬件团队,分布于深圳,上海,北京,广州和北美。作为计算机视觉和多模态大模型领域实习生,你将和机器人中心相关领域的工程师共同解决科研和工程问题。我们将共同成长,在人形机器人前沿领域留下自己印记。 你将获得: • 最前沿的AI相关技术,包括端到端导航,视觉和多模态基础大模型训练,推理,数据获取,机器人平台的应用部署等。 • 行业专家的指导。对于优秀的工作,我们会鼓励和帮助文章发表或专利申请。 • 完备的实验室条件, 包括充分的计算资源,机器人硬件平台等。 • 实习生是公司的宝贵财富,对于即将毕业的优秀的实习生,我们会优先考虑其全职工作申请。
包括英文材料
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
自动驾驶+
https://www.youtube.com/watch?v=_q4WUxgwDeg&list=PL05umP7R6ij321zzKXK6XCQXAaaYjQbzr
Lecture: Self-Driving Cars (Prof. Andreas Geiger, University of Tübingen)
https://www.youtube.com/watch?v=NkI9ia2cLhc&list=PLB0Tybl0UNfYoJE7ZwsBQoDIG4YN9ptyY
You will learn to make a self-driving car simulation by implementing every component one by one. I will teach you how to implement the car driving mechanics, how to define the environment, how to simulate some sensors, how to detect collisions and how to make the car control itself using a neural network.
相关职位
社招A210746
负责VLA(视觉-语言-行动)多模态大模型在自动驾驶和机器人场景中的前沿算法研究,涵盖场景理解、语义引导决策、时空建模等核心能力; 主导VLA模型预研,构建可泛化、高可解释性的多模态基座大模型,为未来6~12个月技术演进提供基础支撑; 与高校及实习生协作,探索VLA的长期发展方向,包括表征学习,具身智能、慢系统蒸馏快系统等核心议题; 撰写高水平论文、技术文档,推动VLA方向在CVPR、NeurIPS、ICLR、CoRL等会议中的学术影响力。
更新于 2025-03-26

实习算法序列
1.负责城区/高速NOA场景下的感知算法研发,包含车道线、道路边界、地面箭头等路面静态要素检测工作; 2.探索先验地图前融合算法来提升遮挡、复杂路口以及超视距区域感知能力上限; 3.探索LLM和检测模型结合提高道路场景理解能力; 4.负责核心算法或模型的原创设计以及工程化落地,如型优化、评测体系化构建、case迭代等; 5.掌握数据挖掘、标注、训练、部署及badcase回归等闭环链路,并伴随业务开展持续优化; 6.掌握通过数据闭环持续迭代模型的能力。
更新于 2025-01-17

实习算法序列
1、参与自动驾驶静态要素(如红绿灯、箭头、地面标识、车道线、路沿等)的云端自动标注系统研发,助力真值系统构建与感知系统的高效数据生产; 2、探索大模型(如多模态/视觉语言模型)在地图Agent中的应用,推动静态要素自动标注流程的泛化能力、理解能力与自动决策水平; 3、研究corner case的发现与筛选方法,结合分布建模、异常检测、大模型语义理解等手段,提升自动标注系统的质量与鲁棒性; 4、协助构建从数据采集、挖掘、标注、训练、部署到badcase回归的高效闭环体系,实现自动标注系统的迭代优化; 5、参与核心算法或模型的原创设计与工程落地,包括模型压缩、评测体系构建、性能调优等任务。
更新于 2025-07-30