影石深度学习算法实习生(场景重建方向)
实习兼职地点:深圳 | 上海状态:招聘
任职要求
1.硕士及以上学历,模式识别、计算机视觉、数学、电子信息等相关专业优先; 2.能够熟练使用Tensorflow/Pytorch中的一种或多种深度学习框架,熟练使用Python; 3.熟悉多视角几何、三维重建、生成式模型相关算法理论知识; 4.具备相关领域工程背景:在无人机、自动驾驶、机器人相…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.负责3D内容&视频⽣成与重建算法,包括但不限于三维重建技术(NeRF/3DGS、MVS、VGGT)和视频生成技术(Diffusion等)相关算法前沿技术跟进和研发落地; 2.深⼊下游应⽤场景,结合场景重建、神经渲染、生成式AI等为算法提供可用于训练/评估的高质量数据,支持高级智能感知系统的研发落地; 3.探索大规模场景下的重建与生成:3DGS/Nerf、World Model、Diffusion、VGGT等技术研发和业务落地。
包括英文材料
学历+
模式识别+
https://www.mathworks.com/discovery/pattern-recognition.html
Pattern recognition is the process of classifying input data into objects, classes, or categories using computer algorithms based on key features or regularities.
https://www.microsoft.com/en-us/research/wp-content/uploads/2006/01/Bishop-Pattern-Recognition-and-Machine-Learning-2006.pdf
Pattern recognition has its origins in engineering, whereas machine learning grew out of computer science.
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
还有更多 •••
相关职位

实习软件工程
1.研发基于多传感器(激光雷达、摄像头等)的4D时空场景重建和生成算法,融合时序信息实现动态物体和静态场景高精度建模; 2.研发场景生成、可交互视频生成等技术,支持自动驾驶场景的高保真场景生成,用于端到端自动驾驶算法的闭环仿真和强化学习训练; 3.结合闭环仿真结果,对场景生成相关算法进行迭代,推动端到端自动驾驶系统的联合优化。
更新于 2025-10-11北京|苏州|上海

实习研发
1.研发基于多传感器(激光雷达、摄像头等)的4D时空场景重建和生成算法,融合时序信息实现动态物体和静态场景高精度建模; 2.研发场景生成、可交互视频生成等技术,支持自动驾驶场景的高保真场景生成,用于端到端自动驾驶算法的闭环仿真和强化学习训练; 3.结合闭环仿真结果,对场景生成相关算法进行迭代,推动端到端自动驾驶系统的联合优化。
更新于 2025-11-24北京|苏州|上海

实习研发
1. 熟悉bev/occ/静态bev/3d等方向的云端模型训练和相关推理部署、Drivesora/Qwen-WAN等世界模型-生成大模型的多模态训练和相关推理部署、基于3DGS的StreetGaussian/DGGT/ReconDreamer场景重建算法开发和相关推理部署。 2. 熟悉自动驾驶数据的预处理、挖掘和特征工程, 对大模型的强化学习及相关框架有一定了解更佳。 3. 结合公司已有的自动驾驶相关数据对大模型finetune,使世界模型更好服务于自动驾驶业务的数据和仿真需求。 4. 与部署优化工程师合作,确保算法的实际可行性和集成性。 5. 跟踪最新的科研进展和技术趋势,将前沿技术应用于解决实际问题中。
更新于 2026-01-06北京|上海
