蔚来校招-强化学习算法工程师
校招全职算法地点:上海 | 北京状态:招聘
任职要求
1. 计算机、自动化、电子工程、人工智能、车辆工程等相关专业硕士及以上学历 2. 熟练掌握深度学习与强化学习的主流算法(如DQN、DDPG、SAC、PPO、GRPO等),并具备实际工程经验 3. 熟练使用PyTorch或TensorFlow 4. 熟练使用智能辅助驾驶仿真平台(如CARLA、MetaDrive、AirSim等),具备搭建复杂场景与接口能力 5. 具有良好的数学基础,能够独立阅读和实现最新研究论文 加分项: 1. 有端到端智能辅助驾驶、智能体规划或行为预测相关经验 2. 有高性能训练系统(如多GPU、分布式训练)调优经验 3. 有强化学习模型在真实车辆、仿真平台、边缘设备上部署经验
工作职责
1. 强化学习模型开发:负责基于深度强化学习(DRL)的端到端智能辅助驾驶策略的设计、开发与训练 2. 仿真平台搭建与实验:搭建仿真环境(如CARLA、LGSVL、MetaDrive等),用于训练和验证强化学习策略;
包括英文材料
学历+
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
智能体+
https://learn.microsoft.com/en-us/shows/ai-agents-for-beginners/
In this 10-lesson course we take you from concept to code while covering the fundamentals of building AI agents.
https://www.ibm.com/think/ai-agents
Your one-stop resource for gaining in-depth knowledge and hands-on applications of AI agents.
相关职位
校招
1.参与端到端模型的多阶段大规模预训练及FT后训练(包含RL),参与并探索自动驾驶领域的Scaling Law。 2.负责设计、优化、迭代RL系统Reward、Objective及环境建模框架,参与自动驾驶各种场景下的Self Play式模型强化训练。 3.分析并优化自动驾驶相关的OnPolicy/OffPolicy及Synthetic数据集,构建高效的模型的闭环迭代训练评估流程。
更新于 2025-07-01
校招
1. 研发基于强化学习的人形机器人全身运动控制算法; 2. 搭建强化学习运动控制算法完整训练流程并优化性能; 3. 分析评估算法性能,迭代优化控制策略; 4. 与团队协作,推动强化学习算法部署调试测试; 5. 跟进人形机器人全身运动控制算法,为团队引入新思路,保持技术领先性。
更新于 2025-04-28
校招
1. 开展机器学习和强化学习领域的科学研究,推动技术进步; 2. 开发更优的数据驱动人类行为建模方法; 3. 与研究人员及跨职能团队合作,沟通研究计划、进展与成果; 4. 应用前沿强化学习技术,推动生成式人工智能(GenAI)和具身智能应用落地。 5. 参与学术论文发表及开源项目贡献。
更新于 2025-04-28