logo of nio

蔚来实习-强化学习算法工程师

实习兼职算法地点:上海状态:招聘

任职要求


1. 人工智能、机器人、多模态大模型等相关领域的硕士或博士;
2. 熟悉机器人感知系统(深度相机、单目/双目视觉等SLAM)原理和算法;
3. 熟悉多自由度机器人运动学、动力学建模及控制理论(如阻抗控制、操作空间控制);
4. 熟悉强化学习经典算法(PPO, SAC, DDPG, TD3等)及框架;
5. 具备物理仿真工具(Isaac Gym, PyBullet, Gazebo)开发经验,有实际Sim2Real经验(如域随机化、自适应策略)优先;
6. 有机器人抓取、导航、灵巧操作等RL算法落地项目经验,或顶级会议(ICRA, IROS, CoRL, NeurIPS)论文发表者优先;
7. 优秀的分析、解决问题能力,具备良好的团队协作素质。

工作职责


1. 结合业务需求,对多自由度机器人产品(双足、四足、灵巧手)进行选型、设计与集成;
2. 结合视觉(RGB-D)、力觉、触觉等输入,设计端到端RL策略,实现环境交互的闭环控制;
3. 设计并实现面向多自由度机器人的强化学习解决方案,实现对复杂物理环境、复杂任务的自适应决策和控制;
4. 基于物理引擎(如Isaac Gym, PyBullet, MuJoCo)搭建高保真机器人仿真环境,支持训练和Sim2Real迁移;
5. 模型部署与验证,解决真机运行中的工程问题,并优化训练算法,通过动态干扰、随机参数等方式提升鲁棒性;
6. 跟踪行业动态,如世界模型(World Models)、分层强化学习(HRL)、多智能体强化学习(MARL) 等前沿方向,进行评测和落地,优化机器人在复杂任务中的应用;
包括英文材料
大模型+
SLAM+
算法+
强化学习+
Gymnasium+
Gazebo+
NeurIPS+
相关职位

logo of mi
实习

1. 开发基于强化/模仿学习的机器人行走及全身控制策略; 2. 开发复杂地形下基于视觉的强化学习行走策略; 3. 负责算法策略的训练与移植部署,实现算法sim-to-real在机器人实机上落地应用; 4. 持续跟踪国内外前沿研究成果,并进行相关算法复现; 5. 编写相关技术文档,推动团队技术沉淀与知识共享。

更新于 2025-08-20
logo of mihoyo
实习程序&技术类

负责视频生成模型在后训练/强化学习阶段的算法研发与模型训练,运用前沿强化学习算法优化模型的稳定性与视频生成质量,并实现对人类专家审美偏好的深度对齐。 核心职责 1、深入研究前沿强化学习算法,负责视频生成任务中的基于强化学习的优化方案探索及训练框架搭建; 2、结合视频生成模型的效果短板,分析强化学习算法的优化目标,设计数据收集方案; 3、设计并实现面向视频生成的多目标强化学习算法,设计并训练奖励模型(Reward Model); 4、撰写高质量技术报告与论文,与团队共同推动技术创新,保持行业领先地位。

logo of meituan
实习无人机业务部

1. 开发和优化基于多传感器(LiDAR/Camera/IMU/GNSS等)融合的标定、定位、建图和环境感知算法 2. 开发和优化全局规划器和局部规划器算法,提升机器人在复杂场景中的运行效率和稳定性; 3. 使用Sim2Real技术提升算法性能。

更新于 2025-07-15
logo of kuaishou
实习J1006

1、广告算法策略包含深度学习、强化学习、大数据、数据挖掘、并行优化、策略机制等多个方向; 2、负责机器学习的算法和模型开发,包括:DNN、超参数优化、学习和优化方法等; 3、负责海量数据的分析和挖掘工作,构建用户画像模型,提升CTR、CVR; 4、对机器学习尤其是深度学习前沿问题进行探索与研究; 5、对推荐系统、自然语言处理、图像处理等领域提供模型支持。

更新于 2025-03-26