logo of anker

安克创新具身智能-强化学习(灵巧操作方向) 实习生

校招全职地点:深圳状态:招聘

任职要求


1.硕士及以上学历在读,计算机、人工智能、机器人、自动化等相关专业,2026 年及以后毕业优先
2.深刻理解强化学习核心算法(PPO, SAC 等),同时熟悉具身操作大模型(VA/VLA/WAM)的训练逻辑
3.具备扎实的机器人运动学、动力学基础,能够处理真机实验中的延迟、噪声及硬件非线性特性
4.精通 Python 与 PyTorch,熟悉主流 RL 框架,具备良好的分布式训练与真机部署工程经验
5.了解以下至少一个方向的核心技术: 
 Offline-to-online 真机RL算法
 去噪模型(Flow matching/Diffusion)RL算法
VLA / 多模态大模型 
机器人学习或具身智能基础方法 …
登录查看完整任职要求
微信扫码,1秒登录

工作职责


安克实习生项目是面向正式校招岗位的人才培养与选拔通道。实习期间将按照校招标准进行系统的培养与综合评估,表现优秀者可直接获得校招转正机会,提前锁定正式校招席位。我们以严肃、长期的视角对待每一位实习生,也期待与你共同成长。
【你将参与】
1.参与具身操作模型(VA/VLA/WAM)的监督微调(SFT)和强化学习(RL),包括数据格式设计、训练配置、效果评估与 benchmark 分析 
2.负责在真实机器人平台上设计并实施 RL 训练方案,通过真机数据迭代提升具身操作模型在复杂、非结构化环境下的泛化能力与鲁棒性
3.参与设计与训练通用奖励模型,通过奖励模型引导,实现长程任务(Long-horizon tasks)下的高效真机强化学习
4.跟踪前沿具身智能方向论文,探索基础模型与 RL 结合的最新技术,推动其在真机任务中的表现超越传统模仿学习方法
包括英文材料
学历+
强化学习+
算法+
大模型+
还有更多 •••
相关职位

logo of mi
实习

1.基于人类视频和演示的具身灵巧抓取与操作策略VLA算法研究与开发; 2.视觉-触觉-本体多模态信息融合下的长序列双手灵巧抓取操作研究; 3. 灵巧手视触觉融合精细抓取系统;

更新于 2025-08-08北京
logo of 10jqka
校招AI 算法类

视觉大模型方向: 1、 协调上层应用需求到机器视觉算法的整体架构; 2、 实现机器人基于3D视觉的双臂抓取方案,落地在照片、水杯等常规物体的视觉抓取任务中: 3、带领算法团队进行传统机器人视觉到端到端视觉大模型的技术演进,并落地在双臂协同抓取任务; 导航定位方向: 1、 负责机器人基于LIDAR的导航与定位算法研究与实现,并支持机器人业务中导航的需求; 2、负责单线和多线LIDAR的开发,SLAM 算法、多传感器融合算法、3D点云、3D场景重建等 3、负责无地图导航算法研究、自主实时建图方案研究; 4、实现高精度的地图更新; 机器人操作系统方向: 1、从事移动机器人系统的设计和研发,不限于底盘、四足、双足等形态;设计机械结构,硬件结构、并具备-定嵌入式开发经验: 2、具备机器人硬件开发经验,实现对关节电机的控制、实现与相机和雷达的通信: 3、熟悉运动控制算法,利用动捕收集步态数据,并通过强化学习和模仿学习实现机器人运动控制: 双臂方向 1、复现开源的双臂机器人扩散大模型RDT,并完成数据采集、模型训练、优化等功能: 2、设计触觉反馈传感器,并用于灵巧手,实习灵巧手的触党反馈: 3参与机器人架构设计、零部件选型、算法方案设计: 运动控制方向: 1.设计、 开发、实现和优化智能机械管的控制算法, 提高机械臂的智能性和学习能力。 2、研究机器人的智能控制模型,理解机器人的知、推理、学习和行为规划等机制。 3、在等机器人软件平台上开发机器人的控制和规划程序,并在Linux系统下进行软件开发和调试。 4、与其他团队成员合作,集成机器人和其他智能设备的功能,实现智能化的生产流程。

杭州
logo of horizon
实习算法序列

1.参与具身智能操作基座模型的研发,通过设计创新的VLA、WA等算法,构建行业领先的通用操作能力。 2.跟踪具身智能、机器人通用操作领域国际顶会顶刊最新研究动态,挖掘创新技术方向与落地场景,提出可落地的技术解决方案,持续优化算法性能与模型泛化能力

更新于 2026-03-16北京|上海
logo of horizon
校招算法序列

1.参与具身智能操作基座模型的研发,通过设计创新的VLA、WA等算法,构建行业领先的通用操作能力。 2.跟踪具身智能、机器人通用操作领域国际顶会顶刊最新研究动态,挖掘创新技术方向与落地场景,提出可落地的技术解决方案,持续优化算法性能与模型泛化能力

更新于 2026-03-16北京|上海