盒马盒马-具身算法工程师-杭州
任职要求
1、计算机科学、人工智能、机器人工程或相关领域硕士及以上学历。具备深度学习、计算机视觉和自然语言处理的扎实理论基础和实践经验。 2、熟练掌握Python、C++等编程语言,有使用PyTorch、TensorFlow等深度学习框架的经验。 3、熟悉VLM/MLLM模型的训练流程,了解常见的增量训练方法与微调方法。 4、熟悉主流的多模态预训练基座,熟悉多模态对齐等关键技术; 5、具备良好的团队合作精神和沟通能力,能够通过团队协作推进项目进展。
工作职责
1、设计并实现VLA算法方案,以量产落地为导向,熟悉RT-1/2、pi0等主流多模态具身大模型优劣,改善调优; 2、负责机器人具身操作任务的强化学习算法设计、开发和优化; 优化Sim2Real的迁移技术,提高算法鲁棒性;跟踪前沿技术,进行强化学习算法的调研、性能对比和评估; 3、研究多模态学习方法,结合视觉、触觉、力反馈提升机器人决策能力; 包括VLM的训练与微调,实现模型实际场景的落地需求,多模态数据集的构建、清洗等,提升算法性能和决策质量等。
菜鸟平台人工智能部致力于探索前沿AI技术在产业互联网的落地与应用: 1、算法研发: 参与建设大模型、多模态、文档理解、AI Agent、知识图谱,强化学习等人工智能技术与行业领域模型的深度融合,实现相关产品的创新与升级。 2、算法应用:参与建设相关技术在业务场景的落地,包括但不限于知识库问答、客服智能、语音智能、数据智能、文档智能、MultiAgent等; 3、深入跟踪调研大模型以及相关方向(包括但不限于NLP/CV/多模态/Agent/具身智能)的前沿技术。
1、负责机器人多模态大模型(VLA模型)的工程化落地,包括预训练开发、模型微调、训练优化以及实际效果调优; 2、参与基于大模型的机器决策控制工程化工作,包括训练框架搭建、数据集处理、算力部署,以及在真机上的部署与测试; 3、优化大模型的训练效率以及资源利用率,熟练运用诸如模型并行、Flash Attention、LoRA等技术; 4、负责云端数据处理以及分布式训练落地,优化大模型的多模态任务处理能力; 5、跟进多模态大模型与具身智能的前沿应用进展,负责模型在机器人场景的部署与技术转化。
1、负责机器人多模态大模型(VLA模型)的工程化落地,包括预训练开发、模型微调、训练优化以及实际效果调优; 2、参与基于大模型的机器决策控制工程化工作,包括训练框架搭建、数据集处理、算力部署,以及在真机上的部署与测试; 3、优化大模型的训练效率以及资源利用率,熟练运用诸如模型并行、Flash Attention、LoRA等技术; 4、负责云端数据处理以及分布式训练落地,优化大模型的多模态任务处理能力; 5、跟进多模态大模型与具身智能的前沿应用进展,负责模型在机器人场景的部署与技术转化。

视觉大模型方向: 1、 协调上层应用需求到机器视觉算法的整体架构; 2、 实现机器人基于3D视觉的双臂抓取方案,落地在照片、水杯等常规物体的视觉抓取任务中: 3、带领算法团队进行传统机器人视觉到端到端视觉大模型的技术演进,并落地在双臂协同抓取任务; 导航定位方向: 1、 负责机器人基于LIDAR的导航与定位算法研究与实现,并支持机器人业务中导航的需求; 2、负责单线和多线LIDAR的开发,SLAM 算法、多传感器融合算法、3D点云、3D场景重建等 3、负责无地图导航算法研究、自主实时建图方案研究; 4、实现高精度的地图更新; 机器人操作系统方向: 1、从事移动机器人系统的设计和研发,不限于底盘、四足、双足等形态;设计机械结构,硬件结构、并具备-定嵌入式开发经验: 2、具备机器人硬件开发经验,实现对关节电机的控制、实现与相机和雷达的通信: 3、熟悉运动控制算法,利用动捕收集步态数据,并通过强化学习和模仿学习实现机器人运动控制: 双臂方向 1、复现开源的双臂机器人扩散大模型RDT,并完成数据采集、模型训练、优化等功能: 2、设计触觉反馈传感器,并用于灵巧手,实习灵巧手的触党反馈: 3参与机器人架构设计、零部件选型、算法方案设计: 运动控制方向: 1.设计、 开发、实现和优化智能机械管的控制算法, 提高机械臂的智能性和学习能力。 2、研究机器人的智能控制模型,理解机器人的知、推理、学习和行为规划等机制。 3、在等机器人软件平台上开发机器人的控制和规划程序,并在Linux系统下进行软件开发和调试。 4、与其他团队成员合作,集成机器人和其他智能设备的功能,实现智能化的生产流程。