小米机器人实验室-机器人具身智能算法工程师实习生
任职要求
1、硕士及以上学历,机器人、计算机、人工智能、机器学习、应用数学等专业,理论功底深厚,有机器人、机械臂、自动驾驶、大模型从业经历者优先; 2、掌握机器人操作快慢双系统设计理念(VLM+VLA),掌握相关ACT/Diffusion Policy/RDT/Pi0等基础算法,有相关GROOT、AgiBot GO1、Helix等模型实施经验者优先; 3、在多模态模型、自监督学习、迁移学习、强化学习、知识蒸馏、CoT等方向具备 SOTA 项目经验或具备坚实知识基础; 4、扎实的Python、C++编程能力,熟悉Pytorch、TensorFlow机器学习框架,掌握规范 git 工作流; 5、有创新的想法,乐于接受技术挑战,具备相关英文读写能力
工作职责
1、参与具身智能算法模型在技能学习、动作规划、抓取操作等应用上的研发,实现多场景多任务的泛化; 2、设计、训练、部署模仿学习、强化学习、迁移学习、多模态学习等算法,构建机器人各类应用的通用技能; 3、与大模型、运控等团队合作,推动具身智能数据集、机器人平台等各项目落地实施; 4、紧跟最新技术进展,将学术界前沿创新内容进行快速复现并创新,参与相关方向的论文与专利积累。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索研究多模态大模型,VLA等前沿技术方向; 2、推动世界模型、强化学习在具身智能的应用,参与研发下一代智能机器人。
- 探索通用算法并应用于工业机器人场景任务,具备物体泛化、任务泛化、场景泛化能力 - 多模态大模型VLA/VLM在工业类机器人中的算法设计、智能控制和人机交互前瞻技术研究 - 多机器人协同作业与调度,控制机器人与物理世界交互 - 基于创新实验室,构建多台工业/协作机器人/人形机器人协同工作环境
研究领域: IoT 项目简介: 具身智能作为人工智能发展的新范式,通过物理实体(如机器人、无人系统等)直接与现实世界交互,其核心挑战在于融合AI与物理实体的安全可控性。当前系统涉及硬件设施、算法模型、数据系统等多维度复杂性,潜在攻击面包括传感器漏洞、多模块协同干扰、算法对抗攻击等。恶意攻击很可能引发具身智能体执行危险动作。传统安全防护难以应对物理域与信息域的双重威胁,目前不少厂家都在使用的开源项目Robot Operation System(机器人操作系统,简称ROS)最初以科研为目标场景,缺乏系统整体性安全设计。随着ROS的广泛应用,很多安全问题随之暴露,本项目希望对具身智能操作系统的安全性展开研究,提供系统性解决安全问题的方案。