小鹏汽车机器人动作捕捉实习生
任职要求
职位要求: 表现力与控制力: 具备丰富的肢体表现力,能通过动作准确传达不同情绪与意图,动作自然、协调。 理解与执行能力: 能够快速理解并执行技术团队提出的动作指令与主观反馈,具备良好的沟通与协作精神。 严谨踏实的工作态度: 拥有高度的责任心,工作耐心细致,能够专注…
工作职责
团队介绍: 小鹏机器人团队致力于打造全球领先的机器人交互能力。我们的目标是让机器人的动作与交互变得极致拟人、自然与优美。现诚邀一位专业的动捕演员加入我们,共同参与这一前沿领域的探索与创造。 根据指定的文本情境与情感要求,完成高质量、多样化的对话全身动作数据采集。 例如扮演展厅讲解员,情感充沛的演讲家,专业热情的销售人员等 准确理解研发团队对于机器人动作风格、节奏及表现力的具体需求,并将其转化为精准、自然的肢体表演。 支持项目进行持续、稳定的数据采集工作,能够适应必要的重复性任务,保证数据产出的一致性与高质量。
运动控制开发: 参与构建人形机器人通用运控跟踪器,实现高动态行为的稳定执行。 与基于 Diffusion 的轨迹生成器协同工作,赋予机器人日常运动与操控能力(如行走、转向、平衡调整)。 专项技能研发: 开发机器人特定技能:物体抓取与搬运、球类运动、开关门等常见交互任务。 要求算法具备快速决策与高效执行能力,确保在动态环境中的稳健表现。 数据与部署链路: 参与人形机器人遥操作数据采集、仿真数据生成及人体动作数据的重定向处理。 打通从 数据→仿真→训练→部署 的完整研发链路,推动算法在实机上的优化与落地。
欢迎加入阿里巴巴数字人团队! 如果你对以下领域感兴趣,并希望在实际项目中积累经验,欢迎加入我们! 你将参与的工作: 个性化数字人形象生成系统 在海量用户数据和先进技术支持下,协助开发能够生成千人千面个性化虚拟形象的系统。 学习并应用基础的图像处理和生成模型,帮助提升系统的定制化能力。 高表现力肢体表情驱动技术研发 参与研发基于动作捕捉、表情合成和实时渲染技术的数字人表情和肢体动作驱动系统。 协助优化现有技术,使数字人的表情和动作更加自然流畅,增强情感表达能力。 核心技术难题攻克 在导师指导下,学习和探索基于扩散模型的高质量数字人生成技术。 多模态统一大模型的应用 了解并参与多模态信息融合的研究,结合图像、文本、音频等多种信息,构建具备理解能力和生成能力的数字人系统。 协助解决业界尚未突破的技术瓶颈,推动技术创新。 相关研究课题细分方向: 数字人形象定制与风格化迁移 协助开发和优化数字人形象定制生成能力,适配不同的实时互动场景。 学习并应用基本的图像处理和生成算法,提升系统的灵活性和适应性。 数字人表情与肢体动作驱动 在导师指导下,参与数字人表情和肢体动作驱动技术的研发。 协助测试和优化现有系统,使其表现力更接近真人水平。 数字人多模态理解感知能力 参与构建数字人与用户的实时交互系统,提升其理解和响应能力。 协助进行多模态信息融合实验,增强数字人的个性化服务能力。 我们期待你是: 计算机科学、软件工程、人工智能等相关专业的在校学生(本科或研究生)。 对数字人技术有浓厚兴趣,愿意在实践中学习和成长。 具备一定的编程基础(如Python、C++),熟悉常用的数据处理和机器学习框架(如PyTorch、TensorFlow)者优先。 良好的团队合作精神和沟通能力。 加入我们,你将获得: 丰富的实战经验和前沿技术的学习机会。 导师一对一指导,助力你的职业发展。 参与影响亿级用户的大规模项目,感受技术带来的巨大价值。 开放包容的工作环境和充满活力的团队氛围。 让我们一起定义未来数字人的无限可能,期待你的加入!
1. 负责面向虚拟角色/虚拟人的创建(捏脸)和驱动(表情合成、动作捕捉和重定向、动作合成、舞蹈合成、物理模拟)等系统的设计和实现; 2. 深度参与上述能力在游戏和泛娱乐产品(短视频、直播、虚拟偶像、VTuber)中的工程化落地,对真实业务场景负责,帮助内容创作者提高生产效率,为玩家和用户创造崭新的互动娱乐体验。
(负责以下1-2项工作): 1、设计VLA模型架构,利用具身数据和VLM预训练/后训练,实现数据/模型的迭代和训练策略优化; 2、构建高质量互联网多模态数据及模型训练,提升VLM对物理世界的理解和具身推理能力; 3、负责遥操/动捕的真机数据构建和增强,综合利用具身数据金字塔(真机/合成/互联网数据),在机器人具身模型算法(模仿学习/强化学习)上验证有效性; 4、基于Isaac sim/MuJoCo等仿真平台构建Real2Sim2Real数据合成管线; 5、力/触觉和灵巧手数据采集和生成,并在灵巧手操作模型中验证闭环; 6、动作捕捉和重定向:人形动作捕捉,机器人重定向定向,动作模仿。