logo of anker

安克创新具身数据算法工程师 (博士)

校招全职地点:杭州状态:招聘

任职要求


1. 2025-2026应届博士毕业生,计算机、人工智能、自动化、机械电子等专业;
2. 有机械臂/机械狗的感知、决策、规划、控制等若干领域的算法实践和优化经验;
3. 熟悉TransformerBERTGPT等模型,熟悉预训练和微调流程,具有相关的工作经验;
4. 有ACT、Diffusion Policy、OpenVLA、RDT、Pi0等相关算法研究背景经验者优先;
5…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.推进机器人多模态大模型(VLM/VLA)、3D感知算法的工程化落地:涵盖预训练、微调、训练加速和效果调优。
2.基于issac sim搭建仿真环境验证操作模型,设计real2sim2real迁移框架,加速算法验证与落地。
3.具身智能算法研发,包括不同数据配比/网络结构/本体构型,在toC场景完成长序列任务和技能泛化。
4.研发自动化标注算法(2D/3D/VLA等),降低标注成本和提升标注质量。
5.设计多模态数据(图像、视频和点云等)生成算法,增强数据多样性。
包括英文材料
算法+
Transformer+
BERT+
GPT+
C+
C+++
还有更多 •••
相关职位

logo of amap
社招3年以上技术类-算法

团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现空间智能、高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 我们在做什么? 高德拥有全中国最庞大、最真实的物理世界视觉数据。我们不只是在做地图,我们正在基于空间智能构建一个能够感知、理解并预测物理规律的“具身基座模型”。 在这里,你将触达数亿级真实街景、轨迹与语义数据,解决从“数字地图”到“通用物理智能”的终极跨越。 岗位核心挑战 具身基座模型 (Embodied Foundation Models): 研发下一代VLA/WAM大模型,突破多模态指令到精准动作映射的瓶颈,实现跨场景的零样本迁移能力。 世界模型 (World Models): 构建基于大规模视频生成的物理世界模拟器,利用生成式AI预测场景演化,为具身智能提供无限的训练“想象空间”。 大模型后训练与强化学习 : 探索GRPO、PPO、SAC等算法在多模态大模型、具身控制上的应用,通过大规模强化学习提升Agent在复杂时空环境下的决策边界。 大规模数据合成与闭环: 利用高德独有的时空数据优势,构建自动化的具身数据生产、评测管线,解决Scaling Law在具身领域的落地难题。 开源影响力与行业基准: 主导或深度参与具身智能开源项目建设。 我们鼓励将核心算法框架、高质量具身数据集或评估基准贡献给开源社区,打造具有行业号召力的开源作品,定义下一代具身智能的技术标准。 为什么加入高德视觉团队? 顶级的“真”数据: 区别于实验室的玩具数据集,我们拥有海量真实室内外场景与空间语义数据,这是训练基座模型最完美的温床。 极致的算力支持: 提供充足的集群资源,让你的Idea不受算力瓶颈束缚。 真实的应用场景: 你的代码将直接驱动真实物理产品,影响数亿用户的出行决策。 极简的技术氛围: 扁平化管理,与世界顶尖研究者共同探索AI的下一站。 加入我们,一起定义物理世界的AI入口!

更新于 2026-04-07北京
logo of aligenie
社招3年以上技术类-算法

团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现空间智能、高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 我们在做什么? 高德拥有全中国最庞大、最真实的物理世界视觉数据。我们不只是在做地图,我们正在基于空间智能构建一个能够感知、理解并预测物理规律的“具身基座模型”。 在这里,你将触达数亿级真实街景、轨迹与语义数据,解决从“数字地图”到“通用物理智能”的终极跨越。 岗位核心挑战 具身基座模型 (Embodied Foundation Models): 研发下一代VLA/WAM大模型,突破多模态指令到精准动作映射的瓶颈,实现跨场景的零样本迁移能力。 世界模型 (World Models): 构建基于大规模视频生成的物理世界模拟器,利用生成式AI预测场景演化,为具身智能提供无限的训练“想象空间”。 大模型后训练与强化学习 : 探索GRPO、PPO、SAC等算法在多模态大模型、具身控制上的应用,通过大规模强化学习提升Agent在复杂时空环境下的决策边界。 大规模数据合成与闭环: 利用高德独有的时空数据优势,构建自动化的具身数据生产、评测管线,解决Scaling Law在具身领域的落地难题。 开源影响力与行业基准: 主导或深度参与具身智能开源项目建设。 我们鼓励将核心算法框架、高质量具身数据集或评估基准贡献给开源社区,打造具有行业号召力的开源作品,定义下一代具身智能的技术标准。 为什么加入高德视觉团队? 顶级的“真”数据: 区别于实验室的玩具数据集,我们拥有海量真实室内外场景与空间语义数据,这是训练基座模型最完美的温床。 极致的算力支持: 提供充足的集群资源,让你的Idea不受算力瓶颈束缚。 真实的应用场景: 你的代码将直接驱动真实物理产品,影响数亿用户的出行决策。 极简的技术氛围: 扁平化管理,与世界顶尖研究者共同探索AI的下一站。 加入我们,一起定义物理世界的AI入口!

更新于 2026-04-07北京
logo of vivo
校招

1、机器人基础模型架构设计与开发:如视觉-语言-动作(VLA)模型的算法研发,包括多模态特征对齐、动作序列生成与推理优化,推动模型在机器人操作场景的端到端能力提升; 2、具身智能多模态系统构建:设计融合视觉、语言与动作的联合训练框架,开发基于Transformer或扩散模型的跨模态交互机制,提升模型在复杂动态环境中的语义理解与决策能力; 3、算法性能优化与工程化:针对具身智能硬件平台(如机械臂、移动机器人)优化VLA等模型的实时推理性能,通过算子融合、量化压缩等技术实现低延迟部署。 4、跨模态数据闭环建设:搭建大规模具身智能数据采集与增强系统,设计数据标注与仿真验证工具链,支撑VLA等模型在真实场景的持续迭代。

更新于 2025-07-25上海|东莞
logo of xpeng
校招

岗位亮点 - 参与最前沿的具身智能研究,推动人形机器人和智能体的发展; - 用数据和算法驱动机器人自然、拟人、符合物理规律的全身动作生成; - 与资深算法工程师紧密合作,获得生成式模型与机器人交叉领域的实战指导; - 与机器人“零距离接触”,将算法落地到真实机器人体内。 - 协助构建与清洗大规模多模态数据集(音频、文本、动作等); - 跟踪并复现动作生成、人形机器人控制等方向的前沿研究成果; - 参与基于 Diffusion Transformer 或其他生成式架构的全身动作生成模型的训练、调优与评估; - 与运动控制部门紧密协作,确保生成的动作满足机器人运动稳定性与物理可行性要求。

更新于 2025-11-12深圳|上海