logo of anker

安克创新AI与具身智能-【博士专项】

社招全职研发地点:深圳 | 北京状态:招聘

任职要求


1、2024-2026届博士毕业生;
2、机器人、人工智能、计算机、数学、自动化、力学、大模型与多模态、结构仿真、嵌入式等专业及相关研究方向;
3、具备良好的编程能力;具…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


安克创新正式启动了机器人发展战略,计划分三个阶段推进:
「二维基础型」:以扫地机器人、割草机器人为典型的平面作业机器人。
「三维移动型」:包含机器狗、无人机等具有三维空间移动能力的机器人。
「三维交互型」:通过机械臂来实现复杂操作的人形/类人形机器人。"

招聘方向:
【大模型与多模态算法工程师】
【强化学习算法工程师】
【灵巧手工程师】
【机器人运动规划工程师】
【机器人强化学习算法工程师】
【机器人数据平台算法工程师】
【机器人感知算法工程师】
【高级音频算法工程师】
【图像与视频AI算法工程师】
【AI算法工程师】
【嵌入式工程师】
包括英文材料
大模型+
强化学习+
相关职位

logo of jd
社招8年以上软件开发岗(团队

1. 技术路线与架构 - 制定“感知-决策-控制-学习”一体化技术路线图,平衡实时性、精度与成本。 - 设计分层开放架构:硬件抽象层 HAL、中间件 Embodied SDK、AI 服务层、数字孪生层。 2. 场景二次开发 - 带领跨学科团队(感知、规划、控制、机械、测试、产品)完成场景需求→功能分解→指标量化→迭代交付。 - 主导关键算法选型/自研:VLM 细粒度物体位姿估计、模仿学习+强化学习混合策略、全身协同柔顺控制。 3. 硬件改动与选型 - 评估并最小化本体改动:末端执行器快换、传感器加装(腕部 6D 力觉、3D ToF、语义相机)、算力升级(Orin/NX 边缘计算盒)。 - 建立外设生态库,制定电气/机械/通讯接口标准,实现“Plug & Play”二次开发。 4. 数据闭环与仿真 - 搭建“Real2Sim2Real”数据引擎:真实数据采集→自动标注→数字孪生训练→模型回灌→OTA 升级。 - 推动基于 NeRF/Gaussian Splatting 的场景快速重建,把新环境建模时间从 1 周缩短到 1 小时。 5. 质量与合规 - 制定并落地二次开发 V 模型:需求→系统→单元→HIL→现场验证→安全认证(CE/CR/防爆/KC)。 - 建立故障追溯体系,实现“一小时定位、一天给出补丁、一周 OTA 闭环”。 6. 团队与外部合作 - 30+ 人团队组建与培养:算法/工程/测试/PM/运维;建立技术晋升与专利激励制度。 - 主导与高校/芯片/云厂商/集成商的战略项目,争取政府及 EU Horizon 具身智能专项经费。

更新于 2025-10-28北京
logo of tongyi
社招2年以上技术类-算法

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备跨语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从几百 M 到 T 级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen 正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 视觉语言理解能力是Qwen最重要的能力之一,围绕 LLM 建设出具有视觉深度理解与推理能力的基座模型是团队的必经之路。结合视觉理解和推理能力的基础模型,将拓展到视频理解,GUI Agent,以及VLA 和机器人等场景中。团队负责:1)多模态基础模型的研发,包括融合视觉语言的跨模态理解模型设计,提升视觉基础模型在图像/视频中的视觉知识、空间感知、Omni Parsing等核心能力,并优化多模态大模型AI infra;2)探索多模态Agent和推理能力,构建支持网络世界(PC/Mobile/Web/游戏)交互的通用智能体;3)研究生成与理解统一的模型架构,实现跨模态生成与推理的协同优化。 工作职责 1. 多模态Pre-training:开展研究及进行实验。研究内容包括:数据清洗与筛选、数据配比优化、课程学习、视觉语言模型结构设计与优化、训练策略优化、预训练数据合成、scaling law预测、词表优化、模型蒸馏与压缩、长上下文能力优化等。 2. 多模态Post-training:迭代Post-training训练策略(SFT/RLHF),专项能力数据迭代,参与模型能力评测及评测数据和评估标准的迭代。 3. 多模态推理和通用Agent:通过强化学习(RL)持续提升多模态模型推理能力和执行任务能力,打造多模态的Test Scaling Laws,并推动模型对网络和虚拟世界的交互和任务完成能力。 4. 统一理解生成:构建视觉统一理解生成大模型,推进多模态统一生成与理解的推理和交互新范式。

更新于 2025-08-04北京|杭州|上海
logo of tongyi
校招通义2026届秋

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen 正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 若你对以下一个或者多个方向感兴趣均欢迎投递: 1)多模态基础模型的研发,包括融合视觉语言的跨模态理解模型设计,提升视觉基础模型在图像/视频中的视觉知识、空间感知、Omni Parsing 等核心能力,并同时优化多模态大模型的AI infra。 2)通过强化学习(RL)持续提升多模态模型推理能力和执行任务能力,构建支持网络世界(PC/Mobile/Web/游戏)交互的通用智能体,将相关能力拓展到GUI agent,VLA,以及具身智能场景中。 3)研究理解与生成统一的模型架构,实现跨模态生成与推理的协同优化。 工作职责: 1. 多模态 pre-training:开展研究及进行实验,研究内容包括:数据清洗筛选、数据配比优化、课程学习、视觉语言模型结构设计与优化、训练策略优化、预训练数据合成、scaling law 预测、词表优化、模型蒸馏与压缩、长上下文能力优化等。 2. 多模态 post-training:迭代 post-training 训练策略(SFT/RLHF),专项能力数据迭代,参与模型能力评测及评测数据和评估标准的迭代。 3. 多模态推理和通用 agent:通过强化学习(RL)持续提升多模态模型推理能力和执行任务能力,打造多模态的 test scaling laws,并推动模型对网络和虚拟世界的交互和任务完成能力。 4. 统一理解生成:构建视觉统一理解生成大模型,推进多模态统一生成与理解的推理和交互新范式。

更新于 2025-08-22北京|杭州
logo of xpeng
实习

我们致力于构建下一代 空间智能(Spatial Intelligence)系统,让AI不仅能“看懂世界”,更能理解空间结构、推理物体关系、规划行动轨迹,并在虚拟或真实环境中持续学习与演化。 你将与团队一起: 研发具备空间理解、物体感知、轨迹预测与交互规划能力的智能体模型; 构建融合 视觉语言模型(VLM)与世界模型(World Model) 的系统,实现3D场景、深度、物理与可供性(Affordance)的联合建模; 使用 Game Engine(Unreal / Unity / Isaac Sim) 搭建高保真虚拟环境,用于数据生成与智能体评测; 基于 vLLM / Ray 构建高效多模态数据管线,实现大规模生成、自动标注与验证; 推动空间智能在机器人与具身智能领域的应用落地。

更新于 2025-10-27深圳