logo of anker

安克创新AI与具身智能-【博士专项】

社招全职研发地点:深圳 | 北京状态:招聘

任职要求


1、2024-2026届博士毕业生;
2、机器人、人工智能、计算机、数学、自动化、力学、大模型与多模态、结构仿真、嵌入式等专业及相关研究方向;
3、具备良好的编程能力;具备出色的团队合作和沟通能力,能够在多学科团队中有效合作;
4、对机器人技术和AI、强化学习有浓厚的兴趣和激情
5、在机器人、计算机、机器视觉等相关顶刊顶会发表过论文优先。

工作职责


安克创新正式启动了机器人发展战略,计划分三个阶段推进:
「二维基础型」:以扫地机器人、割草机器人为典型的平面作业机器人。
「三维移动型」:包含机器狗、无人机等具有三维空间移动能力的机器人。
「三维交互型」:通过机械臂来实现复杂操作的人形/类人形机器人。"

招聘方向:
【大模型与多模态算法工程师】
【强化学习算法工程师】
【灵巧手工程师】
【机器人运动规划工程师】
【机器人强化学习算法工程师】
【机器人数据平台算法工程师】
【机器人感知算法工程师】
【高级音频算法工程师】
【图像与视频AI算法工程师】
【AI算法工程师】
【嵌入式工程师】
包括英文材料
大模型+
强化学习+
相关职位

logo of tongyi
社招2年以上技术类-算法

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备跨语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从几百 M 到 T 级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen 正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 视觉语言理解能力是Qwen最重要的能力之一,围绕 LLM 建设出具有视觉深度理解与推理能力的基座模型是团队的必经之路。结合视觉理解和推理能力的基础模型,将拓展到视频理解,GUI Agent,以及VLA 和机器人等场景中。团队负责:1)多模态基础模型的研发,包括融合视觉语言的跨模态理解模型设计,提升视觉基础模型在图像/视频中的视觉知识、空间感知、Omni Parsing等核心能力,并优化多模态大模型AI infra;2)探索多模态Agent和推理能力,构建支持网络世界(PC/Mobile/Web/游戏)交互的通用智能体;3)研究生成与理解统一的模型架构,实现跨模态生成与推理的协同优化。 工作职责 1. 多模态Pre-training:开展研究及进行实验。研究内容包括:数据清洗与筛选、数据配比优化、课程学习、视觉语言模型结构设计与优化、训练策略优化、预训练数据合成、scaling law预测、词表优化、模型蒸馏与压缩、长上下文能力优化等。 2. 多模态Post-training:迭代Post-training训练策略(SFT/RLHF),专项能力数据迭代,参与模型能力评测及评测数据和评估标准的迭代。 3. 多模态推理和通用Agent:通过强化学习(RL)持续提升多模态模型推理能力和执行任务能力,打造多模态的Test Scaling Laws,并推动模型对网络和虚拟世界的交互和任务完成能力。 4. 统一理解生成:构建视觉统一理解生成大模型,推进多模态统一生成与理解的推理和交互新范式。

更新于 2025-08-04
logo of tongyi
校招通义2026届秋

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen 正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 若你对以下一个或者多个方向感兴趣均欢迎投递: 1)多模态基础模型的研发,包括融合视觉语言的跨模态理解模型设计,提升视觉基础模型在图像/视频中的视觉知识、空间感知、Omni Parsing 等核心能力,并同时优化多模态大模型的AI infra。 2)通过强化学习(RL)持续提升多模态模型推理能力和执行任务能力,构建支持网络世界(PC/Mobile/Web/游戏)交互的通用智能体,将相关能力拓展到GUI agent,VLA,以及具身智能场景中。 3)研究理解与生成统一的模型架构,实现跨模态生成与推理的协同优化。 工作职责: 1. 多模态 pre-training:开展研究及进行实验,研究内容包括:数据清洗筛选、数据配比优化、课程学习、视觉语言模型结构设计与优化、训练策略优化、预训练数据合成、scaling law 预测、词表优化、模型蒸馏与压缩、长上下文能力优化等。 2. 多模态 post-training:迭代 post-training 训练策略(SFT/RLHF),专项能力数据迭代,参与模型能力评测及评测数据和评估标准的迭代。 3. 多模态推理和通用 agent:通过强化学习(RL)持续提升多模态模型推理能力和执行任务能力,打造多模态的 test scaling laws,并推动模型对网络和虚拟世界的交互和任务完成能力。 4. 统一理解生成:构建视觉统一理解生成大模型,推进多模态统一生成与理解的推理和交互新范式。

更新于 2025-08-22
logo of antgroup
实习研究型实习生

研究领域: IoT 项目简介: 具身智能作为人工智能发展的新范式,通过物理实体(如机器人、无人系统等)直接与现实世界交互,其核心挑战在于融合AI与物理实体的安全可控性。当前系统涉及硬件设施、算法模型、数据系统等多维度复杂性,潜在攻击面包括传感器漏洞、多模块协同干扰、算法对抗攻击等。恶意攻击很可能引发具身智能体执行危险动作。传统安全防护难以应对物理域与信息域的双重威胁,目前不少厂家都在使用的开源项目Robot Operation System(机器人操作系统,简称ROS)最初以科研为目标场景,缺乏系统整体性安全设计。随着ROS的广泛应用,很多安全问题随之暴露,本项目希望对具身智能操作系统的安全性展开研究,提供系统性解决安全问题的方案。

logo of bytedance
社招A217965

1、探索结合各类空间智能相关技术,对真实和虚拟世界快速建模,尤其在可交互复杂场景的构建方向,推动Real2Sim2Real领域内的关键技术研究; 2、探索结合传统仿真和生成式仿真的数据合成方案,构建全新的机器人场景下的数据范式,推动合成数据价值探索与应用落地; 3、探索端到端世界模拟器的能力探索,推动生成式AI与物理仿真引擎的深度结合,尤其在物理约束模拟等方向的关键技术研究。

更新于 2025-06-05