logo of tongyi

通义通义实验室-VLA算法专家-通义千问

社招全职3年以上技术类-算法地点:杭州状态:招聘

任职要求


1. 来自全球Top高校计算机科学、人工智能、机器学习深度学习、软件工程、自动化、电子、控制相关领域,博士/硕士毕业生优先。
2. 在大规模多模态模型训练、VLA模型设计与训练、(Real2)Sim2Real、、机器人感知、抓取、操作、移动、全身控制、规划等领域有扎实的理论基础和实践经验,并至少在其中一个方向有代表性学术成果或项目经历。
3. 在国际顶级人工智能/机器人的会议/期刊(如NeurIPSICMLICLR、TPAMI,IROS、RSS、CoRL、ICRA、IJRR、TRO、C…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。
在此基础上,我们致力于研究Qwen面向具身智能领域的下一代基础模型,将Qwen强大的认知与推理能力赋予物理世界的机器人智能体,打破数字世界与物理世界的壁垒。团队的目标是研发能够理解人类意图、感知物理环境、并自主规划执行复杂任务的通用具身基础模型。我们相信,通过融合前沿的多模态大模型与机器人技术,我们将开创通用人工智能的下一个篇章,让AI真正走进并服务于现实生活。

工作职责:
1. 具身基础模型研究: 构建面向机器人的多模态基础模型,将视觉语言模型与机器人中心的物理世界理解与决策深度融合,构建具身领域的高质量的大规模真实与仿真数据集,设计并训练支持感知、动作、记忆、规划与语言理解统一的具身基础模型。
2. 测评基准建立:构建面向机器人多模态基础模型的能力基准,设计有效的测试基准,持续构建能反映基础模型在物理世界真实能力的高效测评系统。
3. 软硬件系统整合部署: 构建机器人软硬件一体化系统,将算法部署在真实机器人平台(如机械臂、人形机器人)上,进行端到端的验证与迭代,推动研究成果的实际落地。
包括英文材料
机器学习+
深度学习+
NeurIPS+
ICML+
还有更多 •••
相关职位

logo of amap
社招5年以上技术类-算法

1. 跟踪VLM/VLA、世界模型、3D生成等前沿技术动态,结合地图领域的专业知识,探索其在智能交通与位置服务中的创新应用; 2. 基于高德海量多源异构数据,参与多模态地图大模型的构建、训练及性能调优; 3. 研发面向静态要素检测、occupancy网格预测及三维场景重建的多模态感知算法,建设复杂城市场景下的空间理解与环境表征能力。

更新于 2026-01-04北京
logo of eleme
社招3年以上技术类-算法

1. 参与淘宝闪购物流调度基础策略算法开发,包括不限于:供需预测、活动弹性预估、多单取送顺序路径规划、ETA模型等基础模型迭代; 2. 运用先进技术,包括不限于VLA、Transformer、强化学习/模仿学习、diffusion生成式模型等最新的深度学习技术,围绕骑手、商户、用户进行行为进行建模,例如骑手出勤完单模型、骑手端操作行为、骑手取送顺序行为、空载轨迹预测模型等,提升物流仿真系统精度,赋能物流技术业务发展; 3. 通过挖掘地理特征、骑手行为特征,骑手、用户画像embedding,持续迭代和提升模型精度,尤其是在恶劣天气、节假日等长尾场景。

更新于 2026-01-28北京|上海
logo of amap
社招5年以上技术类-开发

1. 主导具身智能机器人(不限于四足/人形/物流设备等)的系统架构设计及核心器件选型: 全面负责机器人本体硬件平台(结构、电驱、传感器系统)及运动控制系统的顶层设计、技术路线制定与关键器件评估选型; 2. 以具身AGI为技术导向,领导硬件与控制研发: 聚焦解决大空间、复杂室内外场景下的机器人高动态移动控制、鲁棒导航及自然人机交互等核心挑战,推动高性能硬件与控制算法的协同创新与工程落地; 3. 驱动端到端视觉-语言-动作(Vision-Language-Action)算法在机器人平台的集成与量产化:与算法团队协作,实现端到端VLA模型在机器人的高效部署、实时推理及性能优化,构建支撑算法迭代的闭环数据系统(数据引擎与数据飞轮); 4. 引领技术前沿与构建影响力: 持续跟踪并研判行业前沿技术方案(硬件、控制、感知与AI融合),主导具身智能软硬件协同的核心技术攻关,并通过开源、顶会论文、专利等方式建立并提升团队的技术领导力与行业影响力。

更新于 2025-06-20北京
logo of netease
社招3-5年网易伏羲

1、负责机器人多模态大模型(VLA模型)的工程化落地,包括预训练开发、模型微调、训练优化以及实际效果调优; 2、参与基于大模型的机器决策控制工程化工作,包括训练框架搭建、数据集处理、算力部署,以及在真机上的部署与测试; 3、优化大模型的训练效率以及资源利用率,熟练运用诸如模型并行、Flash Attention、LoRA等技术; 4、负责云端数据处理以及分布式训练落地,优化大模型的多模态任务处理能力; 5、跟进多模态大模型与具身智能的前沿应用进展,负责模型在机器人场景的部署与技术转化。

更新于 2025-11-13杭州