通义Token Foundry-多模态生成模型算法专家-万相Wan

社招全职3年以上2026-07-14地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1. 计算机科学、人工智能、机器学习能等领域的博士/硕士毕业生，具备计算机视觉等领域的扎实理论基础。
2. 掌握机器学习和深度学习基础知识，熟悉常用视觉生成算法，熟悉Pytorch、Tensorflow等至少一种深度学习框架。
3. 具备良好的科研能力，有大规模视觉生成算法相关研究经历和具有影响力科研工作（高引论文、知名开源项目等）者优先，有成果发表在CVPR、ICCV、NeurIPS、ICLR、…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

【部门介绍】
随着大模型技术的飞速发展，理解和生成多模态数据（图像、视频、音频、3D素材等）的能力日益增强。目前，构建能够同时进行输入和输出的多模态世界模型已成为业界的研究热点，也是实现通用人工智能（AGI）的重要技术路径之一。
万相Wan将持续在世界模型、原生多模态预训练、理解-生成融合范式、统一Tokenizer研究、人类反馈与强化学习等前沿技术方向上进行探索，始终追求在多模态世界模型领域的领先研究地位，致力于建立世界级的技术影响力。

【工作内容】
1、负责原生多模态模型研究和开发，结合多模态能力（支持文本、图像、语音输入）实现复杂指令生成，包括但不限于文生图、图生图、文档生成、可控编辑等核心方向。
2、负责图像生成模型效果优化，探索扩散模型、自回归模型结构和策略优化等核心技术课题。
3、负责人类反馈与强化学习，聚焦于更加精细的RL算法设计，并基于万相用户反馈的RLHF图像生成质量提升。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

机器学习+

OpenCV+

深度学习+

算法+

PyTorch+

TensorFlow+

还有更多 •••

登录查看完整学习资料

相关职位

Token Foundry-多模态生成算法专家/高级专家-杭州/北京

社招3年以上技术类-算法

1. 探索研究多模态生成大模型的设计与开发，探究高效生成、生成理解统一、多模态理解、强化学习/RLHF后训练和高效数据管线设计等方向。 2. 参与研发多模态生成大模型开发等下一代人工智能核心技术，参与大规模生成基础模型预训练与后训练开发。 3. 负责跟踪和研究多模态生成大模型前沿技术调研、落地、对业务进行优化。

更新于 2026-06-16北京|杭州

Token Foundry-多模态生成算法专家/高级专家-杭州/北京

社招3年以上技术类-算法

更新于 2026-06-15北京|杭州

Token Foundry-多模态世界模型前沿技术研究-万相Wan

社招2年以上

【部门介绍】随着大模型技术的飞速发展，理解和生成多模态数据（图像、视频、音频、3D素材等）的能力日益增强。目前，构建能够同时进行输入和输出的多模态世界模型已成为业界的研究热点，也是实现通用人工智能（AGI）的重要技术路径之一。万相Wan将持续在世界模型、原生多模态预训练、理解-生成融合范式、统一Tokenizer研究、人类反馈与强化学习等前沿技术方向上进行探索，始终追求在多模态世界模型领域的领先研究地位，致力于建立世界级的技术影响力。【工作内容】 1. 探索大规模多模态理解生成统一基础模型，包括但不限于：统一建模设计、高效模型结构设计、高效Scaling、视觉Tokenizer、多模态联合训练等。 2. 探索和突破多模态强化学习，包括但不限于：视觉CoT、面向复杂视觉设计任务的强化学习设计、基于用户反馈的在线自学习等。 3. 构建基于生成模型的真实世界渲染引擎，探索新的多模态交互范式，探索虚拟和真实世界的强化反馈链路设计。

更新于 2026-07-10北京|杭州

Token Foundry-多模态理解算法专家-杭州/北京

社招3年以上技术类-算法

1、探索研究多模态理解、计算机视觉、自然语言处理等前沿技术； 2、参与研发多模态、全模态大模型等下一代人工智能核心技术，探索大规模/超大规模多模态理解与生成统一的基础模型，提升大模型能力； 3、负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化。

更新于 2026-06-16北京|杭州