通义Token Foundry-视觉语言大模型算法工程师-Qwen

社招全职2年以上技术类-算法2026-07-13地点：北京 | 杭州 | 上海状态：招聘

扫码手机上打开

任职要求

1. 计算机科学、计算机视觉、人工智能、机器学习、具身智能等领域的博士/硕士毕业生。
2. 较强的代码能力，擅长模型训练及数据处理；精通Python及PyTorch等深度学习框架；熟悉Transformer架构以及CV、大语言模型基础知识。
3. 善于平衡研究目标及落地实现，具备跨学科视野与协作意识，能够与工程、产品等多学科团队紧密合作，推动研究成果快速落地并产生实际影响力。
4. 关注技术影响力，具有开源开放…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 多模态Pre-training：开展研究及进行实验。研究内容包括：数据清洗与筛选、数据配比优化、课程学习、视觉语言模型结构设计与优化、训练策略优化、预训练数据合成、scaling law预测、词表优化、模型蒸馏与压缩、长上下文能力优化等。
2. 多模态Post-training：迭代Post-training训练策略（SFT/RLHF），专项能力数据迭代，参与模型能力评测及评测数据和评估标准的迭代。
3. 多模态推理和通用Agent：通过强化学习（RL）持续提升多模态模型推理能力和执行任务能力，打造多模态的Test Scaling Laws，并推动模型对网络和虚拟世界的交互和任务完成能力。
4. 统一理解生成：构建视觉统一理解生成大模型，推进多模态统一生成与理解的推理和交互新范式。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

OpenCV+

机器学习+

Python+

PyTorch+

深度学习+

Transformer+

还有更多 •••

登录查看完整学习资料

相关职位

Token Foundry-云端Agent技术专家-北京/杭州

社招3年以上技术类-开发

1. 面向ToB行业场景（如AI手机等），设计并构建可扩展、高可用的Agent编排系统，支撑多模态交互系统中复杂任务的自动化执行。 2. 深度整合阿里集团内部丰富的Agent能力，同时对接第三方生态服务，打造统一的行业级Agent应用。 3. 制定标准化的工具描述协议、Agent接入规范与开发者工具链（SDK/CLI/调试平台），降低内外部生态伙伴的接入门槛。 4. 针对移动端等资源受限环境，优化Agent调用链路的性能、延迟与鲁棒性，支持离线、弱网、低功耗等边缘场景下的可靠运行。

更新于 2026-06-15北京|杭州

Token Foundry-机器人系统集成与开发工程师-杭州/北京/上海

社招1年以上技术类-开发

1. 负责机器人操作系统的整体软硬件集成与真机部署，完成机械臂、传感器、计算单元等系统的搭建、调试与优化，构建稳定可靠的机器人运行环境。 2. 负责实时遥操作系统的开发与优化，满足高时效性和可靠性要求，设计并搭建真机评测体系与数据管线。 3. 解决真实机器人系统中的部署问题（延迟、标定误差等），优化异步推理系统（RTC等），设计安全保护机制（碰撞检测、异常行为监测、急停），持续提升系统鲁棒性与安全性。 4. 协同算法、数据、硬件团队，将前沿算法成功转化为可稳定运行的机器人系统，推动在真实场景和任务的落地闭环。

更新于 2026-06-16杭州

Token Foundry-多模态生成算法专家/高级专家-杭州/北京

社招3年以上技术类-算法

1. 探索研究多模态生成大模型的设计与开发，探究高效生成、生成理解统一、多模态理解、强化学习/RLHF后训练和高效数据管线设计等方向。 2. 参与研发多模态生成大模型开发等下一代人工智能核心技术，参与大规模生成基础模型预训练与后训练开发。 3. 负责跟踪和研究多模态生成大模型前沿技术调研、落地、对业务进行优化。

更新于 2026-06-16北京|杭州

Token Foundry-大模型预训练算法工程师-Qwen

社招1年以上技术类-算法

千问（Qwen）是由阿里巴巴研发的超大规模语言模型，具备跨语言、跨任务的理解与生成能力。Qwen系列模型，涵盖参数量从几百 M 到 T 级的基座大语言模型，并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成，从逻辑推理到内容创作，从单一多模态到全模态统一理解生成，Qwen 正在打造全球领先的全模态模型技术体系，推动AI在企业服务、开发者生态、个人用户等领域的深度应用，引领下一代人工智能的发展。我们期望打造世界一流的预训练 LLM 基座，开发涵盖参数量从几百M到T级的基座模型，并将作为 Qwen / QwenVL / Qwen-Omni / Qwen-Coder 等系列模型的基座。我们追求将现有的预训练技术做到极致，并积极探索下一代的预训练技术。工作职责： 1. 预训练数据：大规模预训练数据合成技术探索、STEM & reasoning 优化、长尾知识优化、精品数据挖掘过滤、自然数据 scaling、长文本优化、面向 test-time scaling 的数据优化。 2. 预训练策略：新型预训练损失函数探索、遗忘对抗与持续学习、optimizer 优化、lr scheduler 优化、课程学习、scaling law 预测、超参优化。 3. 模型结构：新型模型结构探索、模型可解释性、MoE 优化、参数扩展与裁剪蒸馏、线性注意力、动态稀疏注意力、draft model 优化、动态计算优化、KV cache压缩、长序列优化、decoding 加速等。

更新于 2026-06-18北京|杭州|上海