通义Token Foundry-大语言模型算法专家/高级算法工程师-杭州

社招全职3年以上技术类-算法2026-07-17地点：杭州状态：招聘

扫码手机上打开

任职要求

1. 具备扎实的大语言模型post-training实践经验(SFT/RL/Agent等)和垂域大模型研发落地经历；所研发模型具备大规模线上应用经历(如日均调用量达千万及以上)者优先。
2. 精通Python等语言，熟练掌握PyTorch、verl、vllm等主流训练和推理框架，具备扎实的coding能力；在ACM-ICPC等国内外知名算法竞赛中取得优异成绩者优先。
3. 能够…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 高质量垂域数据工程：深入优化垂直领域（如文本内容审核）的高质量数据构建与迭代方法论，持续提升数据的质量、多样性与生产效率。
2. 可扩展后训练体系：探索适配领域特性的 SFT/RL 算法，构建高效、稳定、可扩展的垂域模型后训练范式，系统性提升模型能力。
3. 前沿技术研究与落地：探索推理模型前沿技术（如高效蒸馏、reward system、agentic RL、test-time learning 等）以及模型可解释性技术，沉淀技术成果和影响力，并推动大模型相关技术在行业场景中的转化与落地，提升领域模型竞争力，支撑业务持续增长。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

SFT+

AI agent+

大模型+

Python+

PyTorch+

vLLM+

还有更多 •••

登录查看完整学习资料

相关职位

Token Foundry-算法专家-多语言同传大模型

社招3年以上技术类-算法

1. 负责Qwen-Omni多语言能力研发，解决多语言语音翻译、实时同传等技术问题。 2. 大模型算法前沿技术追踪、探索，建设技术影响力。 3. 研发基于多模态大模型的多语言/跨语言任务处理新范式，构建基于大模型的多语言应用。 4. 负责在电商、教育、广告、游戏等多语言业务场景的应用落地。

更新于 2026-07-06北京|杭州

Token Foundry-视觉语言大模型算法工程师-Qwen

社招2年以上技术类-算法

1. 多模态Pre-training：开展研究及进行实验。研究内容包括：数据清洗与筛选、数据配比优化、课程学习、视觉语言模型结构设计与优化、训练策略优化、预训练数据合成、scaling law预测、词表优化、模型蒸馏与压缩、长上下文能力优化等。 2. 多模态Post-training：迭代Post-training训练策略（SFT/RLHF），专项能力数据迭代，参与模型能力评测及评测数据和评估标准的迭代。 3. 多模态推理和通用Agent：通过强化学习（RL）持续提升多模态模型推理能力和执行任务能力，打造多模态的Test Scaling Laws，并推动模型对网络和虚拟世界的交互和任务完成能力。 4. 统一理解生成：构建视觉统一理解生成大模型，推进多模态统一生成与理解的推理和交互新范式。

更新于 2026-07-13北京|杭州|上海

Token Foundry-大模型预训练算法工程师-Qwen

社招1年以上技术类-算法

千问（Qwen）是由阿里巴巴研发的超大规模语言模型，具备跨语言、跨任务的理解与生成能力。Qwen系列模型，涵盖参数量从几百 M 到 T 级的基座大语言模型，并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成，从逻辑推理到内容创作，从单一多模态到全模态统一理解生成，Qwen 正在打造全球领先的全模态模型技术体系，推动AI在企业服务、开发者生态、个人用户等领域的深度应用，引领下一代人工智能的发展。我们期望打造世界一流的预训练 LLM 基座，开发涵盖参数量从几百M到T级的基座模型，并将作为 Qwen / QwenVL / Qwen-Omni / Qwen-Coder 等系列模型的基座。我们追求将现有的预训练技术做到极致，并积极探索下一代的预训练技术。工作职责： 1. 预训练数据：大规模预训练数据合成技术探索、STEM & reasoning 优化、长尾知识优化、精品数据挖掘过滤、自然数据 scaling、长文本优化、面向 test-time scaling 的数据优化。 2. 预训练策略：新型预训练损失函数探索、遗忘对抗与持续学习、optimizer 优化、lr scheduler 优化、课程学习、scaling law 预测、超参优化。 3. 模型结构：新型模型结构探索、模型可解释性、MoE 优化、参数扩展与裁剪蒸馏、线性注意力、动态稀疏注意力、draft model 优化、动态计算优化、KV cache压缩、长序列优化、decoding 加速等。

更新于 2026-06-18北京|杭州|上海

Token Foundry-大模型后训练/Agent 沙箱系统高级专家-杭州/北京/深圳

社招5年以上

1. 深度参与或主导沙箱平台的整体技术架构设计，定义系统分层、模块边界和核心接口规范，构建支撑大模型后训练与 AI Agent 两大场景的统一沙箱基础设施，牵引团队技术方向。 2. 深度参与或主导大规模资源调度与弹性架构设计，规划万级并发沙箱实例的调度策略、资源池化方案和容量模型，在极端突发场景下保障系统稳定性与资源利用率。 3. 推动训练侧与推理侧沙箱的架构统一与平台化，抽象共性能力，降低各业务方的接入成本。 4. 深度参与跨团队技术协同，与大模型训练框架、推理引擎、算法、安全等团队对齐需求和技术方案，从基础设施视角定义沙箱的 SLA 和能力边界。 5. 建立技术前瞻性，持续跟踪业界安全容器、轻量虚拟化、Agent 执行框架等领域的技术趋势，主导关键技术选型和架构迭代。

更新于 2026-06-22北京|深圳|杭州