通义Token Foundry-大模型应用后端工程师（LLM Application Backend Engineer）-北京/杭州

社招全职2年以上技术类-开发2026-06-30地点：杭州状态：招聘

扫码手机上打开

任职要求

1、硕士及以上学历，计算机相关专业，2年以上后端开发经验。
2、熟练掌握Go / Python / Java等至少一门后端语言；熟悉微服务架构设计与分布式系统。
3、大模型相关经验：有 LLM应用开发经验；熟悉Context Engineering；熟悉 RAG 架构与向量数据库；熟悉主流大模型 API使用与优化（满足其中任意2项即可）。
4、熟悉 Re…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、大模型应用系统架构设计：设计并实现大模型应用整体后端架构（API 层、编排层、Agent 层、工具层）；构建 LLM + RAG + Tool Calling + Workflow  的服务框架；构建稳定可复用的大模型调用封装层。
2、Agent 与工作流系统开发：构建可扩展的 Agent 执行框架（ReAct / Planner-Executor / Multi-Agent）；设计工具调用协议（MCP、Tool Schema、Function Calling）；支持复杂任务拆解、状态管理、上下文管理、长短期记忆管理。
3、RAG 与知识系统建设：构建知识索引与向量检索系统；设计高性能 embedding + 向量数据库架构；优化召回准确率、时效性与成本效率。
4、高并发与稳定性保障：构建支持高并发请求的大模型服务网关，优化模型调用延迟与成本，设计缓存机制，保障 SLA、容灾、限流、熔断。
5、多模态与实时系统支持：支持文本、语音、图像、多模态模型接口；支持流式输出（Streaming）；构建实时交互系统（如 AI 助手 / AI 手机）。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

后端开发+

Go+

Python+

Java+

微服务+

系统设计+

分布式系统+

大模型+

还有更多 •••

登录查看完整学习资料

相关职位

Token Foundry-大模型预训练算法工程师-Qwen

社招1年以上技术类-算法

千问（Qwen）是由阿里巴巴研发的超大规模语言模型，具备跨语言、跨任务的理解与生成能力。Qwen系列模型，涵盖参数量从几百 M 到 T 级的基座大语言模型，并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成，从逻辑推理到内容创作，从单一多模态到全模态统一理解生成，Qwen 正在打造全球领先的全模态模型技术体系，推动AI在企业服务、开发者生态、个人用户等领域的深度应用，引领下一代人工智能的发展。我们期望打造世界一流的预训练 LLM 基座，开发涵盖参数量从几百M到T级的基座模型，并将作为 Qwen / QwenVL / Qwen-Omni / Qwen-Coder 等系列模型的基座。我们追求将现有的预训练技术做到极致，并积极探索下一代的预训练技术。工作职责： 1. 预训练数据：大规模预训练数据合成技术探索、STEM & reasoning 优化、长尾知识优化、精品数据挖掘过滤、自然数据 scaling、长文本优化、面向 test-time scaling 的数据优化。 2. 预训练策略：新型预训练损失函数探索、遗忘对抗与持续学习、optimizer 优化、lr scheduler 优化、课程学习、scaling law 预测、超参优化。 3. 模型结构：新型模型结构探索、模型可解释性、MoE 优化、参数扩展与裁剪蒸馏、线性注意力、动态稀疏注意力、draft model 优化、动态计算优化、KV cache压缩、长序列优化、decoding 加速等。

更新于 2026-06-18北京|杭州|上海

Token Foundry-大模型后训练/Agent 沙箱系统高级专家-杭州/北京/深圳

社招5年以上

1. 深度参与或主导沙箱平台的整体技术架构设计，定义系统分层、模块边界和核心接口规范，构建支撑大模型后训练与 AI Agent 两大场景的统一沙箱基础设施，牵引团队技术方向。 2. 深度参与或主导大规模资源调度与弹性架构设计，规划万级并发沙箱实例的调度策略、资源池化方案和容量模型，在极端突发场景下保障系统稳定性与资源利用率。 3. 推动训练侧与推理侧沙箱的架构统一与平台化，抽象共性能力，降低各业务方的接入成本。 4. 深度参与跨团队技术协同，与大模型训练框架、推理引擎、算法、安全等团队对齐需求和技术方案，从基础设施视角定义沙箱的 SLA 和能力边界。 5. 建立技术前瞻性，持续跟踪业界安全容器、轻量虚拟化、Agent 执行框架等领域的技术趋势，主导关键技术选型和架构迭代。

更新于 2026-06-22北京|深圳|杭州

Token Foundry-大模型Post-Training 算法专家-杭州/北京

社招1年以上技术类-算法

1. 负责大模型从 Pre-SFT、SFT 到 RLHF (DPO/PPO/GRPO等) 全阶段的算法调优与策略设计，提升模型在风格控制、安全合规、领域知识注入、多轮交互逻辑、文创、指令遵循、情绪控制、Agent Planning 等核心维度的综合能力 2. 设计高质量 SFT、RL 等数据采集、清洗和标注方案，建立数据质量评估标准和流程，持续提升数据质量和多样性 3. 参与模型合版工作，包括数据配比策略、多任务训练优化、灾难性遗忘缓解等核心技术，确保各业务线智能体能力与基座模型的高效融合 4. 探索多模态（文本、视觉、音频等）场景下的 Post-Training 方案，解决跨模态对齐与幻觉问题，探索高质量数据的合成、Self-Play、Agentic RL 等方法，与 Pretrain、RL、评测团队紧密配合，推动基座模型面向应用的全流程优化 5. 参与 APP 对话助手产品的效果优化，通过精细化的 SFT/RL 策略提升对话质量、安全性与用户体验

更新于 2026-07-02北京|杭州

Token Foundry-大模型预训练算法工程师-Qwen

社招1年以上技术类-算法

更新于 2026-06-23北京|杭州|上海