通义Token Foundry-大模型算法开发高级工程师-杭州

社招全职3年以上技术类-开发2026-07-17地点：杭州状态：招聘

扫码手机上打开

任职要求

1. 深厚的算法理解力： 能够独立阅读并拆解大模型领域的前沿论文，理解 Transformer 及其衍生架构的数学原理与计算逻辑（不仅是会调用，更要懂原理）。
2. 硬核工程动手能力： 精通 Python/C++ 研发，熟练掌握PyTorch开发、有PyTorch分布式训练经验，有SFT、DPO、GRPO等后训练或强化学习实战经验，有 Agentic RL 训练经验。
3. 异构研发经验： 在处理大规模分布式推理或训练任务中，具备解决死锁、显存瓶颈及精度对齐等实际问题的实战经历，有主…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 前沿模型架构研发：负责大模型前沿架构（如 Linear Attention、原生多模态、MoE 等）的底层工程实现。深度参与算法底层逻辑重构，将前沿理论模型转化为高性能的训练与推理模型。
2. 复杂算子优化与系统级重构：针对非标准及新型算法架构，设计并实现深度定制化的分布式算子。通过重构核心计算组件，解决超大规模模型在异构算力集群下的瓶颈问题，打造具备极致响应速度和吞吐能力的推理后端。
3. 大规模并行策略与资源调度：设计并落地匹配复杂架构的计算并行策略（TP/PP/EP/CP）及精细化显存管理方案。持续优化大规模集群通信机制，降低通信开销，确保在算力池中实现模型的高效、稳定运行。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

算法+

大模型+

Transformer+

Python+

C+++

PyTorch+

SFT+

强化学习+

深度学习+

还有更多 •••

登录查看完整学习资料

相关职位

Token Foundry-大模型算法专家-Qwen Agent

社招1年以上技术类-算法

1. Agent模型后训练：负责大模型在Agent场景下的后训练（Post-training）工作，提升模型在复杂Agent任务中的表现。 2. 强化学习与RL探索：设计并优化基于强化学习（RL）的Agent训练框架，提升模型的长期规划能力、试错反思能力及工具调用准确率。 3. 核心能力构建：针对Agent的核心能力进行专项模型训练与对齐优化。 4. 行业解决方案落地：深入理解具体行业的业务痛点，将Agent模型能力与行业Know-how结合，设计并落地端到端的行业Agent解决方案。 5. 前沿技术追踪：跟踪学术界和工业界在LLM Agent、RLHF、后训练领域的最新进展，将前沿技术转化为团队的工程与算法资产。

更新于 2026-07-08北京|杭州|上海

Token Foundry-大模型算法专家-AI Coding

社招2年以上技术类-算法

1. 负责Agentic Coding大模型（Agentic LLM for Software Engineering）的后训练（Mid-Train/SFT/RL）算法设计和训练研究等。 2. 打造面向真实软件开发的智能化全链路技术，包括但不限于Agentic Coding、Agent Teams 等技术。 3. 建设大模型训练的Harness体系，探索Auto Research相关技术在大模型后训练的应用。 4. 将上述技术在 Qoder、Lingma 及 CLI 等产品形态中进行大规模应用落地。

更新于 2026-07-16北京|杭州

Token Foundry-大模型RL/RM算法专家-杭州/北京

社招1年以上技术类-算法

1. 负责 RLHF 全链路建设，包括 Reward Model 的设计、训练与迭代优化，推动 PPO / DPO / GRPO 等对齐算法的工程化落地。 2. 构建 Verifier、LLM as Judge、Rule 等为一体的 Reward System，优化多维度（如安全性、准确性、有用性、逻辑性、拟人度等）的偏好数据采集策略与训练方案。 3. 与 SFT、Pretrain 团队紧密协作，分析用户的 Badcase，将 RL 信号融入模型训练全流程，持续提升对话助手的用户体验。 4. 跟踪 Agentic RL 等前沿研究进展，并推动技术创新在基座大模型研发中的落地。

更新于 2026-07-09北京|杭州

Token Foundry-大语言模型算法专家/高级算法工程师-杭州

社招3年以上技术类-算法

1. 高质量垂域数据工程：深入优化垂直领域（如文本内容审核）的高质量数据构建与迭代方法论，持续提升数据的质量、多样性与生产效率。 2. 可扩展后训练体系：探索适配领域特性的 SFT/RL 算法，构建高效、稳定、可扩展的垂域模型后训练范式，系统性提升模型能力。 3. 前沿技术研究与落地：探索推理模型前沿技术（如高效蒸馏、reward system、agentic RL、test-time learning 等）以及模型可解释性技术，沉淀技术成果和影响力，并推动大模型相关技术在行业场景中的转化与落地，提升领域模型竞争力，支撑业务持续增长。

更新于 2026-07-17杭州