通义通义实验室-大模型预训练算法工程师-通义千问

社招全职1年以上技术类-算法2025-11-18地点：北京 | 杭州 | 上海状态：招聘

扫码手机上打开

任职要求

1. 对上述研究方向的某一项或者几项有完整的研究经历或者实际的工业界落地经验。
2. 具有较强的动手能力，可以独立完成 idea 的验证和模型的训练。
3. 对技术有追求，务实，渴望做出有极大影响力的工作。

加分项…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

我们期望打造世界一流的预训练 LLM 基座，开发涵盖参数量从几百M到T级的基座模型，并将作为 Qwen / QwenVL / Qwen-Omni / Qwen-Coder 等系列模型的基座。我们追求将现有的预训练技术做到极致，并积极探索下一代的预训练技术。

工作职责：
1. 预训练数据：大规模预训练数据合成技术探索、STEM & reasoning 优化、长尾知识优化、精品数据挖掘过滤、自然数据 scaling、长文本优化、面向 test-time scaling 的数据优化。
2. 预训练策略：新型预训练损失函数探索、遗忘对抗与持续学习、optimizer 优化、lr scheduler 优化、课程学习、scaling law 预测、超参优化。
3. 模型结构：新型模型结构探索、模型可解释性、MoE 优化、参数扩展与裁剪蒸馏、线性注意力、动态稀疏注意力、draft model 优化、动态计算优化、KV cache压缩、长序列优化、decoding 加速等。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

大模型+

还有更多 •••

登录查看完整学习资料

相关职位

通义实验室-大模型数据处理与优化算法工程师-通义千问

社招3年以上技术类-算法

建设 AGI 最重要的原料就是数据，数据的规模和质量都对模型效果起到至关重要的作用。我们极其重视数据的 scaling，包括但不限于自然语言、代码、多模态等数据的 scaling。我们正在寻找一位适应快速变化、热衷解决大规模数据挑战的算法工程师，专注于大模型预训练中的数据收集、处理与优化。你将面对百亿至千亿级别的数据规模，设计高效的数据处理管线，与纯文本和多模态预训练团队深度协作，持续提升数据质量和模型性能。工作职责： 1. 需求对接与迭代：快速理解模型预训练需求，灵活调整数据方案以适应高频迭代。 2. 数据处理与优化：开发工具完成数据收集、清洗、格式转换（如HTML2Text、PDF2Text、ASR等），构建验证与测试集以量化性能指标，优化流程以应对超大规模数据挑战。 3. 管线搭建与扩展：构建自动化、高效率的数据处理管线，优化组件性能，确保稳定性和可扩展性。 4. 协助数据平台建设：与平台团队合作共建数据平台，分析使用痛点，提出建议意见以改进易用性，并跟进落实。 5. 技术支持与创新：追踪业界技术进展，为预训练团队提供数据支持，探索新技术以提升数据价值和模型效果。

更新于 2025-09-16北京|杭州

通义实验室-大模型Post-training算法工程师-通义千问

社招1年以上技术类-算法

在蕴含丰富世界知识的预训练模型的基础上，我们利用 Post-train 打造出我们想要的能够服务人类的 AI 模型。我们通过 RL、SFT、RFT 等技术，探索大模型潜能的同时，也在塑造大模型的能力与性格。本着为人类服务的目标，我们的 Post-train 将会重点探索其推理能力，实现深度思考，并致力于提升其 Agent 能力，让大模型服务于真实世界的任务。工作职责： 1. 探索更多可 scalable 的 verifier 信号，并通过 RL 提升模型的各项能力。 2. 提升 reward model 在创作、人类偏好、指令遵循等各专项上的能力，减少reward hacking和bias。 3. 研究 reasoning path压缩和外推，实现更高质量的推理思考。 4. 将LLM的推理能力和Agent以及其他模态相结合，探索统一模态的reasoning。

更新于 2025-06-05北京|杭州|上海

通义实验室-大模型Post-training算法工程师-通义千问

社招1年以上技术类-算法

更新于 2025-11-25北京|杭州|上海

通义实验室-大模型Post-training算法工程师-通义千问

社招1年以上技术类-算法

更新于 2025-11-28北京|杭州|上海