logo of tongyi

通义大语言基础模型 post-training 算法工程师

校招全职通义2026届秋季校园招聘地点:北京 | 杭州 | 上海状态:招聘

任职要求


1. 来自全球Top高校计算机科学、人工智能、机器学习深度学习、软件工程、相关领域应届毕业生,博士/硕士毕业生优先。
2. 在深度学习、大规模模型训练、优化算法、生成式模型、自监督学习等领域有扎实的理论基础和实践经验,并至少在其中一个方向有学术成果或项目经历。
3. 在国际顶级计算机会议/期刊(如NeurIPSICMLICLRACLTPAMI等)以一作身份发表论文,或在开源社区、计算机领域竞赛中有突出研究成果和项目经历。
4. 具有较强的代码工程能力,精通 Python 以及 Pytorch深度学习框架,熟悉LLM推理引擎(如vLLMSGLang)的实现。
5. 对基础模型的前沿问题有持续热情,具备独立思考能力和系统性研究思维,敢于挑战现有范式。能够独立应用技术解决复杂问题,主导或深度参与过有影响力项目的人选优先。
6. 具备跨学科视野与协作意识,能够与工程、产品等多学科团队紧密合作,推动研究成果快速落地并产生实际影响力。

工作职责


通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。

团队致力于在蕴含丰富世界知识的预训练模型的基础上,利用post-train技术打造出能够服务人类的AI模型。通过RL、SFT、RFT等技术,探索大模型潜能的同时,塑造大模型的能力与性格。重点探索大模型的推理能力,实现深度思考,并致力于提升其 agent 能力,让大模型服务于真实世界的任务。

工作职责:
1. 探索更多可Scalable的Verifier信号,并通过RL提升模型的各项能力。
2. 提升reward model在创作、人类偏好、指令遵循等各专项上的能力,减少reward hacking和bias。
3. 研究reasoning path压缩和外推,实现更高质量的推理思考。
4. 将LLM的推理能力和 agent以及其他模态相结合,探索统一模态的reasoning。
包括英文材料
OpenCV+
机器学习+
强化学习+
Python+
PyTorch+
深度学习+
大模型+
推理引擎+
vLLM+
SGLang+
NeurIPS+
ICML+
算法+
ACL+
TPAMI+
相关职位

logo of tongyi
社招2年以上技术类-算法

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备跨语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从几百 M 到 T 级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen 正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 视觉语言理解能力是Qwen最重要的能力之一,围绕 LLM 建设出具有视觉深度理解与推理能力的基座模型是团队的必经之路。结合视觉理解和推理能力的基础模型,将拓展到视频理解,GUI Agent,以及VLA 和机器人等场景中。团队负责:1)多模态基础模型的研发,包括融合视觉语言的跨模态理解模型设计,提升视觉基础模型在图像/视频中的视觉知识、空间感知、Omni Parsing等核心能力,并优化多模态大模型AI infra;2)探索多模态Agent和推理能力,构建支持网络世界(PC/Mobile/Web/游戏)交互的通用智能体;3)研究生成与理解统一的模型架构,实现跨模态生成与推理的协同优化。 工作职责 1. 多模态Pre-training:开展研究及进行实验。研究内容包括:数据清洗与筛选、数据配比优化、课程学习、视觉语言模型结构设计与优化、训练策略优化、预训练数据合成、scaling law预测、词表优化、模型蒸馏与压缩、长上下文能力优化等。 2. 多模态Post-training:迭代Post-training训练策略(SFT/RLHF),专项能力数据迭代,参与模型能力评测及评测数据和评估标准的迭代。 3. 多模态推理和通用Agent:通过强化学习(RL)持续提升多模态模型推理能力和执行任务能力,打造多模态的Test Scaling Laws,并推动模型对网络和虚拟世界的交互和任务完成能力。 4. 统一理解生成:构建视觉统一理解生成大模型,推进多模态统一生成与理解的推理和交互新范式。

更新于 2025-08-04
logo of tongyi
校招通义2026届秋

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备跨语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从几百 M 到 T 级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen 正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 团队致力于研发下一代大模型评估系统,从而实现让大模型更好地执行真实世界任务进而服务人类的目标。 工作职责: 1. 挖掘大模型弱点,持续快速构建覆盖各项模型能力的评测数据集,探索可靠、具有可扩展性的评测方案。 2. 参与LLM-as-a-Judge 方案构建,训练LLM Judge/Reward Model,建模人类偏好并提升长尾任务的评价准确性。 3. 参与Reward System 构建,设计Reward Signal、合成对应数据,并通过 RL 提升模型的能力上限。 4. 参与开发Evaluation、Reward System 所需工程框架,简化各类测试任务和模型集成流程,帮助提高团队效率。

更新于 2025-08-22
logo of tongyi
社招1年以上技术类-算法

模型评估的方法决定了我们训练什么样的大模型,构建AGI模型的第一步应当是思考我们如何评测模型。随着技术的快速发展,传统的评测逐渐不适应当前的模型能力,我们需要研发下一代大模型评估系统,从而实现让大模型更好地执行真实世界任务进而服务人类的目标。 工作职责: 1. 挖掘大模型弱点,持续快速构建覆盖各项模型能力的评测数据集,探索可靠、具有可扩展性的评测方案。 2. 参与 LLM-as-a-Judge 方案构建,训练 LLM Judge / Reward Model,建模人类偏好并提升长尾任务的评价准确性。 3. 参与 Reward System 构建,设计 Reward Signal、合成对应数据,并通过 RL提升模型的能力上限。 4. 参与开发 Evaluation、Reward System 所需工程框架,简化各类测试任务和模型集成流程,帮助提高团队效率。

更新于 2025-07-04
logo of bytedance
校招A179902

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、优化&创新RLHF算法训练效率与模型泛化能力; 2、Long CoT技术的实现和应用; 3、多模态大模型(文本、图像、语音)的Post training算法; 4、构建高质量、多领域的数据合成方法; 5、探索LLM在情感对话、创作等场景的应用; 6、优化Agent的任务规划与工具调用能力。

更新于 2025-08-06