logo of tongyi

通义通义实验室-大模型Post-training算法工程师-Qwen

社招全职1年以上技术类-算法地点:北京 | 杭州 | 上海状态:招聘

任职要求


1. 计算机、机器学习等方向相关专业,博士及硕士优先。
2. 具有 post-training 或强化学习相关方向经验。
3. 精通 Python 以及 Pytorch深度学习框架,具有较强的代码工程能力。

加分项:…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备跨语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从几百 M 到 T 级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen 正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。
在蕴含丰富世界知识的预训练模型的基础上,我们利用 Post-train 打造出我们想要的能够服务人类的 AI 模型。我们通过 RL、SFT、RFT 等技术,探索大模型潜能的同时,也在塑造大模型的能力与性格。本着为人类服务的目标,我们的 Post-train 将会重点探索其推理能力,实现深度思考,并致力于提升其 Agent 能力,让大模型服务于真实世界的任务。

工作职责:
1. 探索更多可 scalable 的 verifier 信号,并通过 RL 提升模型的各项能力。
2. 提升 reward model 在创作、人类偏好、指令遵循等各专项上的能力,减少reward hacking和bias。
3. 研究 reasoning path压缩和外推,实现更高质量的推理思考。
4. 将LLM的推理能力和Agent以及其他模态相结合,探索统一模态的reasoning。
包括英文材料
机器学习+
强化学习+
Python+
PyTorch+
深度学习+
大模型+
还有更多 •••
相关职位

logo of aligenie
社招1年以上技术类-算法

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备跨语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从几百 M 到 T 级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen 正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 在蕴含丰富世界知识的预训练模型的基础上,我们利用 Post-train 打造出我们想要的能够服务人类的 AI 模型。我们通过 RL、SFT、RFT 等技术,探索大模型潜能的同时,也在塑造大模型的能力与性格。本着为人类服务的目标,我们的 Post-train 将会重点探索其推理能力,实现深度思考,并致力于提升其 Agent 能力,让大模型服务于真实世界的任务。 工作职责: 1. 探索更多可 scalable 的 verifier 信号,并通过 RL 提升模型的各项能力。 2. 提升 reward model 在创作、人类偏好、指令遵循等各专项上的能力,减少reward hacking和bias。 3. 研究 reasoning path压缩和外推,实现更高质量的推理思考。 4. 将LLM的推理能力和Agent以及其他模态相结合,探索统一模态的reasoning。

更新于 2026-04-02北京|杭州|上海
logo of alibaba
社招3年以上技术类-算法

关于我们 我们是阿里巴巴国际数字商业集团-阿里巴巴国际站-Accio算法团队。阿里巴巴国际站是全球最大的跨境B2B数字化贸易平台。 我们团队一直追求极致的技术创新 (每年都有多篇顶会paper),从Bert到T5,多次推动业务跨越式发展。去年自研LLM完整技术栈,成功驱动生意助手大规模商业化落地。今年正在全力打造全球首个B2B AI Sourcing Agent,自研Agent框架和全新AI Search系统,目前已成功全球发布,迈向更广阔的未来。 职责描述: 1. 负责跨境电商垂直多语言多模态大模型的研发,包括SFT到RLHF的LLM全链路post-training技术建设。 2. 负责AI Native专项能力建设,包括但不限于NL2SQL, RAG System, Agent System, Function Call, Workflow Reasoning等。 3. 负责跨境电商AI创新业务落地,包括但不限于用最前沿的RAG/Agent技术,重构B2B Sourcing的全新交互体验。 4. 负责LLM的前沿技术探索,持续迭代自研模型能力,支撑AI Native产品落地。

更新于 2026-01-09杭州
logo of alibaba
社招1年以上技术类-算法

Accio是阿里巴巴国际数字商业集团阿里国际站内部孵化的一款战略级AI原生应用产品,也是全球首个B2B AI Search Agent,通过持续探索Agent、LLM、VLM、RL、Memory、Reasoning、AI Search等前沿技术,自研基座、Agent系统以及AI Search系统,实现全球B2B跨境贸易跨越式发展。 1、参与开发和优化新一代多模态原生AI搜索系统,包括但不限于多模态模型训练、跨模态生成与检索、生成式AI搜、多模态Agent等; 2、参与搜索引擎研发,全链路提升搜索效果,包括但不限于多模态理解、query分析、召回、相关性、排序等关键模块的算法设计与优化; 3、参与买家Agent全链路开发与优化,跟踪前沿多模态大模型技术,探索推动开源SOTA模型的产品化落地。

更新于 2026-04-07杭州
logo of alibaba
社招1年以上技术类-算法

我们是阿里巴巴国际数字商业集团-阿里巴巴国际站-Accio算法团队。阿里巴巴国际站是全球最大的跨境B2B数字化贸易平台。 1. 负责电商搜索场景的Agentic Pro Search/Deep Research等能力的开发实现,负责跨境电商垂直多语言多模态大模型的研发,包括SFT到Agent Reinforcement Learning的LLM全链路post-training技术建设。 2. 负责AI Native专项能力建设,包括但不限于 Agentic Reasoning, Agentic RAG System, Multi-Agent System等。 3. 负责跨境电商AI创新业务落地,包括但不限于用最前沿的Reasoning/Agentic RAG技术,重构B2BSourcing的全新交互体验。 4. 负责LLM的前沿技术探索,持续迭代自研模型能力,支撑AI Native产品落地。

更新于 2025-08-13杭州