通义大语言基础模型Agent System算法工程师
任职要求
1. 来自全球Top高校计算机科学、人工智能、机器学习、深度学习、软件工程,或相关领域应届毕业生,博士/硕士毕业生优先。 2. 有良好的学术调研能力,工程能力,逻辑和数据分析能力,热衷于Agentic AI,有 agent system 相关研发经验;具备扎实的代码功底,精通Python、C/C++等至少一门编程语言;熟悉强化学习算法和智能agent框架,具备跨领域应用的经验。 3. 对基础模型的前沿问题有持续热…
工作职责
通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 团队致力于优化Qwen基础大模型的Agent能力和构建完善的LLM智能系统,实现LLM对外界的准确感知、利用与反馈。Agent的工作包括从模型侧通过 SFT、RL等提升模型的基础agent能力,让模型和 agent框架有效结合;同时也包括agent system的设计与实现,致力于agentic AI真实落地。 1. 从事Qwen基础大模型的通用agent能力优化,包括但不限于tool use、RAG、planning、memory等能力的算法研发和优化;跟进业界agent benchmark,保持Qwen的agent行业领先水平。 2. 推进agentic AI的发展,包括但不限于多模态 agent、code agent、MCP、deep research 等场景的模型优化与产品落地。 3. 研发agent system,推动AI Agent在架构和性能上的持续优化。 4. 研究、实现和优化最新的强化学习(RL)算法,确保算法的性能和可扩展性。 5. 主导数据收集、环境建模及 agent 的评估与测试工作,确保模型的稳定性和有效性。
通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备跨语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从几百 M 到 T 级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen 正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 我们致力于优化 Qwen 基础大模型的 Agent 能力和构建完善的LLM智能系统,实现LLM对外界的准确感知、利用与反馈。Agent 的工作一方面包括从模型侧通过SFT、RL等提升模型的基础Agent能力,让我们的模型能和Agent框架有效结合;另一方面包括Agent System的设计与实现,致力于Agentic AI真实落地。 职位描述: 1. 从事Qwen基础大模型的通用 Agent 能力优化,包括但不限于Tool use、RAG、Planning、Memory等能力的算法研发和优化;跟进业界Agent Benchmark,保持Qwen的Agent行业领先水平。 2. 推进Agentic AI的发展,包括但不限于多模态 Agent、Code Agent、MCP、Deep Research等场景的模型优化与产品落地。 3. 研发Agent System,推动AI Agent在架构和性能上的持续优化。 4. 研究、实现和优化最新的强化学习(RL)算法,确保算法的性能和可扩展性。 5. 主导数据收集、环境建模及 Agent 的评估与测试工作,确保模型的稳定性和有效性。

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备跨语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从几百 M 到 T 级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen 正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 我们致力于优化 Qwen 基础大模型的 Agent 能力和构建完善的LLM智能系统,实现LLM对外界的准确感知、利用与反馈。Agent 的工作一方面包括从模型侧通过SFT、RL等提升模型的基础Agent能力,让我们的模型能和Agent框架有效结合;另一方面包括Agent System的设计与实现,致力于Agentic AI真实落地。 职位描述: 1. 从事Qwen基础大模型的通用 Agent 能力优化,包括但不限于Tool use、RAG、Planning、Memory等能力的算法研发和优化;跟进业界Agent Benchmark,保持Qwen的Agent行业领先水平。 2. 推进Agentic AI的发展,包括但不限于多模态 Agent、Code Agent、MCP、Deep Research等场景的模型优化与产品落地。 3. 研发Agent System,推动AI Agent在架构和性能上的持续优化。 4. 研究、实现和优化最新的强化学习(RL)算法,确保算法的性能和可扩展性。 5. 主导数据收集、环境建模及 Agent 的评估与测试工作,确保模型的稳定性和有效性。
团队介绍:1、业务方向:自助业务希望建成中小商家的业务中台,电商广告、生服广告、Dou+等多条业务线,一站式解决商家问题,助力商家成长,提升商家数字化经营能力; 2、技术亮点:自助技术分为智能销售、客户增长、营销活动几个方向; 客户增长方向主要利用Uplift建模、因果推断、运筹优化算法、推荐算法等,通过对客户初期的行为习惯进行挖掘,探索更优的发券、选品、选素材等相关策略,提升拉新指标; 智能销售方向主要通过LLM-Agent的形式,利用sft、rl等算法优化广告领域的服务能力,提升对中小客户的教育、辅导、服务等能力,进而提升长期客户消耗; 营销活动方向主要服务商业化运营团队,辅助运营完成营销活动的创建与推广。 课题背景: 为了长期优化广告客户生态以及收入增长,商业化需要更大规模的做好客户拉新和客户在投放成长初期的留存,那么如何精准定位目标人群、如何更有效的利用激励手段促进客户增长、如何优化当前客户动作和投放手段,就是一个必须要长期优化的方向。 现在的增长方向主要靠传统机器学习的手段来决策激励的发放,但效果提升已经遇到瓶颈,需要探索基于RL的因果推断技术。另一方面,客户成长初期目前无法获得足够的服务与帮助,结合上广告投放本身有较高学习门槛,所以现在亟需依赖LLM技术,实现智能销售的愿景——包括智能客服、智能销售、智能投手三个阶段,最终达到全智能化的托管式服务。 课题挑战: 相比抖音C端流量数据,广告客户数据相对波动较大,观测周期长,有更多的不确定性; 大语言模型在广告领域的能力依然不足,具体表现在领域知识理解不足,大量专业工具(百量级)的使用效率不高,业务回复的可解释性不够强。为了达到人工销售的水平,需要探索RL、探索reward system、探索deep research的实现、探索业务向Benchmark的范式等等; 相比传统客服的问答式工作,还需要探索LLM在主动服务方向的开放命题。
团队介绍:BandAI 团队致力于探索智能的极限在交易场景的可能性。团队研究方向涵盖LLM、Multimodal、Agent,在北京、上海设有实验室和岗位。加入我们,你可以享受与正式员工同等的资源,参与到前沿的大语言模型的研究课题,和优秀的研究员一起探索智能极限。探索抖音电商、生活服务的下一代产品和技术,通过技术变革为用户带来前所未有的体验。 课题介绍:探索抖音电商、生活服务、广告的下一代产品和技术,通过技术变革为用户带来前所未有的体验。在你热爱的课题方向上,探索大语言模型领域最具挑战的长期关键问题;探索 Agent 评估的新范式;探索 RL,更多的计算能力=更好的性能表现;探索如何拓展 Reward System 判断边界;研究&复现 Deep Research,Computer Using Agent,Useful Image Generation,Native Multimodality。