logo of alibaba

阿里巴巴1688-大模型Agent算法专家-杭州

社招全职1年以上地点:杭州状态:招聘

任职要求


1. 计算机、人工智能或数学相关专业科班生,硕士及以上,有扎实的计算机知识和LLM功底,熟悉搜索技术栈。

2. 掌握Qwen/DeepSeek等LLM post-training训练方法,以及PPO/GRPO等RL算法原理,有RLVR/AgenticRL等实操落地经验。

3. 熟悉DeepResearch/Manus/Claude Code等Agent产品技术架构,有研发Agentic系统和模型的成功经验。

4. 加分项:有AI领域顶会paper和知名竞赛top名次,有深度参与过AI Native产品研发,擅长Vibe Coding。

工作职责


1. 负责AI搜推助手类创新产品的技术落地,从业务问题抽象到LLM全链路研发,持续提升用户体验与业务指标。

2. 负责通过强化学习,提升LLM对超长上下文建模和多步骤工具调用能力,实现新一代高精度用户模拟器。

3. 负责通过DeepResearch技术,实现从店铺分析-智能选品-下游效果提升的全自动电商开店Agent。

4. 持续关注AI技术的发展趋势,负责LLM的前沿技术探索,进行紧贴业务的技术创新。
包括英文材料
大模型+
算法+
强化学习+
AI agent+
系统设计+
相关职位

logo of antgroup
社招8年以上技术类-算法

1. 在金融信贷、营销、催收场景下,负责AI-Agent算法架构设计、核心Agent的研发工作。 2、负责大语言模型的后训练与高效学习,应用指令遵循、强化学习、持续学习等,优化对话机器人的响应质量和转化效率 3. 运用大模型、AI-Agent、多模态、声纹和传统机器学习等算法能力,解决生成式AI在金融领域的关键算法问题,深入研究并解决大模型后训练中的效率瓶颈与收敛性问题,提升模型的逻辑、推理、生成能力。 4. 紧跟大模型前沿技术的发展趋势,学习、探索,并落地于业务场景,加速算法迭代,全面提升业务效率。

更新于 2025-10-13
logo of quark
社招2年以上技术类-算法

支持通用ai agent在夸克业务应用中的落地研发和效果优化,包括但不限于通用ai agent,深入理解大模型和通用ai agent运行原理,明确提升通用ai agent效果的核心技术方向。 负责ai agent的框架构建,agent与工具调用的优化,相关场景下大模型的优化,将ai agent框架、工具、大模型有效结合,为通用ai agent效果提供最佳的使用体验。 跟进行业通用ai agent和大模型前沿技术进展,结合公司业务需求进行技术创新和业务优化,保持公司在通用ai agent应用领域的技术领先性。

更新于 2025-10-09
logo of antgroup
社招3年以上技术类-算法

1、核心算法研发:主导Agentic RL及多智能体(Multi-Agent)算法的研发,融合大模型和多模态(LLM/VLM)的推理能力。 2、训练框架优化:负责RL训练框架的性能调优与迭代,提升大规模训练效率。 3、智能体构建与落地:构建面向真实场景的智能体,包括但不限于GUI Agent、代码Agent、根因分析(RCA)Agent等,驱动业务创新。

更新于 2025-07-28
logo of alibaba
社招3年以上

1、全面跟进当前生成式模型及AI领域的能力边界,面向淘天集团复杂工程体系及海量数据建设智能化研发AI能力 2、主导基于大模型的AI Agent全生命周期研发,包括通用型及垂直领域AI Agent的架构设计、模型训练与评测; 3、运用知识图谱抽取、数据合成等方案,基于实际场景设计并持续优化领域知识语料,以及数据标注方法,优化机模型运料; 4、运用SFT、RL等Post-training训练方法,提升大模型在自主规划(Planning)、多步推理、RAG增强生成、工具调用、数据问答、文案生成等方面的能力; 5、持续优化Agent算法与系统架构,构建端到端的智能体评测体系,开发自动化评估工具与多维评价指标,提升Agent系统性能与效率,打造业内领先的AI Agent技术方案。

更新于 2025-09-09