阿里巴巴1688-大模型(Agentic AI)算法工程师-杭州
任职要求
1、具备LLM/RL/Reasoning/Agent相关背景知识,熟悉主流大模型算法架构,了解alignment常见方法,包括但不限于…
工作职责
1、Agent业务相关垂直领域模型agent数据合成/后训练; 2、后训练的AI Agent通用能力(如tool use, planning等)增强,增强工具链路调用、知识图谱推理、report生成能力; 3、参与AI Agent产品的需求分析、技术选型、方案设计、用户体验提升等,发现算法提升对于AI Agent落地的价值,参与下一代AI agent产品打造;
1. 负责淘天集团自营业务的供应链管理(供应链计划、物流执行),通过机器学习、深度学习、强化学习、运筹学算法以及大模型(LLM)等AI技术,提供供应链管理和库存效率,降低物流成本,提升消费者履约时效体验; 2. 围绕供应链和物流业务场景,紧跟学术界/工业界前沿进展,持续完成算法迭代和创新(预测算法、决策算法、端到端数据驱动优化算法),完成创新成果落地和业务价值转化的同时,构建技术壁垒,打造算法团队品牌形象和世界级影响力; 3. 持续跟踪大模型(LLM)、多模态、Agentic AI算法、模型微调与规则对齐等前沿AI技术,并推动其在供应链领域的创新应用与业务价值转化。
- 构建并完善大模型评测体系,包括评测标准制定,评测工具链开发和评测数据集建设; - 基于agentic业务需求设计评测方案,开展多维度模型评估,输出专业评测报告; - 参与Agent /工具调用 在垂直领域的算法工程化实现及性能评估研究; - 沉淀业务专家知识到 reward/critic 层面实现LLM-as-judge,沉淀长链数据资产;
1. 行业垂直大模型训练与优化:负责针对特定行业进行垂直大模型的端到端训练与精调,深度挖掘行业数据价值,构建具备专业知识壁垒的AI核心能力。 2. 前沿技术探索与落地: 跟踪大语言模型、多模态及强化学习等前沿算法,并将其创造性地应用于钉钉的核心业务场景(如行业解决方案、商业化产品等),负责从技术到产品的全链路落地,持续推动AGI在真实世界中的价值实现。 3. AI原生应用构建: 依托钉钉强大的AI平台与自研的垂直大模型,主导构建AI原生应用。重点方向包括但不限于:高级认知搜索、可自主执行任务的智能体 (Agentic AI)、以及深度内容洞察与生成工具,打造具有核心用户价值和行业影响力的产品。 4. 智能化场景创新: 探索大语言模型、多模态及扩散模型等技术,在搜索、推荐、广告等场景的创新应用,设计并实现新一代智能化解决方案,提升用户体验与商业效率。
通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 团队致力于优化Qwen基础大模型的Agent能力和构建完善的LLM智能系统,实现LLM对外界的准确感知、利用与反馈。Agent的工作包括从模型侧通过 SFT、RL等提升模型的基础agent能力,让模型和 agent框架有效结合;同时也包括agent system的设计与实现,致力于agentic AI真实落地。 1. 从事Qwen基础大模型的通用agent能力优化,包括但不限于tool use、RAG、planning、memory等能力的算法研发和优化;跟进业界agent benchmark,保持Qwen的agent行业领先水平。 2. 推进agentic AI的发展,包括但不限于多模态 agent、code agent、MCP、deep research 等场景的模型优化与产品落地。 3. 研发agent system,推动AI Agent在架构和性能上的持续优化。 4. 研究、实现和优化最新的强化学习(RL)算法,确保算法的性能和可扩展性。 5. 主导数据收集、环境建模及 agent 的评估与测试工作,确保模型的稳定性和有效性。