
得物【算法】Agent算法工程师/专家
任职要求
1、熟悉Agentic RL的方法,了解Agentic RL Infra(例如CodeRL,Reward System),熟悉模型的Post-Training训练技术,能针对特定模型能力问题进行SFT、RL训练优化; 2、精通Python的编程技能,并有构建生产应用程序的经验,具备在Linux开发环境下的开发能力,熟悉至少一种主流大模型应用框架(如LangGraph、LlamaIndex、OpenAI AgentsSDK、GoogleADK等); 3、对大模型和Agent有较深入的理解,熟悉常…
工作职责
1、负责Agent的设计与效果优化,通过Agent架构优化(工具、上下文管理、编排等)和模型优化(Agentic RL等具体任务的Post-Training),产出效果领先的Agent; 2、探索AgentArchitectures/Structures的上限,在Agent应用研究中最大程度释放模型的能力,研究Self-Evolving AI System,实现Self-Improving Agents; 3、设计和开发领先AI应用和解决方案原型,验证产品概念和需求,构建应用评估并优化Agent效果,为电商场景的AI应用提供领先的Agent解决方案。
团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 1、跟进AI Agent领域最新技术动态,围绕LLM大模型、Agent框架、LLM Reasoning技术(如思维链、多步推理)、优化复杂查询的Deep Research模式、长期记忆机制、自动化数据合成、指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术,持续推动算法创新与落地; 2、开展LLM Agent技术研发,构建端到端Agent系统,涵盖意图识别、知识检索、结果生成与偏好对齐,推动相关技术研究与算法落地,提升用户体验。
Accio是阿里巴巴国际数字商业集团阿里国际站内部孵化的一款战略级AI原生应用产品,也是全球首个B2B AI Search Agent,通过持续探索Agent、LLM、VLM、RL、Memory、Reasoning、AI Search等前沿技术,自研基座、Agent系统以及AI Search系统,实现全球B2B跨境贸易跨越式发展。 1、研发并优化 Agent 的核心能力模块,包括但不限于自主规划(Planning)、多步推理(Reasoning)、工具/skill调用(Tool Use)、长短期记忆(Memory)及 RAG 增强; 2、复杂任务动态编排:设计并实现高扩展性的Multi-Agent协作框架(如Agent Swarm/Agent Team),支持将模糊的宏观目标递归拆解为原子任务; 3、Long-horizon运行设计:构建结合"工作记忆+全局知识库"的多级存储系统,解决Agent长期运行中的信息遗忘问题,建立跨Agent的共享上下文能力,设计Agent持续进化框架; 4、构建端到端的Agent评测体系,构建生产力场景benchmark,推动Agent在business场景落地; 5、探索落地前沿Agent技术,包含而不限于:Agentic Model、Agentic Benchmark、Agentic RL、Pro-active Agent、Function Calling、Tool-Use、Multi-Step Reasoning、Agent Harness、Agentic Post-Training。

【岗位亮点】 打造现象级AI产品:你的算法将服务数亿用户,利用行业最丰富的地理数据,扩展语义理解与路线生成的边界。 前沿技术实践场:深度参与垂类多模态大模型的训练与优化,探索多模态Agent+地图理解的无限可能。 真实场景大挑战:面对MLLM在地图任务下语义和空间的双重挑战,构建行业标杆级模型。 【团队成就】 我们团队致力于构建下一代核心智能驾驶体验,在过去四年持续创造多个突破性创新产品技术。 智能出行开拓者:连续4年推出行业标杆产品,包括: 2022年 红绿灯倒计时黑科技 (拯救千万路怒症的神级操作) 2023年 V2X车车对话系统 (让汽车学会"社牛"沟通) 2024年 AI领航红绿灯 (比驾校教练更懂路的老司机) 2025年 TrafficVLM-Agent 上线 (高德地图“天眼”功能) 2025年 RouteVLM-Agent上线 (路线生成的无限可能) 【你将参与】 1. 用AI解锁出行新玩法:基于海量地图数据与用户场景,研发支持从“用户任意query”到一条“用户偏好&地理空间对齐的可行路线”的规划大模型。 2. 打造行业领先的大模型应用:SFT微调、强化学习等技术,让大模型真正理解复杂出行需求中的时空语义关系。 3. 定义未来出行方式:打造Agent自进化机制,不断提升出行场景的agent能力边界。 4. 顶会论文产出:共同探索工业落地与科技前沿。