得物【算法】Agent算法工程师/专家

社招全职技术类2026-02-04地点：上海状态：招聘

扫码手机上打开

任职要求

1、熟悉Agentic RL的方法，了解Agentic RL Infra（例如CodeRL，Reward System），熟悉模型的Post-Training训练技术，能针对特定模型能力问题进行SFT、RL训练优化；
2、精通Python的编程技能，并有构建生产应用程序的经验，具备在Linux开发环境下的开发能力，熟悉至少一种主流大模型应用框架（如LangGraph、LlamaIndex、OpenAI AgentsSDK、GoogleADK等）；
3、对大模型和Agent有较深入的理解，熟悉常…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、负责Agent的设计与效果优化，通过Agent架构优化（工具、上下文管理、编排等）和模型优化（Agentic RL等具体任务的Post-Training），产出效果领先的Agent；
2、探索AgentArchitectures/Structures的上限，在Agent应用研究中最大程度释放模型的能力，研究Self-Evolving AI System，实现Self-Improving Agents；
3、设计和开发领先AI应用和解决方案原型，验证产品概念和需求，构建应用评估并优化Agent效果，为电商场景的AI应用提供领先的Agent解决方案。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

SFT+

Python+

Linux+

大模型+

还有更多 •••

登录查看完整学习资料

相关职位

高德-AI Agent算法工程师/专家-生成式推荐/搜索方向-视觉团队

社招2年以上技术类-算法

团队介绍：作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM，AI Agent等核心技术，持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕，更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。作为高德地图的核心技术驱动部门，我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心，推动智能出行与真实世界连接的深度融合。团队gihub主页：https://github.com/amap-cvlab 为何加入我们？挑战世界级技术难题，追求智能上限用AI驱动国民级APP的产品迭代和颠覆式创新 1、跟进AI Agent领域最新技术动态，围绕LLM大模型、Agent框架、LLM Reasoning技术（如思维链、多步推理）、优化复杂查询的Deep Research模式、长期记忆机制、自动化数据合成、指令微调（Instruction Tuning）、偏好对齐（RLHF/DPO）等技术，持续推动算法创新与落地； 2、开展LLM Agent技术研发，构建端到端Agent系统，涵盖意图识别、知识检索、结果生成与偏好对齐，推动相关技术研究与算法落地，提升用户体验。

更新于 2026-03-26北京

阿里国际站/Alibaba.com-Agent算法工程师/专家-Accio-杭州

社招3年以上技术类-算法

Accio是阿里巴巴国际数字商业集团阿里国际站内部孵化的一款战略级AI原生应用产品，也是全球首个B2B AI Search Agent，通过持续探索Agent、LLM、VLM、RL、Memory、Reasoning、AI Search等前沿技术，自研基座、Agent系统以及AI Search系统，实现全球B2B跨境贸易跨越式发展。 1、研发并优化 Agent 的核心能力模块，包括但不限于自主规划（Planning）、多步推理（Reasoning）、工具/skill调用（Tool Use）、长短期记忆（Memory）及 RAG 增强； 2、复杂任务动态编排：设计并实现高扩展性的Multi-Agent协作框架（如Agent Swarm/Agent Team），支持将模糊的宏观目标递归拆解为原子任务； 3、Long-horizon运行设计：构建结合"工作记忆+全局知识库"的多级存储系统，解决Agent长期运行中的信息遗忘问题，建立跨Agent的共享上下文能力，设计Agent持续进化框架； 4、构建端到端的Agent评测体系，构建生产力场景benchmark，推动Agent在business场景落地； 5、探索落地前沿Agent技术，包含而不限于：Agentic Model、Agentic Benchmark、Agentic RL、Pro-active Agent、Function Calling、Tool-Use、Multi-Step Reasoning、Agent Harness、Agentic Post-Training。

更新于 2026-04-08杭州

高德-多模态Agent算法工程师/专家-路线生成方向

社招1年以上技术类-算法

【岗位亮点】打造现象级AI产品：你的算法将服务数亿用户，利用行业最丰富的地理数据，扩展语义理解与路线生成的边界。前沿技术实践场：深度参与垂类多模态大模型的训练与优化，探索多模态Agent+地图理解的无限可能。真实场景大挑战：面对MLLM在地图任务下语义和空间的双重挑战，构建行业标杆级模型。【团队成就】我们团队致力于构建下一代核心智能驾驶体验，在过去四年持续创造多个突破性创新产品技术。智能出行开拓者：连续4年推出行业标杆产品，包括： 2022年红绿灯倒计时黑科技 (拯救千万路怒症的神级操作) 2023年 V2X车车对话系统 (让汽车学会"社牛"沟通) 2024年 AI领航红绿灯 (比驾校教练更懂路的老司机) 2025年 TrafficVLM-Agent 上线 (高德地图“天眼”功能) 2025年 RouteVLM-Agent上线 (路线生成的无限可能) 【你将参与】 1. 用AI解锁出行新玩法：基于海量地图数据与用户场景，研发支持从“用户任意query”到一条“用户偏好&地理空间对齐的可行路线”的规划大模型。 2. 打造行业领先的大模型应用：SFT微调、强化学习等技术，让大模型真正理解复杂出行需求中的时空语义关系。 3. 定义未来出行方式：打造Agent自进化机制，不断提升出行场景的agent能力边界。 4. 顶会论文产出：共同探索工业落地与科技前沿。

更新于 2026-04-08北京

NLP&大模型算法工程师/专家

社招A70429A

1、负责生成式智能对话场景的算法研发，基于大模型技术建设智能化的对话机器人系统； 2、探索生成式Agent对话算法，包括大模型领域知识融入、对齐、逻辑推理和SFT等任务； 3、建设基于RAG框架的智能问答系统，优化文本&多模态理解、召回、相关性、问答生成等算法； 4、对长文本/海量文本进行深度分析、构建知识图谱，针对用户对话进行抽取事件、情感分析； 5、搭建和优化检索排序、在线生成系统，提供稳定的线上服务。

更新于 2024-08-07北京