logo of antgroup

蚂蚁金服【Plan A】算法工程师-代办型Agent工程师-灵光(实习)

实习兼职蚂蚁星- Plan A人才计划实习地点:上海状态:招聘

任职要求


1.深入理解Transformer大模型原理,熟练掌握Python;
2.Agent实战经验:独立实现过Agent架构,理解长期记忆、工具调用准确率、多步规划等核心挑战。踩过Agent的坑——比如工具调用串了、记忆召回了一堆无关的、规划到第三步就崩了;
3.模型后处理能力:熟悉采样策略、结果校验等幻觉缓解手段,精通Prompt Engineering。熟悉数据处理、SFT/RL技术。理解GRPO及各种变种等核心概念,熟悉RL全链路,熟练使用Slime、OpenRLHF、verl等框架。知道R…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


部门介绍:
灵光APP是一款原生多模态的AGI助手,团队致力于构建有竞争力的AGI产品体验。算法团队以用户体验为牵引,为灵光助手构建后训练体系和模型。驱动灵光在智能体验上保持业界领先。
职位描述:
1.可训练+连续性+协作:怎么让AI受用户的控制、持续稳定的受用户的控制,怎么去代用户接物待人,按照用户的意愿处理事情;
2.复杂工具管理:工具越来越多,怎么编排、怎么调用、怎么不串;
3.模型后训练:怎么让中小杯在特定场景可以逼近SOTA结果并提升SOTA覆盖不到的能力;
4.快速Demo开发:想法快速转化为可交互产品原型。原型先于文档,新模型发布=重访旧功能。

方向一:可训练+连续性+协作   
结合harness方案,实现用户反馈驱动的Agent进化。核心挑战:单轨迹偏好学习(用户只走一条路,构不成偏好对)、纠正泛化(一次纠正如何迁移到相关场景)、防误训练(区分随手说""不要""vs真正偏好)、跨场景偏好迁移。多个Agent替用户协商。
方向二:复杂工具管理
设计工具编排与调用架构,解决工具数量增长带来的挑战。核心挑战:工具路由准确率(百级工具如何精准召回)、调用链可靠性(多步调用如何不串)、工具冲突检测(多个工具如何协调)、工具使用可解释性(用户能理解Agent为什么选这个工具)。
方向三:模型后训练
用RL/SFT控制成本、提升SOTA覆盖不到的能力。核心挑战:用户中心对齐(对齐对象是""这个用户""而非""所有人"")、成本控制(何时用大模型何时用小模型)、能力补齐(SOTA做不到的怎么通过后训练补上)、在线学习(如何持续从用户反馈中学习)。
包括英文材料
Transformer+
大模型+
Python+
AI agent+
Prompt+
还有更多 •••