蚂蚁金服蚂蚁集团-Agent应用算法工程师-杭州/上海
任职要求
1. 有多智能体协同训练行业或者研究经验;
2. 有强化学习经验者优先;
3. 熟悉LLM相关技术,有性能优化…工作职责
1. 提升智能体(模型)在基础智能、专业生产力、自我演进、协同组织等不通维度的智能 2. 搭建基于多智能体的技术产品,实现分布式智能体部署和训练框架,参与开源社区建设 3. 框架和模型配合产品,满足用户真实需求,设计并实现多智能体协作系统
1. 负责百炼Agent应用层infra对接阿里云的建设,包括AgentScope运行时以及工具沙箱和阿里云云资源和云服务的对接、Agent部署、和算法适配。 2. 负责百炼Agent在阿里云和企业场景效果的调优。 3. 从阿里云数据源开始,为Agent服务的Data Connector体系的设计和建设。 4. 形成系统的Agent评测体系,沉淀为Reward Model.

作为大模型算法工程师(应届生),您将加入哈啰出行AI团队,参与出行领域大模型算法应用研发,通过构建智能Agent系统优化业务全流程。直接参与亿级用户规模的AI项目,用技术推动出行变革。 1.大模型研发与优化:参与出行领域大模型(如LLM、多模态模型)的微调与优化,针对业务场景(如需求预测、路径规划、客服交互)进行模型适配。 探索轻量化模型部署方案,平衡性能与资源消耗,适配移动端及边缘计算场景。 2.Agent系统开发:协助开发智能Agent(如调度Agent、客服Agent、风控Agent),实现自动化任务处理与实时决策。参与设计多Agent协同框架,优化跨业务场景(如单车-打车联动、租车-保险推荐)的交互逻辑。 3.算法场景落地:深入理解两轮/四轮出行、租车等业务痛点,通过AI技术辅助提升运营效率(如动态定价、营销推荐、用户留存)。与产品、运营团队协作,将算法能力转化为可落地的功能模块。 4.技术创新与学习:跟踪AI领域前沿技术(如强化学习、联邦学习、生成式AI),参与技术预研项目。 在导师指导下完成从理论到实践的转化,提升技术落地能力。
1、设计与落地多轮多步数据合成流程(对话、计划、工具调用轨迹、偏好反馈等),构建高质量指令与偏好数据集。 2、组织 SFT + RL(如 DPO、RM+PPO/GRPO、RLHF/RLAIF)训练与离线评估,形成可复用训练/评测基座。 3、构建/优化 Agent 的 planning(planner、task decomposition、反思/复盘)与工具使用策略(tool selection、参数填充、错误恢复等)。 4、设计 memory 体系(短期/长期/检索记忆、用户画像)与个性化能力(偏好建模、上下文压缩、隐私保护)。 5、与产品/业务协同,将Agent能力在实际场景中落地并持续优化性能、成本与延迟。