蚂蚁金服【转正实习】大模型智能体优化算法
任职要求
基础条件 1.计算机、数学、统计学等相关专业优先; 2.有顶会论文(ACL/ EMNLP/ ICLR/ NeurIPS/ ICML / CVPR/ ICCV/ ECCV等)/高影响项目/开源贡献者加分。 专业能力 1.模型理解与优化:深入理解Transformer和主流LLM模型架构演进原理,对后训练算法有实操经验和深刻认知,拥有Agentic RL训练实操经验者优先; 2.Agent 与系统编排:能做任务拆解与多Agent协作;熟悉RAG、Memory、Tool-Use(含MCP/类协议/Skills等)并能工程化落地;独立开发过具备一定影响力AI应用者优先; 3.数据构建:具备Data-centric AI意识,精通后训练所需高质量数据挖掘与构造,具备合成数据(Synthetic Data)与动作轨迹(Trajectory)构建实践经验者优先; 4.评测与交付:能搭建评估闭环(autorater/LLM-as-judge、离线评测、A/B)…
工作职责
将大模型能力做成可上线、可迭代、可控成本的产品能力。通过打造数据飞轮、模型适配与后训练、评测与实验等关键手段,实现端到端的闭环交付,持续提升产品的效果与稳定性。 具体职责包括以下相关方向的一项或多项:包括语言大模型(LLM)应用后训练与智能体优化、多模态大模型(VLM/MLLM)应用后训练与智能体优化,以及图像、视频、语音、文档等场景下的 AIGC 能力构建与生成效果优化。 需求与问题定义 深入业务与产品共创需求,深入业务与产品共创需求,将文本、图像、视频、语音、文档等场景诉求转化为可执行的 AI 任务定义,明确目标、边界、优先级与验收口径。 方案与应用架构 在Prompt、RAG、微调、Agent等路线间做技术选型与权衡,设计端到端应用架构(含上下文、工具调用、记忆、权限与安全),并完成RAG、Multimodal RAGMemory、Tool Use、多Agent等能力的工程化落地与生产级集成。 数据飞轮与治理 搭建高效的数据采集、清洗与标注工程流水线。前瞻性地探索合成数据与模型自标注等自循环策略,同时建立完善的数据版本追踪与质量评估体系,真正打通“模型训练-业务应用-用户反馈-数据迭代”的增强回路。 模型适配与后训练 主导基座大模型向顶尖垂直行业专家的后训练的全链路技术演进,包括高质量的SFT、RL阶段PPO、GRPO等前沿强化学习与偏好优化算法攻坚,全面突破模型在复杂业务场景下的指令遵循精度、极致可控性与长链路逻辑推理天花板,显著提升大模型在复杂业务场景下应用能力。 评测体系与实验 面向业务目标设计评测指标与Rubric,搭建自动化评测框架(含人工评审),建立离线基准与线上实验体系(A/B、Bandit),持续监控指标漂移与策略投机以防止效果退化。 生产交付与运营 负责系统集成与上线发布,对线上质量、稳定性与成本负责,建立监控、告警、兜底与人工接管机制,推动持续迭代。
1.研究大模型智能体和对话技术的基础核心能力,包括推理、规划、复杂指令遵循、知识注入、偏好对齐、拟人沟通等核心能力; 2.基于大模型,研发语音/对话交互场景各类智能体应用,支持智能客服、语音智能分析等项目,提升美团服务能力和效率; 3.深入理解智能体和对话交互相关业务场景,进行重点难点技术攻关工作,将技术优化与业务场景联系起来,快速解决业务痛点问题; 4.不断探索技术新领域,持续推动技术能力的沉淀和技术氛围的建设。
1. 参与AI Infra 基础设施平台或者面向金融、风控、营销、Web3、企业服务等AI应用场景的智能体(Agent)系统的设计、开发与优化; 2. 参与基于大语言模型(LLM)或多模态模型的智能体核心模块研发,包括但不限于任务规划、工具调用、记忆机制、对话管理、推理引擎等, 探索和实现智能体在复杂业务场景中的落地应用,如智能客服、自动化流程、决策辅助、数字员工等; 3. 参与AI Infra 平台系统架构设计和核心技术细节实现,帮助团队攻克各种技术难关,保障和提升平台稳定性; 4. 与算法、产品、数据及业务团队紧密协作,推动智能体系统的全链路端到端交付与迭代; 5. 跟踪前沿技术进展,通过AI Coding 持续提升系统智能化水平与工程效率。
面向核心业务场景,包括智能搜索、推荐、广告等,处理海量海量规模大数据,结合检索、排序、多模态理解和大模型能力,持续优化内容匹配效率、用户体验和业务价值。将参与召回、粗排、精排、重排到结果生成优化的完整链路建设,推动 AI 搜索、推荐、生成式AI、广告等能力在真实业务中的落地与迭代。 具体职责包括以下相关方向的一项或多项: 1. 参与核心业务场景,包括搜索、推荐、广告等场景的算法建设,优化召回、排序、重排及结果生成链路,提升业务效率、用户规模等核心指标; 2. 研究生成式推荐、Scaling up、Semantic id、AI Agent等前沿技术方向,解决核心场景业务增长问题; 3. 探索并应用大模型(LLM)、多模态学习、AIGC技术,进行智能创意生成、素材理解、创意元素优选及个性化创意组合优化,显著提升搜索、推荐、广告创意吸引力与点击效果; 4. 参与或负责基于大模型(LLM)的搜索、推荐、广告智能体(Agent)的研发,用于自动化策略调优、实时效果归因、智能异常监控、仿真模拟等场景,提升系统自动化决策与运营效率。
聚焦核心业务场景,利用Agent等前沿技术推动AI落地。你将参与从需求洞察到系统构建的全流程,通过研发智能应用与工具,提升业务效率与效果,实现技术驱动业务增长的完整闭环,推动智能规模化演进,实现技术价值转化。 具体职责包括以下相关方向的一项或多项: 1. 需求理解与归因。深入业务场景,利用数据挖掘与特征分析完成现象归因;精准识别高价值问题,将模糊的业务痛点转化为明确的 AI 解决目标。; 2. 架构设计。面向具体业务需求,设计 AI 原生系统架构;参与 Agent 系统核心模块的规划,包括记忆管理、推理策略与工具编排,兼顾架构的灵活性、可扩展性与工程可落地性; 3. 知识与环境构建。搭建AI与现有业务系统的交互环境,涵盖 API 接入、RAG 知识库构建、记忆方案设计;持续优化召回质量与上下文注入策略,为模型提供准确、及时的执行环境与知识支撑; 4. 核心能力实现。负责Agent关键模块的工程落地,实现意图识别、任务拆解与反思纠错闭环;封装标准化SDK/API服务,构建Agent观测体系,实现全链路追踪与多维归因分析; 5. 系统迭代与演进。建立搭建自动化评测与回测机制,通过调优与Case分析不断收敛效果与性能提升的最优路径;沉淀方法论与可复用组件,推动 AI 能力从单点验证走向规模化落地; 6. 性能优化。优化高并发场景下的系统性能,通过异步处理与降级策略保障稳定性,通过低侵入性观测手段保障系统的长期稳定运行。