蚂蚁金服【Plan A】算法工程师-代办型Agent工程师-灵光(实习)
实习兼职蚂蚁星- Plan A人才计划实习地点:上海状态:招聘
任职要求
1.深入理解Transformer、大模型原理,熟练掌握Python; 2.Agent实战经验:独立实现过Agent架构,理解长期记忆、工具调用准确率、多步规划等核心挑战。踩过Agent的坑——比如工具调用串了、记忆召回了一堆无关的、规划到第三步就崩了; 3.模型后处理能力:熟悉采样策略、结果校验等幻觉缓解手段,精通Prompt Engineering。熟悉数据处理、SFT/RL技术。理解GRPO及各种变种等核心概念,熟悉RL全链路,熟练使用Slime、OpenRLHF、verl等框架。知道R…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
部门介绍: 灵光APP是一款原生多模态的AGI助手,团队致力于构建有竞争力的AGI产品体验。算法团队以用户体验为牵引,为灵光助手构建后训练体系和模型。驱动灵光在智能体验上保持业界领先。 职位描述: 1.可训练+连续性+协作:怎么让AI受用户的控制、持续稳定的受用户的控制,怎么去代用户接物待人,按照用户的意愿处理事情; 2.复杂工具管理:工具越来越多,怎么编排、怎么调用、怎么不串; 3.模型后训练:怎么让中小杯在特定场景可以逼近SOTA结果并提升SOTA覆盖不到的能力; 4.快速Demo开发:想法快速转化为可交互产品原型。原型先于文档,新模型发布=重访旧功能。 方向一:可训练+连续性+协作 结合harness方案,实现用户反馈驱动的Agent进化。核心挑战:单轨迹偏好学习(用户只走一条路,构不成偏好对)、纠正泛化(一次纠正如何迁移到相关场景)、防误训练(区分随手说""不要""vs真正偏好)、跨场景偏好迁移。多个Agent替用户协商。 方向二:复杂工具管理 设计工具编排与调用架构,解决工具数量增长带来的挑战。核心挑战:工具路由准确率(百级工具如何精准召回)、调用链可靠性(多步调用如何不串)、工具冲突检测(多个工具如何协调)、工具使用可解释性(用户能理解Agent为什么选这个工具)。 方向三:模型后训练 用RL/SFT控制成本、提升SOTA覆盖不到的能力。核心挑战:用户中心对齐(对齐对象是""这个用户""而非""所有人"")、成本控制(何时用大模型何时用小模型)、能力补齐(SOTA做不到的怎么通过后训练补上)、在线学习(如何持续从用户反馈中学习)。
包括英文材料
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
AI agent+
https://www.ibm.com/think/ai-agents
Your one-stop resource for gaining in-depth knowledge and hands-on applications of AI agents.
Prompt+
https://cloud.google.com/vertex-ai/generative-ai/docs/learn/prompts/introduction-prompt-design
A prompt is a natural language request submitted to a language model to receive a response back.
https://learn.microsoft.com/en-us/azure/ai-foundry/openai/concepts/prompt-engineering
These techniques aren't recommended for reasoning models like gpt-5 and o-series models.
https://www.youtube.com/watch?v=LWiMwhDZ9as
Learn and master the fundamentals of Prompt Engineering and LLMs with this 5-HOUR Prompt Engineering Crash Course!
还有更多 •••