蚂蚁金服【转正实习】算法工程师-智能体
实习兼职蚂蚁集团2027届转正实习地点:北京 | 上海 | 杭州状态:招聘
任职要求
1. 计算机科学、人工智能等相关专业本科及以上学历; 2. 编程基础扎实,熟练掌握Python;对大模型(如Transformer)的基本原理有良好理解。 3. 对AI Agent、强化学习等技术领域有浓厚兴趣,具备优秀的逻辑分析能力和快速学习能力。 4. 积极关注并体验各类前沿AI应用,对大模型的能力边界有自己的思考和见解。 【…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. Agent核心算法研发:负责AI智能体(Agent)核心算法的设计与实现,包括任务规划、记忆管理、工具调用等模块,并探索强化学习(RL)在其中的应用。 2. 模型优化与对齐:应用SFT、RLHF等对齐技术,负责模型输出的逻辑校验与“幻觉”缓解,提升Agent决策的准确性与可靠性。 3. 性能与推理优化:研究并应用量化、并行计算等技术,优化大模型推理效率,提升Agent的响应速度与运行性能。 4. 框架开发与原型验证:参与Agent框架的开发、测试与迭代,并快速将前沿算法思想转化为可交互的产品原型。 5. 大模型和产品结合:创建产品和模型训练之间的数据飞轮,构建产学研的轮转迭代。 6. 基于执行反馈的学习算法研发:使AI系统能够从实践中学习并生成更有效的训练算法,深入理解奖励函数设计、探索-利用平衡以及如何避免多样性崩溃等关键问题。
包括英文材料
学历+
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
AI agent+
https://www.ibm.com/think/ai-agents
Your one-stop resource for gaining in-depth knowledge and hands-on applications of AI agents.
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
还有更多 •••
相关职位
实习核心本地商业-基
1.研究大模型智能体和对话技术的基础核心能力,包括推理、规划、复杂指令遵循、知识注入、偏好对齐、拟人沟通等核心能力; 2.基于大模型,研发语音/对话交互场景各类智能体应用,支持智能客服、语音智能分析等项目,提升美团服务能力和效率; 3.深入理解智能体和对话交互相关业务场景,进行重点难点技术攻关工作,将技术优化与业务场景联系起来,快速解决业务痛点问题; 4.不断探索技术新领域,持续推动技术能力的沉淀和技术氛围的建设。
更新于 2025-02-26北京|上海
实习自动车配送部
本岗位以提升效率和体验为目标,结合配送大数据平台,以运筹优化和机器学习为主要技术手段,构建自动化、智能化的即时配送系统为基本愿景的算法研发岗位。内容包括: 1.通过运筹优化策略,优化订单分配、路径规划,服务美团多个即时配送/实时调度业务场景; 2.深入研究供需均衡、合理订单结构、最优定价策略等,不断提升配送业务的经营效率,降低运营成本; 3.结合深度学习、强化学习等,进行运筹优化技术的持续创新。
更新于 2025-02-26北京
实习蚂蚁集团2027
1. 参与AI Infra 基础设施平台或者面向金融、风控、营销、Web3、企业服务等AI应用场景的智能体(Agent)系统的设计、开发与优化; 2. 参与基于大语言模型(LLM)或多模态模型的智能体核心模块研发,包括但不限于任务规划、工具调用、记忆机制、对话管理、推理引擎等, 探索和实现智能体在复杂业务场景中的落地应用,如智能客服、自动化流程、决策辅助、数字员工等; 3. 参与AI Infra 平台系统架构设计和核心技术细节实现,帮助团队攻克各种技术难关,保障和提升平台稳定性; 4. 与算法、产品、数据及业务团队紧密协作,推动智能体系统的全链路端到端交付与迭代; 5. 跟踪前沿技术进展,通过AI Coding 持续提升系统智能化水平与工程效率。
北京|上海|杭州