蚂蚁金服【Plan A】AI工程师-Agent Infra-灵光(实习)
实习兼职蚂蚁星- Plan A人才计划实习地点:杭州状态:招聘
任职要求
1. 计算机科学、人工智能等相关专业硕士及以上学历,熟悉 Transformer 架构、Agen Mem系统及GRPO/PPO/DPO/SFT等算法; 2. 在分布式系统领域或者并行计算领域有研究和实践经…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
部门介绍: 蚂蚁AReaL会探索和构建高性能的 AI 自学习基础系统,让语言交互、智能体、具身智能等各类 AI场景都能基于这个基础系统走向高效的自我演进,迈向更高的智能水平。 职位描述: 1. 探索和研究新一代Agent Infra计算系统,寻求从训推并行到Agent Self-Evolution的系统创新,实现大规模多智能体交互场景下的极致Token Effiencicy; 2. 以“Agent+RL”范式构建新一代面向Agent Infra的强化学习框架,实现多轮交互、过程奖励、大规模模拟环境等,支持各类智能体和搜索场景学习能力提升; 3. 探索结合AI硬件下的Agent Runtime技术创新。
包括英文材料
学历+
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
SFT+
https://cameronrwolfe.substack.com/p/understanding-and-using-supervised
Understanding how SFT works from the idea to a working implementation...
还有更多 •••