logo of antgroup

蚂蚁金服【Plan A】算法工程师-Agentic Learning-灵光(实习)

实习兼职蚂蚁星- Plan A人才计划实习地点:杭州状态:招聘

任职要求


基础要求:
1.目前正在攻读计算机科学或相关STEM领域的学士,硕士或博士学位;
2.具有一种或多种通用编程语言的经验,包括但不限于: Java,C/C ++ 、PythonJavaScriptGo;
3.具有上述研究领域的相关经验,包括行业经验或作为参与实验室研究;
4.具有LLM、VLM、World Model等…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


部门介绍:
Agent团队致力于在解决大模型应用最后一公里的问题。通过训练模型在复杂、长程任务下的能力,提升AI产品的用户体验,构建训练的数据飞轮。
职位描述:
智能体进化是人工智能领域的重要研究方向,旨在通过持续学习和自我改进机制,使AI智能体能够在复杂环境中不断提升其决策能力和执行效率。基于开源的AWorld框架,探索智能体在多样化环境中的自我演进机制。同时,执行环境构建是智能体训练和部署的关键基础设施,直接影响智能体的学习效果和实际应用能力。AWorld也构建了完整的分布式训练环境,支持大规模智能体的并行训练和评估。
据此,本项目关注智能体和环境构建的双向强化机制的协同效应。智能体进化与环境构建之间存在相互促进的协同关系,形成了独特的双向强化机制:
1.智能体 to环境优化:智能体的学习需求驱动环境复杂度的提升;
2.环境 to智能体进化:丰富的环境提供更多学习机会和挑战;
3.协同效应实证:通过智能体和环境,研究和发现双向强化的可能性和理论基础。
据此,工作职责包括:
1.构建Agentic Learning的训练Infra,从cuda、megatron等底层,到RLRoll的策略,到训练目标的设计等等;需要全链路的人才加入;
2.构建Agent背景下的大模型评测新benchmark,做到基于评测驱动的大模型新迭代范式;
3. 大模型和产品结合,依托灵光等产品,创建产品和模型之间的数据飞轮,构建产学研的轮转迭代。
包括英文材料
学历+
Java+
C+
Python+
JavaScript+
还有更多 •••