logo of antgroup

蚂蚁金服蚂蚁集团-Agentic RL算法专家-杭州/北京

社招全职3年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1、教育背景优秀,计算机相关专业研究生;
2、有较好的计算机科学和算法基础,编程能力强;
3、有代码/自然语言/多模态大模型、深度序列/生成模型、时序分析等相关技术或者落地经验者优先;
4、产出需在论文、开源、比赛成绩、项目上满足1条或者多条;
 4a、算法研究背景在诸如ICML/ICLR/NIPS、ACL/EMNLP/KDD、CVPR/ICCV/ECCV等会议有相关论文发表者优先;
 4b、应用系统研究背景在诸如WWW、SIGMOD/VLDB、ICSE/ASE、ATC/OSDI/ASPLOS、MLSys等会议有相关论文发表者优先;
 4c、在顶会组织或者行业组织且有广泛影响的比赛KDDCup、Kuggle并取得前三好成绩者优先;
 4d、有开源项目影响力或者参与过开源项目者优先;
 4e、有作为主力推动或者参与的有较大影响的项目结果产出;
5、在大厂有相关实习或工作经历者优先;
6、较强的表达和沟通能力,工作认真、严谨、敬业。有很强的分析问题和解决问题的能力,有强烈的责任心和自驱力。

工作职责


1、核心算法研发:主导Agentic RL及多智能体(Multi-Agent)算法的研发,融合大模型和多模态(LLM/VLM)的推理能力。
2、训练框架优化:负责RL训练框架的性能调优与迭代,提升大规模训练效率。
3、智能体构建与落地:构建面向真实场景的智能体,包括但不限于GUI Agent、代码Agent、根因分析(RCA)Agent等,驱动业务创新。
包括英文材料
算法+
大模型+
ICML+
NeurIPS+
CVPR+
ICCV+
ECCV+
相关职位

logo of tongyi
社招3年以上技术类-算法

大模型开启了崭新的智能化时代,代码智能化将是智能化革命的核心力量。围绕AI Coding,从code model到coding copilot再到coding agent,我们进行了深入的技术建设,打造了国内最受欢迎的智能编码助手通义灵码,并不断探索新的产品形态,欢迎一起来做改变世界的代码智能技术,具体详见:https://tongyi.aliyun.com/lingma 职位描述: 1. 负责软件工程大模型(Agentic LLM for Software Engineering)的训练和研究等,包括但不限于Agentic RL、Reward Systems、Environment Scaling等。 2. 打造自主编码智能体的核心技术,包括但不限于Memory、Context Engineering、Tools-use、Reasoning等。 3. 将上述技术在通义灵码及其他创新产品中进行大规模应用落地。

更新于 2025-07-31
logo of tongyi
社招3年以上技术类-开发

我们正在寻找充满激情的大模型应用开发者,共同构建大模型应用新开发范式,积极推进大模型应用落地新范式,拥抱开源社区,探索前沿研究方向。 工作内容包括: 1. 探索超前沿大语言模型强化学习算法和Agentic应用范式。 2. 参与大模型应用开发平台架构设计,积极推进MCP等开源协议赋能企业级开发平台。 3. 构建大模型轻应用,推进大模型在金融/医疗/教育等核心场景落地和赋能。

更新于 2025-07-31
logo of quark
社招3年以上技术类-算法

通过强化学习提升万亿级参数大模型的决策认知能力,实现大模型在复杂环境下的多模态交互,完成多轮感知-决策闭环,在前沿实践中推动AGI落地; 研发新一代大模型强化学习算法,提升大模型在多模态、工具调用、复杂环境交互、多智能体交互等方向的基础能力; 改进大规模分布式强化学习框架,优化万卡集群下的高效分布式训练效率,支持大模型与复杂环境/工具的高效交互; 将强化学习研究成果融入夸克产品生态,打造更懂用户的智能服务产品, 让前沿技术惠及亿万用户。

更新于 2025-09-15
logo of alibaba
社招1年以上

1. 负责AI搜推助手类创新产品的技术落地,从业务问题抽象到LLM全链路研发,持续提升用户体验与业务指标。 2. 负责通过强化学习,提升LLM对超长上下文建模和多步骤工具调用能力,实现新一代高精度用户模拟器。 3. 负责通过DeepResearch技术,实现从店铺分析-智能选品-下游效果提升的全自动电商开店Agent。 4. 持续关注AI技术的发展趋势,负责LLM的前沿技术探索,进行紧贴业务的技术创新。

更新于 2025-08-21