蚂蚁金服【蚂蚁星】算法工程师-智能体规划协作
任职要求
1. 计算机科学、人工智能、自然语言处理、数据科学、机器学习等相关专业博士或优秀硕士。 2.尤其在强化学习,Multi-Agent,大模型等方向有深度研究者或相关项目经验优先; 3. 在国际顶级会议(如ACL、SIGIR、NeurIPS、AAAI、ICLR等)以第一作者发表论文者优先; 4. 强烈的技术热情,对AI搜索前沿技术有持续关注,拥有优秀的逻辑思维能力以及发现和解决问题的能力。
工作职责
机器智能部门介绍: 蚂蚁集团大安全事业群机器智能团队致力于打造安全科技的核心竞争力,做可信AI的持续引领者,为广大支付宝用户的数字化生活提供全方位安全保障。作为蚂蚁集团安全版图中的核心力量,我们正以最前沿的AI算法为刃、以大模型为盾,编织数字世界的"安全之网"。在这里,大模型、智能体、AI安全等热门的研究不再是纸上谈兵,每一个方向都在落地成为真实业务场景、十亿级用户的智慧防线。 关于团队,过去获得过浙江省科技进步一等奖、中国电子学会科技进步一等奖,人工智能学会吴文俊人工智能自然科学奖一等奖,中国图象图形学学会科技进步一等奖、多次获得中国计算机学会科技进步奖、世界人工智能大会SAIL之星与"镇馆之宝",等多个重量级奖项。可信AI专利布局全球第一,主导制定ITU国际风控标准。多名Kaggle Grandmaster ,拿过多个KDD Cup/CVPR/NeurIPS/ICCV/CVPR/ECCV等多个顶会竞赛冠军,累计发表近百篇顶会论文; 在这里,你将有机会和毕业于海内外著名高校的行业专家们、众多KDD Cup/CVPR 等比赛冠军、Kaggle Grandmaster 、顶会论文作者们共同根植蚂蚁丰富的场景数据,利用海量算力探索创新前沿算法应用,使用领先的机器学习算法解决风控业务问题,构建数据与知识驱动的智能风控体系,提升用户的支付安全体验。 加入我们,让我们一起为世界带来微小而美好的改变。 Deep Research方向,动态规划、灵活调用多类型工具,多智能体协作,AI自主完成通用的深度研究型的任务,提升事实核查能力
1.负责具身智能的核心算法研发,聚焦强化学习(RL)与模仿学习(IL)技术,推动智能体在复杂物理环境中的感知、决策与行动能力; 2.设计并实现基于强化学习的端到端训练框架,解决稀疏奖励、多任务学习、长周期规划等挑战性问题; 3.开发高效的模仿学习算法,结合人类示范数据与自主探索策略,提升智能体在真实场景中的泛化性与安全性; 4.针对机器人控制、多模态感知-动作闭环等场景,优化算法在计算效率、实时性与鲁棒性方面的表现; 5.与硬件、仿真团队紧密协作,推动算法在实体机器人或虚拟环境中的部署与验证。
1.负责具身智能的核心算法研发,聚焦强化学习(RL)与模仿学习(IL)技术,推动智能体在复杂物理环境中的感知、决策与行动能力; 2.设计并实现基于强化学习的端到端训练框架,解决稀疏奖励、多任务学习、长周期规划等挑战性问题; 3.开发高效的模仿学习算法,结合人类示范数据与自主探索策略,提升智能体在真实场景中的泛化性与安全性; 4.针对机器人控制、多模态感知-动作闭环等场景,优化算法在计算效率、实时性与鲁棒性方面的表现; 5.与硬件、仿真团队紧密协作,推动算法在实体机器人或虚拟环境中的部署与验证。
1.负责具身智能的核心算法研发,聚焦强化学习(RL)与模仿学习(IL)技术,推动智能体在复杂物理环境中的感知、决策与行动能力; 2.设计并实现基于强化学习的端到端训练框架,解决稀疏奖励、多任务学习、长周期规划等挑战性问题; 3.开发高效的模仿学习算法,结合人类示范数据与自主探索策略,提升智能体在真实场景中的泛化性与安全性; 4.针对机器人控制、多模态感知-动作闭环等场景,优化算法在计算效率、实时性与鲁棒性方面的表现; 5.与硬件、仿真团队紧密协作,推动算法在实体机器人或虚拟环境中的部署与验证。
AI的快速发展正在引领信息获取和知识搜索模式的革命性变化。各类智能信息助手正在迅速迭代,逐步向基于大语言模型的自然语言交互式知识获取方式转型。我们团队工作范围包括支付宝搜索、全网搜索、搜索智能体、大模型后训练及应用等。致力于应用前沿的人工智能技术,结合蚂蚁的生态特色,提升用户获取信息的效率和准确性,探索信息获取体验的新边界。 1. 参与和负责AI搜索场景下的核心搜索算法研发,持续提升Query理解、多模态理解、召回排序、RAG生成、智能体规划等环节的效果; 2. 支持多元业务需求的快速迭代,始终以优化用户体验与提升业务价值为目标; 3. 关注AI搜索技术前沿进展和业界先进应用,不断探索,持续创新突破核心技术。