logo of antgroup

蚂蚁金服蚂蚁集团-蚂蚁技术研究院-深度学习/大模型算法研究员

社招全职技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1、教育背景优秀,计算机相关专业博士毕业; 
2、有较好的计算机科学和算法基础,编程能力强,熟悉分布式训练框架; 
3. 有大模型、深度序列模型、深度生成模型、知识图谱、深度学习框架研发等相关技术经验者优先; 
4、产出需在论文、开源、比赛成绩、项目上满足1条或者多条;
	a、在诸如ICML/ICLR/NIPS、ACL、CVPR/ICCV/ECCV等相…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


蚂蚁集团是世界顶尖互联网金融科技公司。蚂蚁集团技术研究院致力于做有用、有想象力的科研,负责探索下一代技术前沿,帮助蚂蚁构建下一代技术发动机。
蚂蚁技术研究院深度学习实验,由在深度学习、大模型领域有广泛影响的学者领衔,致力于下一代高准确性、高效率AGI大模型研究和探索,实现世界级的技术创新和影响。团队成员深耕深度学习、大模型领域多年,多位成员具有上万的学术引用。
实验室技术氛围浓厚,适合有探索精神和挑战精神的青年才俊。在这里,你有充分的训练资源和数据资源,有专业的讨论和指导,有和世界领先高校和实验室交互的机会。在优质的成长环境中,可以让你快速成长。

职位描述:
	参与下一代AGI大模型的探索和研究,包括但不限于算法创新;技术创新论文的撰写;开源对外;国际会议技术影响交流等;
包括英文材料
算法+
大模型+
深度学习+
ICML+
还有更多 •••
相关职位

logo of antgroup
社招3年以上技术类-算法

强化学习是提升大模型推理能力的重要范式。大模型本身参数量大,训练资源消耗高,加上强化学习算法流程复杂,要开发灵活又高效的强化学习系统有诸多挑战,而大规模强化学习基础设施又是开展强化学习算法研究的基础,目前需要以下方向的研究: 1. 高效灵活的面向大模型的强化学习训练系统:能够支持各种强化学习复杂算法,同时支持大规模多卡高效率稳定训练。 2. 复杂强化学习算法在大规模计算下的并行化:强化学习算法普遍需要串行计算,对于规模化(scale up)大规模训练带来诸多挑战,而规模化又是推理能力提升的关键,因此需要研究在规模化前提下的强化学习算法。 在本岗位,你将参与或主导相关领域的研究,并产出有影响力的成果并赋能业务部门。

更新于 2025-06-18杭州
logo of antgroup
校招蚂蚁星计划 -

蚂蚁集团技术研究院致力于做有用、有想象力的科研,负责探索下一代前沿科技,帮助蚂蚁构建更具竞争力和可持续性的技术生态。 蚂蚁技术研究院数据智能实验室专注于通过下一代数据创新深化AGI前沿,这里汇聚了一群对人工智能充满热情的极客、科学家和工程师,核心成员累计学术引用量过万。 实验室拥有​​顶级资源支持​​包括但不限于海量高质量训练数据(万亿级Token,覆盖多领域、多模态);超大规模算力(万卡级GPU集群,支持分布式训练与高效调优);与全球顶尖AI团队(如DeepMind、OpenAI等)的深度合作机会等。 你将参与​: - 下一代AGI大模型研发     a. 探索更高效的训练架构     b. 突破现有模型的推理与泛化能力     c. 研究多模态、因果推理、强化学习等前沿方向 - 构建新数据范式     a. math/code数据饱和后的后训练时代数据     b. 合成数据,突破全球可用数据上限     c. 多模态数据,构建空间数据与跨模态任务的核心引擎 - 技术创新与开源     a. 撰写高质量技术论文,推动学术边界     b. 构建开源工具链,降低AGI研发门槛     c. 与全球开发者社区互动,分享你的成果

杭州
logo of antgroup
校招蚂蚁星计划 -

蚂蚁集团技术研究院致力于做有用、有想象力的科研,负责探索下一代技术前沿,帮助蚂蚁构建下一代技术发动机。 蚂蚁技术研究院深度学习实验,由在深度学习、大模型领域有广泛影响的学者领衔,致力于下一代高准确性、高效率AGI大模型的探索,实现世界级的技术创新和影响。团队成员深耕深度学习、大模型领域多年,目前多位成员具有上万的学术引用。 实验室技术氛围浓厚,适合有探索和挑战精神的青年才俊。在这里,你有充分的训练资源和数据资源,有专业的讨论和指导,有和世界领先团队交互的机会。在优质的成长环境中,可以让你快速成长。 你将参与下一代AGI大模型的探索和研究工作,包括但不限于算法创新;技术创新论文的撰写;开源对外等。

北京|上海|杭州
logo of antgroup
实习蚂蚁技术研究院长

职位描述: 参与大模型的前沿研究工作。你将与顶尖的研究团队合作,探索数据在大模型训练、优化和应用中的核心作用,推动大模型数据智能领域的创新。 研究内容: 1.研究和实践创新的数据生成策略,为模型打造高质量、高信息量的人类偏好数据集 2.迭代和优化 Critic Model,设计有引导性的评估规则,使其能够对模型输出进行自动化、高质量的打分 3.搭建和维护贯穿训练全过程的持续评估系统,实时监控模型的价值对齐、输出风格及其他关键性能指标,确保模型行为符合预期

北京|上海|杭州