蚂蚁金服蚂蚁集团-蚂蚁技术研究院-深度学习/大模型算法研究员
任职要求
1、教育背景优秀,计算机相关专业博士毕业; 2、有较好的计算机科学和算法基础,编程能力强,熟悉分布式训练框架; 3. 有大模型、深度序列模型、深度生成模型、知识图谱、深度学习框架研发等相关技术经验者优先; 4、产出需在论文、开源、比赛成绩、项目上满足1条或者多条; a、在诸如ICML/ICLR/NIPS、ACL、CVPR/ICCV/ECCV等相…
工作职责
蚂蚁集团是世界顶尖互联网金融科技公司。蚂蚁集团技术研究院致力于做有用、有想象力的科研,负责探索下一代技术前沿,帮助蚂蚁构建下一代技术发动机。 蚂蚁技术研究院深度学习实验,由在深度学习、大模型领域有广泛影响的学者领衔,致力于下一代高准确性、高效率AGI大模型研究和探索,实现世界级的技术创新和影响。团队成员深耕深度学习、大模型领域多年,多位成员具有上万的学术引用。 实验室技术氛围浓厚,适合有探索精神和挑战精神的青年才俊。在这里,你有充分的训练资源和数据资源,有专业的讨论和指导,有和世界领先高校和实验室交互的机会。在优质的成长环境中,可以让你快速成长。 职位描述: 参与下一代AGI大模型的探索和研究,包括但不限于算法创新;技术创新论文的撰写;开源对外;国际会议技术影响交流等;
强化学习是提升大模型推理能力的重要范式。大模型本身参数量大,训练资源消耗高,加上强化学习算法流程复杂,要开发灵活又高效的强化学习系统有诸多挑战,而大规模强化学习基础设施又是开展强化学习算法研究的基础,目前需要以下方向的研究: 1. 高效灵活的面向大模型的强化学习训练系统:能够支持各种强化学习复杂算法,同时支持大规模多卡高效率稳定训练。 2. 复杂强化学习算法在大规模计算下的并行化:强化学习算法普遍需要串行计算,对于规模化(scale up)大规模训练带来诸多挑战,而规模化又是推理能力提升的关键,因此需要研究在规模化前提下的强化学习算法。 在本岗位,你将参与或主导相关领域的研究,并产出有影响力的成果并赋能业务部门。
蚂蚁集团技术研究院致力于做有用、有想象力的科研,负责探索下一代前沿科技,帮助蚂蚁构建更具竞争力和可持续性的技术生态。 蚂蚁技术研究院数据智能实验室专注于通过下一代数据创新深化AGI前沿,这里汇聚了一群对人工智能充满热情的极客、科学家和工程师,核心成员累计学术引用量过万。 实验室拥有顶级资源支持包括但不限于海量高质量训练数据(万亿级Token,覆盖多领域、多模态);超大规模算力(万卡级GPU集群,支持分布式训练与高效调优);与全球顶尖AI团队(如DeepMind、OpenAI等)的深度合作机会等。 你将参与: - 下一代AGI大模型研发 a. 探索更高效的训练架构 b. 突破现有模型的推理与泛化能力 c. 研究多模态、因果推理、强化学习等前沿方向 - 构建新数据范式 a. math/code数据饱和后的后训练时代数据 b. 合成数据,突破全球可用数据上限 c. 多模态数据,构建空间数据与跨模态任务的核心引擎 - 技术创新与开源 a. 撰写高质量技术论文,推动学术边界 b. 构建开源工具链,降低AGI研发门槛 c. 与全球开发者社区互动,分享你的成果
蚂蚁集团技术研究院致力于做有用、有想象力的科研,负责探索下一代技术前沿,帮助蚂蚁构建下一代技术发动机。 蚂蚁技术研究院深度学习实验,由在深度学习、大模型领域有广泛影响的学者领衔,致力于下一代高准确性、高效率AGI大模型的探索,实现世界级的技术创新和影响。团队成员深耕深度学习、大模型领域多年,目前多位成员具有上万的学术引用。 实验室技术氛围浓厚,适合有探索和挑战精神的青年才俊。在这里,你有充分的训练资源和数据资源,有专业的讨论和指导,有和世界领先团队交互的机会。在优质的成长环境中,可以让你快速成长。 你将参与下一代AGI大模型的探索和研究工作,包括但不限于算法创新;技术创新论文的撰写;开源对外等。