网易人工智能算法研究员(强化学习方向)
任职要求
1. 决策智能技术相关方向有深入的研究工作,顶会顶刊论文发表者优先; 2. 热爱游戏,有深入的游戏经历,有游戏开发经验者优先; 3. 热爱人工智能,有扎实的深度学习、强化学习等知识,并对领域内的前沿技术保持着极大的热情; 4. 计算机或相关专业硕士以上学历,具有优秀的编码能力和丰富的开发调试经验; 5. 能熟练使用主流深度学习框架( tensorflow, pytorch等); 6. 专注、精益求精,具有出色的分析能力和强烈的解决问题的意愿。
工作职责
1. 接触到游戏界最前沿的AI技术问题,充分施展才能来挑战业界难题,在MMORPG、FPS、Sports、Battle Royale等类型的游戏中实现人工智能技术的落地,创造业务价值; 2. 深入研究决策智能、语言智能等方向的前沿课题,如:VLM/LLM Agent,World Model、RLHF等,研发新技术以应对未来业务挑战; 3. 从事游戏相关的深度学习、强化学习等算法框架研发工作,开发业内领先的工程框架。
你可以: 1. 接触到游戏界最前沿的AI技术问题,充分施展才能来挑战业界难题,在MMORPG、FPS、Sports、Battle Royale等丰富类型的游戏中实现人工智能技术的落地; 2. 从事游戏相关的深度学习、强化学习等算法框架研发工作,开发业内领先的工程框架; 3. 和研究员一同深入研究决策智能、语言智能等方向的前沿课题,如:World Model、RLHF、LLM Agent,并发表高质量的文章或撰写专利。
强化学习实验室聚焦强化学习技术,结合大模型泛化能力,研发开源开放的决策模型和强化学习训练系统,并应用于智能体,人机交互,具身智能等各种前沿方向。 参与蚂蚁自研强化学习推理模型的算法和训练系统研发。
1.参与具身智能算法模型在技能学习、动作规划、抓取操作等应用上的研发,实现多场景多任务的泛化; 2.设计、训练、部署模仿学习、强化学习、迁移学习、多模态学习等算法,构建机器人各类应用的通用技能; 3.与大模型、运控等团队合作,推动具身智能数据集、机器人平台等各项目落地实施; 4.紧跟最新技术进展,将学术界前沿创新内容进行快速复现并创新,参与相关方向的论文与专利积累。 【课题名称】 机器人具身智能算法研究 【课题内容】 追踪当下前沿机器人具身智能算法,复现并创新。
蚂蚁集团技术研究院致力于做有用、有想象力的科研,负责探索下一代前沿科技,帮助蚂蚁构建更具竞争力和可持续性的技术生态。 蚂蚁技术研究院数据智能实验室专注于通过下一代数据创新深化AGI前沿,这里汇聚了一群对人工智能充满热情的极客、科学家和工程师,核心成员累计学术引用量过万。 实验室拥有顶级资源支持包括但不限于海量高质量训练数据(万亿级Token,覆盖多领域、多模态);超大规模算力(万卡级GPU集群,支持分布式训练与高效调优);与全球顶尖AI团队(如DeepMind、OpenAI等)的深度合作机会等。 你将参与: - 下一代AGI大模型研发 a. 探索更高效的训练架构 b. 突破现有模型的推理与泛化能力 c. 研究多模态、因果推理、强化学习等前沿方向 - 构建新数据范式 a. math/code数据饱和后的后训练时代数据 b. 合成数据,突破全球可用数据上限 c. 多模态数据,构建空间数据与跨模态任务的核心引擎 - 技术创新与开源 a. 撰写高质量技术论文,推动学术边界 b. 构建开源工具链,降低AGI研发门槛 c. 与全球开发者社区互动,分享你的成果