logo of antgroup

蚂蚁金服蚂蚁集团-百灵语言模型-算法工程师(Deep Research方向)-北京/杭州

社招全职3年以上技术类-开发地点:北京 | 杭州状态:招聘

任职要求


1. 计算机、人工智能、自动化、数学或相关专业硕士及以上学历;
2. 扎实的机器学习深度学习基础,对强化学习算法理论有充分的了解。
3. 具备大模型与 RL 结合的实际项目经验,如preTrain 、SFT、RLHF、DPO 微调、智能体训练、模拟环境交互等;
4. 熟练掌握 PyTorch 等深度学习框架,熟悉常用大模型训练库;
5. 具备优秀的工程实现能力和问题拆解能力,能独立…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


我们正在寻找对大语言模型基模训练优化有浓厚兴趣和扎实经验的算法工程师,共同推动下一代智能体(Agent)和通用人工智能(AGI)技术的落地。

主要职责:
● 参与蚂蚁自研大语言模型各阶段训练,包括但不限于pretrain、SFT、 PPO、DPO、GRPO等
● 针语DeepResearch类任务的轨迹优化等问题对优化奖励建模、偏好学习及策略微调流程;
● 探索大模型在复杂任务中的自主推理、工具调用与长期规划能力,结合 RL 提升智能体决策水平;
● 与数据、工程、产品团队紧密协作,将算法成果高效集成到线上大模型服务中;
● 跟踪并复现国际顶级会议在 LLM 领域的最新进展。
包括英文材料
学历+
机器学习+
深度学习+
强化学习+
算法+
还有更多 •••
相关职位

logo of antgroup
社招3年以上技术类-算法

1、参与构建蚂蚁百灵系列大模型,包括但不限于百灵后训练、强化学习系统的算法框架、语料合成、训推优化、模型调优等; 2、参与大语言模型后训练及专项能力优化,提升模型的数学推理、代码生成、超长上下文精细化理解、行动力(Multi-turn& Multi-step Function Calling) 等核心能力; 3、参与高效大语言模型架构优化,设计新颖Sparse Attention、Linear Attention等,提升大模型训练与推理效率。

更新于 2025-12-23上海|杭州
logo of antgroup
社招3年以上技术类-开发

● 参与蚂蚁百灵系列大模型系统的构建,包括但不限于语言模型、强化学习系统的算法框架、语料合成、训推优化、模型调优等 ● 参与AI Coding、agentic、前端可视化等领域的语料合成、质量校验、reward 策略等开发工作,结合大模型自身能力评估,为其提供高质量、可验证的语料数据 ● 探索效果、数据驱动的模型优化方法,从问题出发,通过模型、数据、链路的优化,提升模型的端到端性能和效果表现。

更新于 2026-01-07杭州|成都
logo of antgroup
社招3年以上技术-开发

1. 参与构建蚂蚁百灵系列大模型系统的构建,包括但不限于语言模型、多模态模型、强化学习系统的算法框架、语料合成、训推优化、模型调优等 2. 参与推理、规划、数学、代码等领域的语料合成、求解器等开发工作,结合大模型自身能力评估,为其提供高质量、可验证的语料数据 3. 探索效果、数据驱动的模型优化方法,从问题出发,通过模型、数据、链路的优化,提升模型的端到端性能和效果表现。

更新于 2025-11-28上海|北京
logo of antgroup
校招蚂蚁星计划 -

我们负责蚂蚁集团内基础人工智能技术的研发与创新,致力于通用人工智能的实现。研究范围涵盖广泛,不仅包括语言大模型、多模态大模型等前沿的大模型技术,也深耕优化算法、知识图谱等基础AI方向。我们自主研发并开源了百灵大模型系列,旨在打造更高效、更通用的AI技术底座。我们积极推动开放协作的AI生态建设,通过技术共享、产学研合作等方式,促进人工智能技术的普惠发展,推动AI技术在各行各业的深度应用。 1. 负责研发大语言模型预训练技术,如高效的新型llm模型架构、长窗口训练技术、pretrain scaling law、高效预训练策略等。 2. 负责研发基于强化学习的推理模型,如大规模强化学习、新型RL算法、testing time scaling等。

北京|上海|杭州