蚂蚁金服蚂蚁集团-百灵语言模型-算法工程师(Deep Research方向)-北京/杭州

社招全职3年以上技术类-算法2026-07-08地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1. 计算机、人工智能、自动化、数学或相关专业硕士及以上学历；
2. 扎实的机器学习与深度学习基础，对强化学习算法理论有充分的了解。
3. 具备大模型与 RL 结合的实际项目经验，如preTrain 、SFT、RLHF、DPO 微调、智能体训练、模拟环境交互等；
4. 熟练掌握 PyTorch 等深度学习框架，熟悉常用大模型训练库；
5. 具备优秀的工程实现能力和问题拆解能力，能独立…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

我们正在寻找对大语言模型基模训练优化有浓厚兴趣和扎实经验的算法工程师，共同推动下一代智能体（Agent）和通用人工智能（AGI）技术的落地。

主要职责：
● 参与蚂蚁自研大语言模型各阶段训练，包括但不限于pretrain、SFT、 PPO、DPO、GRPO等
● 针语DeepResearch类任务的轨迹优化等问题对优化奖励建模、偏好学习及策略微调流程；
● 探索大模型在复杂任务中的自主推理、工具调用与长期规划能力，结合 RL 提升智能体决策水平；
● 与数据、工程、产品团队紧密协作，将算法成果高效集成到线上大模型服务中；
● 跟踪并复现国际顶级会议在 LLM 领域的最新进展。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

机器学习+

深度学习+

强化学习+

算法+

还有更多 •••

登录查看完整学习资料

相关职位

蚂蚁集团-百灵语言模型-AI工程师（前端可视化方向）-成都/杭州

社招3年以上技术类-开发

● 参与蚂蚁百灵系列大模型系统的构建，包括但不限于语言模型、强化学习系统的算法框架、语料合成、训推优化、模型调优等 ● 参与AI Coding、agentic、前端可视化等领域的语料合成、质量校验、reward 策略等开发工作，结合大模型自身能力评估，为其提供高质量、可验证的语料数据 ● 探索效果、数据驱动的模型优化方法，从问题出发，通过模型、数据、链路的优化，提升模型的端到端性能和效果表现。

更新于 2026-01-07杭州|成都

蚂蚁集团-大语言垂类模型训练行业专家-二级市场投研医药方向-北京【百灵专项】

社招3年以上技术-投研

1. 大模型评估与对齐：基于过往从业经验，定义金融垂直领域的模型测评体系，指导大模型训练在金融领域做到专业性、合规性、时效性，在真实环境中能解决实际问题； 2. 负责金融垂类领域训练数据构建：协助算法团队理解行业数据的结构与含义，确保数据集的质量、准确性和全面性，为模型的训练提供有价值的领域知识； 3. 行业趋势洞察和技术落地：及时跟进金融市场变化，为模型优化提供前瞻性建议，推动大模型能力真正落地到金融行业实际工作流中； 4. 跨部门协作：与模型训练团队、产品团队等其他团队紧密合作，确保模型设计和训练过程顺利推进。

更新于 2026-01-21北京

蚂蚁集团-大语言垂类模型训练行业专家-二级市场投研TMT方向-北京【百灵专项】

社招3年以上技术-投研

更新于 2026-01-28北京

CTO-百灵长期实习生

实习日常实习

1. 招聘支持：协助业务部门推进招聘流程落地执行，优化招聘素材，提升渠道产出效率； 2. 部门专项项目支持：协助支持人力资源类专项项目的落地与运营，包括但不限于新人运营、文化激励活动等；参与项目方案的前期策划、落地执行与效果跟踪，沉淀知识库和标准化流程； 3. 协助进行部门相关信息整理及数据分析工作。

更新于 2026-07-08杭州