蚂蚁金服蚂蚁集团-百灵语言模型-算法工程师(Deep Research方向)-北京/杭州
社招全职3年以上技术类-开发地点:北京 | 杭州状态:招聘
任职要求
1. 计算机、人工智能、自动化、数学或相关专业硕士及以上学历; 2. 扎实的机器学习与深度学习基础,对强化学习算法理论有充分的了解。 3. 具备大模型与 RL 结合的实际项目经验,如preTrain 、SFT、RLHF、DPO 微调、智能体训练、模拟环境交互等; 4. 熟练掌握 PyTorch 等深度学习框架,熟悉常用大模型训练库; 5. 具备优秀的工程实现能力和问题拆解能力,能独立…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
我们正在寻找对大语言模型基模训练优化有浓厚兴趣和扎实经验的算法工程师,共同推动下一代智能体(Agent)和通用人工智能(AGI)技术的落地。 主要职责: ● 参与蚂蚁自研大语言模型各阶段训练,包括但不限于pretrain、SFT、 PPO、DPO、GRPO等 ● 针语DeepResearch类任务的轨迹优化等问题对优化奖励建模、偏好学习及策略微调流程; ● 探索大模型在复杂任务中的自主推理、工具调用与长期规划能力,结合 RL 提升智能体决策水平; ● 与数据、工程、产品团队紧密协作,将算法成果高效集成到线上大模型服务中; ● 跟踪并复现国际顶级会议在 LLM 领域的最新进展。
包括英文材料
学历+
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
还有更多 •••
相关职位
社招3年以上技术类-算法
1、参与构建蚂蚁百灵系列大模型,包括但不限于百灵后训练、强化学习系统的算法框架、语料合成、训推优化、模型调优等; 2、参与大语言模型后训练及专项能力优化,提升模型的数学推理、代码生成、超长上下文精细化理解、行动力(Multi-turn& Multi-step Function Calling) 等核心能力; 3、参与高效大语言模型架构优化,设计新颖Sparse Attention、Linear Attention等,提升大模型训练与推理效率。
更新于 2025-12-23上海|杭州
社招3年以上技术类-开发
● 参与蚂蚁百灵系列大模型系统的构建,包括但不限于语言模型、强化学习系统的算法框架、语料合成、训推优化、模型调优等 ● 参与AI Coding、agentic、前端可视化等领域的语料合成、质量校验、reward 策略等开发工作,结合大模型自身能力评估,为其提供高质量、可验证的语料数据 ● 探索效果、数据驱动的模型优化方法,从问题出发,通过模型、数据、链路的优化,提升模型的端到端性能和效果表现。
更新于 2026-01-07杭州|成都
社招3年以上技术类-算法
1. 参与大模型(语言大模型、多模态)的预训练、微调与对齐技术研发,以及工具构建; 2. 探索大模型在垂直行业领域(金融/能源/医疗等)的高效适配与落地,推动模型能力与行业场景深度融合,支撑蚂蚁数字科技对外输出的大模型产品(如百灵大模型系列); 3. 协助构建高质量数据集(如对话、工具调用、文档解析),设计数据清洗与增强策略,以及工具构建; 4. 开发自动化评估工具,监控模型在准确性、安全性、公平性等维度的表现; 5. 跟踪大模型前沿进展(如MoE、长上下文、Agent框架),参与内部技术复现与验证; 6. 与产品、工程及行业解决方案团队紧密协作,将前沿算法能力转化为可交付、可复用的技术方案。
更新于 2026-01-29北京|上海|杭州