蚂蚁金服蚂蚁集团-百灵语言模型-AI工程师(前端可视化方向)-成都/杭州
任职要求
1. 硕士及以上学历,计算机科学或相关专业背景 2. 具备扎实的算法工程实现能力,熟练掌握Python编程框架和PyTorch等深度学习框架,熟悉DeepSpeed/Megatron等主流分布式训练框架 3. 具备良好的分析和问题解决能力、优秀的工程素养,能够独立思考和解决实际问题 4. 具备较强的团队合作能力和沟通能力,能够与…
工作职责
● 参与蚂蚁百灵系列大模型系统的构建,包括但不限于语言模型、强化学习系统的算法框架、语料合成、训推优化、模型调优等 ● 参与AI Coding、agentic、前端可视化等领域的语料合成、质量校验、reward 策略等开发工作,结合大模型自身能力评估,为其提供高质量、可验证的语料数据 ● 探索效果、数据驱动的模型优化方法,从问题出发,通过模型、数据、链路的优化,提升模型的端到端性能和效果表现。
1. 参与构建蚂蚁百灵系列大模型系统的构建,包括但不限于语言模型、多模态模型、强化学习系统的算法框架、语料合成、训推优化、模型调优等 2. 参与推理、规划、数学、代码等领域的语料合成、求解器等开发工作,结合大模型自身能力评估,为其提供高质量、可验证的语料数据 3. 探索效果、数据驱动的模型优化方法,从问题出发,通过模型、数据、链路的优化,提升模型的端到端性能和效果表现。
我们正在寻找对大语言模型基模训练优化有浓厚兴趣和扎实经验的算法工程师,共同推动下一代智能体(Agent)和通用人工智能(AGI)技术的落地。 主要职责: ● 参与蚂蚁自研大语言模型各阶段训练,包括但不限于pretrain、SFT、 PPO、DPO、GRPO等 ● 针语DeepResearch类任务的轨迹优化等问题对优化奖励建模、偏好学习及策略微调流程; ● 探索大模型在复杂任务中的自主推理、工具调用与长期规划能力,结合 RL 提升智能体决策水平; ● 与数据、工程、产品团队紧密协作,将算法成果高效集成到线上大模型服务中; ● 跟踪并复现国际顶级会议在 LLM 领域的最新进展。
1、参与构建蚂蚁百灵系列大模型,包括但不限于百灵后训练、强化学习系统的算法框架、语料合成、训推优化、模型调优等; 2、参与大语言模型后训练及专项能力优化,提升模型的数学推理、代码生成、超长上下文精细化理解、行动力(Multi-turn& Multi-step Function Calling) 等核心能力; 3、参与高效大语言模型架构优化,设计新颖Sparse Attention、Linear Attention等,提升大模型训练与推理效率。
我们负责蚂蚁集团内基础人工智能技术的研发与创新,致力于通用人工智能的实现。研究范围涵盖广泛,不仅包括语言大模型、多模态大模型等前沿的大模型技术,也深耕优化算法、知识图谱等基础AI方向。我们自主研发并开源了百灵大模型系列,旨在打造更高效、更通用的AI技术底座。我们积极推动开放协作的AI生态建设,通过技术共享、产学研合作等方式,促进人工智能技术的普惠发展,推动AI技术在各行各业的深度应用。 1. 负责研发大语言模型预训练技术,如高效的新型llm模型架构、长窗口训练技术、pretrain scaling law、高效预训练策略等。 2. 负责研发基于强化学习的推理模型,如大规模强化学习、新型RL算法、testing time scaling等。