logo of antgroup

蚂蚁金服蚂蚁集团-百灵语言模型-AI工程师(前端可视化方向)-成都/杭州

社招全职3年以上技术类-开发地点:杭州 | 成都状态:招聘

任职要求


1. 硕士及以上学历,计算机科学或相关专业背景
2. 具备扎实的算法工程实现能力,熟练掌握Python编程框架和PyTorch深度学习框架,熟悉DeepSpeed/Megatron等主流分布式训练框架
3. 具备良好的分析和问题解决能力、优秀的工程素养,能够独立思考和解决实际问题
4. 具备较强的团队合作能力和沟通能力,能够与…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


● 参与蚂蚁百灵系列大模型系统的构建,包括但不限于语言模型、强化学习系统的算法框架、语料合成、训推优化、模型调优等
● 参与AI Coding、agentic、前端可视化等领域的语料合成、质量校验、reward 策略等开发工作,结合大模型自身能力评估,为其提供高质量、可验证的语料数据
● 探索效果、数据驱动的模型优化方法,从问题出发,通过模型、数据、链路的优化,提升模型的端到端性能和效果表现。
包括英文材料
学历+
算法+
Python+
PyTorch+
深度学习+
DeepSpeed+
Megatron+
Kaggle+
还有更多 •••
相关职位

logo of antgroup
社招3年以上技术-基础平台

1. 对接蚂蚁所有业务线的深度学习任务,包含百灵大模型、搜广推业务等模型的性能优化;探索超大规模训练前言优化技术,涵盖文本和多模态场景。 2. 负责模型端到端性能优化,包含分布式并行策略、算子显存优化、跨机通信、数据预处理等模块优化,探索自动并行优化技术。 3. 负责蚂蚁深度学习智能训练服务的研发。 4. 蚂蚁端到端的在线/离线学习训练系统开发。 5. 参与蚂蚁新一代分布式深度学习编译器开发。 6. 参与蚂蚁开源深度学习系统DLRover开发建设。

更新于 2026-01-13北京|杭州|上海
logo of antgroup
校招蚂蚁星计划 -

我们负责蚂蚁集团内基础人工智能技术的研发与创新,致力于通用人工智能的实现。研究范围涵盖广泛,不仅包括语言大模型、多模态大模型等前沿的大模型技术,也深耕优化算法、知识图谱等基础AI方向。我们自主研发并开源了百灵大模型系列,旨在打造更高效、更通用的AI技术底座。我们积极推动开放协作的AI生态建设,通过技术共享、产学研合作等方式,促进人工智能技术的普惠发展,推动AI技术在各行各业的深度应用。 1. 负责研发大语言模型预训练技术,如高效的新型llm模型架构、长窗口训练技术、pretrain scaling law、高效预训练策略等。 2. 负责研发基于强化学习的推理模型,如大规模强化学习、新型RL算法、testing time scaling等。

北京|上海|杭州
logo of antgroup
校招蚂蚁星计划 -

蚂蚁集团 - 基础智能团队 我们团队主要负责蚂蚁集团的通用大模型研发工作。我们提供国内顶尖的算力资源,致力于建设基于大模型的AGI技术。我们期待同样以实现AGI为目标的您的加入,共同推动人工智能技术的发展。目前,我们正在进行: 多模态大模型研发: 研发高效的多模态预训练模型架构。探索和实现多模态融合技术,优化多模态模型的训练策略和推理效率。 1. 负责研发多模态大模型强化学习算法,提升百灵大模型在GUI场景的细粒度感知,以及规划、反思和决策的推理能力; 2. 负责研发奖励和评价模型,包括对GUI操控图片序列的过程监督和奖励建模,覆盖复杂推理、指令遵循等各种任务。

北京|上海|杭州
logo of antgroup
实习研究型实习生

研究领域: 人工智能 项目简介: 多模态长序列理解: 对多模态长序列理解能力的提升可以广泛应用在小时级长视频理解、多页长文档报告解读等场景,本项目主要探索提升多模态大模型对长序列的建模能力,构建多模态"大海捞针"benchmark, 并在多模态长序列理解任务如长视频理解、多页文档解析等任务上实现SOTA效果; 复杂视觉任务推理: 思维链在大语言模型已经取得了显著进展,但在多模态大模型中进展有限,制约了多模态模型在复杂推理任务中的表现,主要存在以下痛点:多模态复杂推理数据缺乏、视觉模块的感知局限性、缺乏成熟的多模态的推理scaling law方法。本研究重点推进基于RL的多模态推理Scaling law, 以提升百灵多模态大模型在复杂多模态推理任务上的业界的领先性。

北京|杭州