logo of antgroup

蚂蚁金服蚂蚁集团-AI基础系统研发专家-杭州/北京/上海

社招全职2年以上技术-开发地点:北京 | 上海 | 杭州状态:招聘

任职要求


1. 具有至少 2 年以上的AI系统/任务调度/高性能并行计算领域研发经验;
2. 熟悉 Transformer/MoE 等大模型结构原理、分布式调度系统、大模型训练/推理/Agent 系统、高性能软硬件架构等任一领域的专业知识;
3. 熟悉 sglangvllmmegatron 等训推框架和大规模训推优化、GRPO/PPO/DPO 等 RL 算法、AReaL/veRL/openRLHF 等强化学习框架的优先;
4. 较强的团队沟通和学习能力,对系统设计、编码和优化创新有高标准要求;

工作职责


蚂蚁ASystem会探索和构建高性能的 AI 自学习基础系统,让语言交互、智能体、具身智能等各类 AI 场景都能基于这个基础系统走向高效的自我演进,迈向更高的智能水平。
1. 研发新一代训推混合计算系统,优化训推分布式并行技术,实现大规模T级参数模型训练和 100X 性能提升;
2. 以“X+RL”范式建设新一代强化学习框架,实现多轮交互、过程奖励、大规模模拟环境等能力,支持各类智能体和搜索场景学习能力提升;
3. 结合软硬件优化分布式并行计算和调度系统,提升大模型在训推一体、长推理效率和弹性训练的能力,大幅降低智能计算成本;
包括英文材料
Transformer+
大模型+
AI agent+
vLLM+
Megatron+
算法+
强化学习+
系统设计+
SGLang+
相关职位

logo of antgroup
社招3年以上技术-开发

蚂蚁ASystem致力于打造下一代AI基础软件,并基于下一代的AI基础软件寻找通用智能的新方法,追求智能上限。 1、负责训推一体框架的设计与开发,服务蚂蚁内部的强化学习场景; 2、建设面向训推一体的显存管理体系和高性能数据存储方案; 3、负责实时高性能训推系统设计与开发,如分布式训练加速策略、算子融合、编译优化、模型量化、混合精度、异构硬件加速等; 4、负责整体性能优化与架构升级,持续提升训练/推理性能; 5、与算法工程师深度合作,为重点项目进行算法与系统的联合优化。

更新于 2025-09-03
logo of aliyun
社招5年以上技术类-开发

职位描述: 在阿里云全面拥抱公共云+AI智算领域这一背景下,阿里云操作系统研发团队和操作系统实验室紧密围绕云AI安全场景展开技术创新、预研和开发,对外结合开源安全技术手段并携手外部生态合作伙伴,共同打造社区和生态的领导力和竞争力,对内结合供应链安全、合规、评测、标准化等手段,积极与内部业务展开合作,服务并支撑好阿里云的AI愿景。 该职位是阿里云操作系统研发团队和操作系统实验室的系统安全团队的研发职位,要求如下: 1. 参与面向云端服务器操作系统安全子领域的技术方案设计、产品化研发工作以及相关开源社区的技术研发工作; 2. 参与安全合规、评测、标准制定等与安全流程相关的研发和运营工作; 3. 结合业务发展需求以及技术趋势,在面向云端服务器操作系统安全领域进行技术创新相关的研发工作。

更新于 2025-06-17
logo of antgroup
社招3年以上技术类-开发

1. 支撑蚂蚁集团在各个业务领域的MLOps&LMOps算法研发工作,覆盖机器学习系统多个子方向领域的工作,包括:数据配比&全链路血缘建设、数据实验&分析、深度学习/大模型预训练/后训练/推理等,建设支持AI全链路的研发平台与AI垂类应用开发平台,实现算法研发效率、和资源利用率的最大化,灵活可扩展的支持不同领域的个性化应用开发需求,为蚂蚁大模型研发链路及应用研发探索新的研发模式; 2. 对平台进行全局性和前瞻性的架构设计和核心技术细节实现,帮助团队攻克各种技术难关,保障和提升平台稳定性。

更新于 2025-10-14
logo of antgroup
社招2年以上技术类-开发

蚂蚁 PaaS 平台是基于蚂蚁多年在金融级云原生领域的技术积累,围绕 Kubernetes 等云原生技术打造的应用 PaaS 平台,并通过下沉技术风险、安全可信、数据智能等能力,实现效率与风险的极致平衡,满足蚂蚁多元化业务需要。 1、基于 Kubernetes 的云原生 PaaS 平台研发,解决蚂蚁超大规模场景下云原生系统性能、高可用与稳定性等问题 2、参与云原生大模型推理服务平台建设,包括模型部署、推理服务高可用高吞吐等能力建设 3、参与变更管控与智能变更平台建设,包括策略代码化、风险分析、根因定位与变更Agent等能力建设 4、面向客户端到端需求分析、技术选型、架构设计、代码实现与功能交付 5、参与云原生 PaaS 开源技术品牌 KusionStack 的建设

更新于 2025-06-10