蚂蚁金服蚂蚁集团-AI Infra 工程师-杭州
任职要求
1. 掌握任意一门编程语言(java,c++,go等),熟悉redis,数据库,分布式和高并发系统设计,熟悉云原生运维环境,具备良好的编程习惯和程序性能分析能力; 2. 具备良好的分析和问题解决能力,能够独立进行…
工作职责
1. 负责llm后训练训推调优与框架优化,优化负载均衡策略,提升训练和推理效率; 2. 负责rl训练工程环境搭建,包括mcp工具,沙箱,agent等环境,确保其在处理大规模训练时的性能,提高其性能和稳定性; 3. 对设计与实现的功能进行测试和调优,保证其在不同环境下的运行效率。
1. 负责llm后训练训推调优与框架优化,优化负载均衡策略,提升训练和推理效率; 2. 负责rl训练工程环境搭建,包括mcp工具,沙箱,agent等环境,确保其在处理大规模训练时的性能,提高其性能和稳定性; 3. 对设计与实现的功能进行测试和调优,保证其在不同环境下的运行效率。
1.结合HPC和AI前沿技术,设计和优化大模型训练和推理框架,负责模型优化、算子优化、图优化、分布式优化等,提升计算效率 2. 负责云侧或端侧大模型和小模型推理服务开发、性能优化、上线等工作
负责 AI Agent Infra 建设,提升 AI Agent 产品创新效率,探索生成式 AI 在数字世界的实际应用。 1. 建设 Agent SWE Infra 工程,提升 Agent 相关代码的个性化构建和发布效率; 2. 建设 Sandbox Infra 工程,为各类 Agentic 场景提供高效、稳定、大规模的模拟器、多工具、图形交互的沙箱环境; 3. 建设 Serving Infra 工程,为生产提供通用的 Agent 服务化框架,优化 LLM 和 Agent 性能,保障高可用运行。
负责阿里集团、阿里云战略级产品SLS研发,在日增数百PB级的超大规模实时数据之上,挑战从“经典可观测性”向“AI Native 基建”的跨越。通过实时采集、索引、存储、语义检索和分析等技术,实时处理每日数百PB海量数据,并针对AI应用场景进行特定优化,提供智能、自动化数据检索和分析服务。加入该岗位,您将有机会在国内超大规模的实时日志平台上,打造新一代的AI基础设施。 1. 定义下一代 AI 数据基座: 基于现有海量日志平台,重构面向 Agent Runtime 的数据基础设施,解决高吞吐写入与低延迟语义检索共存的工程难题; 2. 构建 Data + AI 飞轮: 研发高性能的数据清洗与向量化流水线,从数据中实时化萃取高质量数据,构建AI存储和检索系统,通过构建数据反馈回路,使模型和Agent持续进化; 3. 超大规模系统攻坚: 维护并演进日处理百 PB 级数据的实时平台,在极致的成本与性能约束下,探索存算分离、混合索引等前沿技术落地。