蚂蚁金服【蚂蚁星】存储系统专家(AI方向)
任职要求
1. 计算机相关专业研究生及以上学历,在操作系统、计算机体系结构、数据库、分布式系统等方向有坚实的理论与实践基础; 2. 精通至少一门 Python/Go/C++ 等编程语言,具有良好的代码风格与工程实践能力; 3. 具备分布式系统服务或并行计算系统的设计、研发和优化经验,对系统架构和数据一致性有较…
工作职责
我们是一支专注于高性能存储的团队,成员涵盖分布式存储、内存缓存、高并发服务等领域的专家。团队致力于打造高性能、低延迟、低成本的大模型推理基础设施,通过深度协同与持续技术创新,为蚂蚁多业务场景的 AI 能力提供强大支撑。 1. 参与并负责大模型推理场景的整体存储系统设计规划,重点提升KVCache数据缓存的读写性能; 2. 针对海量推理任务、长序列推理等需求,设计并实现高吞吐、低延时的分布式型存储系统; 3. 分析推理过程中的存储瓶颈,持续进行多级缓存、网络传输和数据布局的优化,在保证高可用的前提下,通过合理的资源调度与分层存储降低整体成本; 4. 制定系统容灾与故障恢复机制,实现快速恢复与自动化运维体系; 5. 跟踪前沿存储技术与大模型推理方案,将新思路应用于实战; 6. 与算法、业务、平台团队紧密协作,推动存储系统在大模型推理场景的落地和持续迭代。
图计算部门以图计算为基础,长期为蚂蚁集团提供复杂数据存储和计算系统,拥有自研的图数据库、流式图计算和离线图计算、图学习系统,是图计算标准化组织LDBC的董事会成员,具备业界一流的影响力。团队技术氛围浓,气氛融洽,是做底层系统的好地方。 突破传统存储范式,构建面向AGI时代的数据存储与处理新范式,为千亿参数模型、实时推理、多模态数据处理等场景提供革命性存储解决方案。
蚂蚁集团分布式计算Ray团队,以跟加州伯克利大学RISELAB实验室合作开发的开源分布式计算引擎Ray(https://github.com/ray-project/ray)为通用底盘,打造下一代大规模分布式AI计算基础设施与生态。我们承载了蚂蚁200w+核的在线和离线AI计算任务,支撑着公司内大模型在线服务、在线机器学习、函数计算、离线推理、搜索推荐、图计算、多媒体计算、运筹优化等多种业务场景。 1. 负责AI计算引擎Ray从「通算」到「智算」场景的系统演进; 2.探索Ray及其AI生态在企业内部创新与落地,为公司AI应用发展提供Infra支持; 3.积极参与到Ray开源社区,通过讨论、文档撰写、代码贡献等形式推动Ray在AI及分布式计算领域的发展与创新。
多媒体技术与多模态应用团队,是蚂蚁平台技术事业群下的基础技术团队之一,团队目前五十人左右,规模也在逐年扩大。我们专注于音视频、多媒体、多模态技术的研发和规模应用,打造了蚂蚁多媒体数据全链路基础能力,构建了多媒体处理、传输、渲染、存储等基础产品,具备千万级、百倍加速的视频处理服务,支持了音视频、多模态交互技术在蚂蚁集团的大规模落地使用。 蚂蚁集团丰富多样的业务场景催生出海量的图文/视频等多媒体内容;在生成式AI技术革新与超高清视频标准普及的双重驱动下,用户对极致画质体验的需求日益提升。为此,我们致力于构建新一代智能视频处理技术体系,突破传统框架,探索编解码内核与AI/大模型的深度融合,为用户提供低成本、高画质的服务体验。 1. 负责标准图像及视频(H.265/H.266/AV1等)编解码器及端到端AI编解码器的研发,设计并优化编解码器加速算法以提升压缩效率; 2. 研发基于深度学习/多模态大模型的音视频算法,包括但不限于视频理解、质量评价、修复增强与画质重建等方向,并负责相关算法的性能优化与加速; 3. 开发智能编码优化技术,设计内容感知的视频压缩算法及动态码率分配策略,攻克低带宽场景下的画质保持难题。
我们负责蚂蚁集团内基础人工智能技术的研发与创新,致力于通用人工智能的实现。研究范围涵盖广泛,不仅包括语言大模型、多模态大模型等前沿的大模型技术,也深耕优化算法、知识图谱等基础AI方向。我们自主研发并开源了百灵大模型系列,旨在打造更高效、更通用的AI技术底座。我们积极推动开放协作的AI生态建设,通过技术共享、产学研合作等方式,促进人工智能技术的普惠发展,推动AI技术在各行各业的深度应用。 1. 负责研发大语言模型预训练技术,如高效的新型llm模型架构、长窗口训练技术、pretrain scaling law、高效预训练策略等。 2. 负责研发基于强化学习的推理模型,如大规模强化学习、新型RL算法、testing time scaling等。