阿里云阿里云智能-存储索引服务研发专家-杭州/上海
任职要求
1.精通 C++ 或 Golang,熟悉现代工程实践(C++11 及以上/Go 并发模型),理解内存模型、原子操作与锁的性能权衡。 2.熟悉分布式一致性与主流协议(Raft/Paxos),理解日志复制、快照、选主、租约/时钟漂移与脑裂防护。 3.理解经典存储引擎与索引结构,尤其是 LSM-tree(…
工作职责
1.负责存储索引中台的核心功能设计与研发,包括但不限于:路由/调度、分片管理(split/merge)、负载均衡与容灾切换。 2.构建多集群/联邦化管控:统一命名/注册发现、跨集群路由、在线再均衡与无感迁移。 3.持续性能剖析与优化(perf/eBPF/火焰图),在真实流量与压测环境下定位瓶颈、落地优化方案。 4.完善系统可观测性和运维能力、混沌演练、容量与变更发布策略,保障高可用与可回滚。 5.参与 CPFS 问题排查与稳定性治理,沉淀工具与最佳实践。
⁃ 解决千亿级元数据索引效率的问题,支撑海量文件的查询访问效率以及元数据扩展性问题,提供性能卓越扩展良好的元数据服务。 ⁃ 高效的blob存储格式,编写高质量、可扩展、高可用、性能卓越的存储底层核心模块,对模块质量负责。 ⁃ 负责性能IO链路,对小文件聚合、大文件切片、EC编码等核心功能负责。 ⁃ 基于业界主流的AI训练加速方案,打造符合蚂蚁特点的高性能AI存储/缓存产品,为大模型、海量多模态数据的高并发训练提供存储底座,为AI算力持续增长提供基础设施侧保障。 ⁃ 负责存储产品的长期技术演进及稳定性保障,对上层业务效果负责。
1、产品解决方案设计:深入理解公司业务需求,结合 Redis、RedKV、MySQL、TiDB、RedTao、ROS 等多种存储数据库技术特点,主导设计高可用、高性能、可扩展的存储数据库产品解决方案,推动业务与技术深度融合。 2、平台研发与优化:牵头存储数据库运维提效工作,推动实现存储数据库资源自动化部署、智能监控、故障自愈等功能,提升存储数据库运维效率与服务质量,助力团队从传统运维向平台化运营转型。 3、横向项目落地:作为项目负责人,统筹协调跨部门资源,制定项目计划与技术方案,确保重大横向项目按时高质量完成,推动公司存储数据库技术体系升级与创新。 4、技术研究与创新:跟踪存储数据库领域前沿技术动态,探索新技术在公司业务场景的应用可行性,主导技术预研与 POC 验证,为公司技术发展提供前瞻性建议。 5、团队协作与知识共享:与业务部门、开发团队紧密沟通协作,提供专业的技术支持与咨询服务;组织内部技术培训与分享,提升团队整体技术水平。
1、打造行业领先的数据湖服务,提供高效、极简的EB级数据存储与处理能力。推进快手数据体系的全面的湖仓化; 2、建设向量化执行引擎,结合微体系结构特性,持续不断优化引擎的执行性能; 3、设计与研发数据自动化生产能力,持续降低数据生产成本; 4、跟进学术界,工业界成熟的经验与技术,规划与推进快手数据体系的不断演进与迭代。
阿里国际内部集大模型研究及智能化前沿产品研发于一体的AI部门;自研面向跨境商贸增强的多语言大模型-Marco和多模态大模型-Ovis,依托全球化的AI基础设施和算力资源,帮助AliExpress、Lazada、阿里巴巴国际站、Trendyol、Daraz 等平台全面革新跨境电商全链路的经营体验和商业效率;目前已服务超50万商家,平均日调用量已突破10亿次,覆盖营销、客户服务、商品发布、设计、合规等60+应用场景;正在基于自研的大模型与工程技术,打造新一代的智能体(Agent)和智能引擎(Deep Research)产品,持续致力于让全球商业没有语言障碍,用智能帮助跨境贸易更加简单。 该职位负责构建高性能、可扩展的搜索引擎工程架构,优化搜索效果,支持多模态搜索能力,打造行业领先的搜索产品; 工作职责 1、负责搜索引擎相关系统研发,打造高性能、低成本、多场景的搜索产品 2、设计并实现搜索系统分布式架构,确保系统的高可用性、高性能和可扩展性 3、构建支持多模态(文本、图像、视频)检索的搜索系统架构,推动多模态搜索能力落地 4、负责搜索服务端的开发工作,优化索引构建、查询处理等核心环节 5、与算法团队紧密协作,将搜索算法能力高效集成到工程系统中,实现搜索效果持续优化 6、构建搜索效果评估体系,设计A/B测试框架,通过数据驱动方式持续提升搜索质量 7、保障搜索系统的稳定性与性能,解决高并发、大规模数据处理等工程挑战,支撑复杂业务场景