
智能互联阿里云智能-表格存储研发专家-杭州
任职要求
1. 熟练掌握 Java 或 C++ 编程语言,具备丰富的 Code Review 经验以及内存、CPU、JVM、锁冲突等调优经验。 2. 具备扎实的计算机科学功底和编程能力,具有良好的编程习惯。 3. 具备独立模块或系统的需求分析、架构设计和编码能力,保证高并发后端系统的架构稳定性。 4. 具备出色的问题分…
工作职责
1. 负责阿里云分布式检索引擎的设计、开发、测试、稳定性保障和业务支持。 2. 负责阿里云存储 AI 检索和 Agent 存储相关功能的产品化落地。 3. 负责 AI 检索系统中的索引构建、检索、算分排序等模块的架构设计、开发、性能优化和稳定性保障工作。 4. 负责向量检索引擎的设计、开发、优化和稳定性保障,打造具备竞争力的向量存储和检索系统。 5. 负责分布式系统的设计、开发、优化和稳定性保障,解决多租户、规模、负载均衡、成本优化和架构改造升级等需求。
1. 参与 PB 级分布式引擎设计与开发,包括存储、索引等的功能实现与性能和成本优化; 2. 参与稳定性建设,优化分片调度与负载均衡机制,研发不同高可用产品形态,包括:同城多可用区、异地容灾、全球多活等; 3. 跟踪业界前沿动态,学习和吸纳开源的大数据计算和存储技术,帮助产品探索和实现更多的玩法。
1. 基于阿里云存储基础平台,规划下一代大规模分布式网盘存储的架构设计,建设超大规模高可靠性、分布式、低成本、高并发能力的云盘文件服务,并承担关键模块的开发工作。 2. 依托海量文件、文档、图片、视频、音频等资源,整合大模型生态,规划并建设多模态存储与多模态计算引擎,支撑内容理解、融合模特检索、知识聚合等下游应用。 3. 收集、识别和分析客户需求,把握业界技术发展趋势,制定技术规划,选择合适的技术架构、功能设计、方案实现和开发流程。 4. 负责云盘核心模块的架构设计与实现,进行性能和成本优化,设计开发并维护系统公共组件,参与横向项目。主要使用 Go 语言。 5. 参与稳定性和安全工作,寻找并解决系统潜在的稳定性和安全隐患,确保系统安全稳定运行。
RAG(Retrieval-Augmented Generation)检索增强生成技术伴随着LLM技术爆发迅速发展,广泛应用于文档问答、智能客服、技术支持等实际业务场景。 在上述场景中,除了纯文本内容效果已经发展到一定水平,图片、表格、代码等多模态的内容的RAG还处于比较初级阶段,目前技术很难解决实际业务问题。 多模态RAG效果重要的效果瓶颈之一在于多模态检索技术,如何将多模态信息统一表征到同一个向量化空间中,结合向量检索技术提升多模态检索效果是很有挑战的问题。 除了上述场景,多模态RAG通过和音频、视频等模态的结合,必定还有更多的业务场景可以挖掘。