小红书AI存储研发专家
任职要求
1. 本科及以上学历,3~5年AI&Data存储/引擎研发经验
2. 加分项:具备文件系统或高性能存储研发经验,如JuiceFS/Alluxio/CPFS/GPFS/Ceph/MinIO/对…工作职责
1. 协同AI平台与算法团队,面向AI大模型训练和多样化数据处理场景,研发云原生文件系统和缓存加速系统,为AI业务提供极致的存储解决方案并推动在业务侧落地。 2. 应对小红书超大规模多模态应用挑战,攻克单集群百亿级元信息、Tbps级高吞吐等行业技术难题,保障AI业务的安全、稳定和高效运行。 3. 持续进行系统架构优化与技术迭代,结合AI负载特征,实现数据智能调度、数据预取和缓存管理,不断优化I/O路径,有效提升GPU等算力资源利用率。
1. 设计与开发基于LLM的智能体系统架构,实现复杂任务规划、工具调用、记忆存储等核心功能 2. 构建多智能体协作框架,探索Agent间的通信协议与协同决策机制 3. 集成外部工具API(搜索引擎/数据库/专业软件),扩展Agent能力边界 4. 优化Agent的实时交互能力,包括对话流畅性、任务分解准确性、异常处理鲁棒性 5. 开发Agent评估体系,设计自动化测试场景与量化评估指标 6. 研究Agent持续学习机制,实现长期记忆存储与经验复用
团队介绍:基础架构数据库 CDI(Common Data Infra)团队支撑字节核心业务板块的数据基础设施建设,深度参与业务存储/数据架构的演进工作。团队负责面向 Base 领域的分布式数据库 FxDB 和向量数据库等产品的研发和迭代,深耕前沿数据库技术,助力业务提升核心技术品质。 1、负责向量索引构建、向量检索等核心算法的实现和性能优化; 2、负责高性能向量数据库的架构设计、功能迭代、以及产品化; 3、针对泛 AI 产品业务场景下的特定需求,提出解决方案并落地。
阿里云专有云平台监控团队研发,负责云平台和租户实例的一体化可观测产品建设。 负责平台核心功能编码开发,工作领域范围: 1、云监控产品能力建设,为用户提供数据采集,预处理,汇聚,过滤,告警匹配,抑制,事件聚合等指标监控和告警。以及站点监控,拨测,巡检,故障诊断等可观测服务能力。 2、云监控平台基础设施服务研发工作,如存储引擎,云原生Prometheus,Grafana平台体系,高可用部署架构,大规模弹性伸缩架构设计等。 3、云平台资源管理,服务器和软件自动化运维平台建设。持续推进AI 技术深化战略布局中, 围绕AI 和云计算的基础设施建设、AI基础模型平台、企业级AI应用方向构建核心运维应用场景。