深度求索全栈开发工程师(北京/杭州)
任职要求
岗位职责: 您将根据团队目标和个人专长,参与以下关键领域的架构设计与工程实现: 一、高并发服务端与 API 系统: 1.深度参与面向数千万日活用户的产品后端架构设计; 2.负责核心服务的性能优化、数据库调优与分布式系统可靠性保障; 3.开发与迭代 AI Chat Bot 等创新产品功能,探索 AI 技术的应用边界。 二、大规模数据处理 Pipeline: 1.负责数据采集、清洗、去重与质量评估系统的设计与开发; 2.构建服务于搜索、多模态与模型训练的高质量数据湖与索引系统; 3.持续优化数据处理各环节的性能与吞吐,确保数据管道的稳定高效。 三、Agent 基础设施与运行时平台: 1.设计与开发支撑海量 AI Agent 运行的下一代容器调度与隔离平台; 2.攻克容器生命周期管理、资源精细调度、多硬件平台统一支持等核心难题; 3.构建高性能、高安全性的 Agent 运行时环境。 四、异构超算基础设施: 1.参与设计、构建与优化支撑大模型训练与推理的异构计算集群管理平台; 2.负责加速卡(如GPU/NPU)等异构计算资源的抽象、池化、调度与性能优化; 3.与超算团队、硬件团队深度协作,解决大规模集群下的资源编排、通信优化、故障容错与能效比提升等挑战,为上层AI研发提供稳定高效的算力底座。 五、Agent 产品与系统架构: 1. 负责通用 Agent 产品的…
工作职责
无
1.负责AI模型在实际业务场景中的平台化落地; 2.参与电商和交易平台等高并发、高可用系统的架构设计与核心模块开发; 3.与产品及前端团队紧密协作,将AI能力高效集成到产品中; 4.优化系统性能,保障服务稳定性,支持全球化部署与多语言;
1. 负责参与阿里云智能&ATH 事业群对客官网的前端开发工作,打造优质的面向开发者/企业/Prosumer 的云计算与 AI 服务平台; 2. 负责参与阿里云智能&ATH 事业群对客与内部运营产品的前端开发工作; 3. 快速构建 AI Agent/Skills 体系能力,实现开发及业务提效; 4. 参与团队基础技术建设,利用 AI 思维提升团队研发效能与质量,并沉淀对应的 AI 能力。

1. 负责参与阿里云智能&ATH 事业群对客官网的前端开发工作,打造优质的面向开发者/企业/Prosumer 的云计算与 AI 服务平台; 2. 负责参与阿里云智能&ATH 事业群对客与内部运营产品的前端开发工作; 3. 快速构建 AI Agent/Skills 体系能力,实现开发及业务提效; 4. 参与团队基础技术建设,利用 AI 思维提升团队研发效能与质量,并沉淀对应的 AI 能力。
【业务介绍】 我们是小红书内稠密类模型(LLM/MLLM/SD/CV/NLP)统一的AI平台QuickSilver,负责调度公司内所有稠密类模型训练与推理资源,基于自建的训推引擎,为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务;包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力。 工作职责: 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程,包括模型fine-tuning、推理服务化等 3、构建云原生架构,设计高可用、高性能的微服务体系 4、优化平台性能,提升系统稳定性和可扩展性