
智能互联阿里云智能-百炼系统架构技术专家-北京/杭州
任职要求
1. 计算机及相关专业硕士及以上学历,计算机、软件工程、系统架构等相关专业背景。 2. 5 年以上大型平台系统、DevInfra 架构或 AI 平台服务端开发经验,有大模型应用和系统经验者优先。 3. 深刻理解分布式系统设计原理,熟悉微服务、服务网格、异步编排、服务容灾等高可用系统架构设计。 4. 熟练掌握主流 DevOps/DevInfra 工具链,具备构建自动化研发流程的能力…
工作职责
1. 负责大模型应用和系统整体架构设计与演进,打造具备弹性调度能力、服务稳定、低延迟响应的全链路应用和系统。 2. 主导平台的 DevInfra 能力建设,覆盖CI/CD、灰度发布、可观测性、异常诊断与系统治理等关键模块,提升研发交付效率。 3. 优化业务、平台、应用的架构设计,持续提升平台能力与技术领先性。
1. 负责大模型应用和系统整体架构设计与演进,打造具备弹性调度能力、服务稳定、低延迟响应的全链路应用和系统。 2. 主导平台的 DevInfra 能力建设,覆盖CI/CD、灰度发布、可观测性、异常诊断与系统治理等关键模块,提升研发交付效率。 3. 优化业务、平台、应用的架构设计,持续提升平台能力与技术领先性。
1. 系统架构与工程落地 ● 负责AI Agent框架设计与实现,构建高可用、低延迟的AI Agent生产环境,支持百万级以上用户量的应用、部署平台 ● 负责智能体知识库、流程编排等功能开发,对接头部等流量等载体的接口,输出能力 ● 开发LLM应用基础设施,包括RAG 技术、Agent开发框架(如LangChain) MCP 协议等 ● 优化Agent与工具调用的协同机制,提升任务规划、自主决策和交互体验 ● 探索大模型与Agent技术的结合,解决复杂场景下的推理能力 2. 业务场景适配与创新 ● 推动AI Agent在搜索、营销、服务、DevOps运维等领域的落地 ● 设计符合行业需求的解决方案,如应用导购助理、客服助手、智能编程助手 ● 负责AI项目的推动落地,行业类Agent开发以及行业类RAG系统的架构设计与研发。 ● 负责技术预研、架构设计、业务模型抽象及功能开发保持对业务场景的敏锐洞察,快速熟悉业务流程并理解业务痛点,沟通并分析产品需求,制定技术方案,设计与研发核心系统及模块,推动产品快速迭代。
1. 负责百炼平台大模型调优与部署等AI工具链产品化落地; 2. 负责百炼平台的调优模型推理、模型评测、模型调优、模型广场等的模块的架构设计和开发工作; 3. 了解技术使用场景和优缺点,能够就复杂技术问题,提供解决方案并执行落地,同时对上下游技术团队及技术架构有完整的了解; 4. 基于业务需求和技术洞察,在调优后模型的推理服务方面,进行技术规划并落地。
1. 核心系统研发 (1)设计与优化大模型推理服务框架与分布式缓存系统。 (2)支持多推理引擎适配、多模态推理、分布式部署及高效数据管理。 (3)开发工具链与服务化能力,包括模型量化、转换、调度与生命周期管理。 2. 性能与稳定性优化 (1)优化推理服务框架的性能,包括引擎适配、生命周期管理和资源调度。 (2)深入优化kvcache的显存、内存和存储管理、批处理、缓存策略和网络传输。 (3)支持高性能通信协议、容错与负载均衡机制。 (4)提升系统可观测性,完善监控、告警与故障恢复体系。 3. 引擎与应用集成 (1)深度集成推理引擎、缓存系统和存储系统,优化访问模式与架构设计。 (2)满足大规模、多模态推理场景下的高吞吐与低延迟需求。