阿里云阿里云智能-AI产品技术架构师(平台及服务端方向)-上海
任职要求
1、8年以上后端或Infra领域的工作经验,其中至少3年担任高级架构师或类似角色;
2、拥有处理百万级日活跃用户 (DAU) 或同等规模的C端高并发系统的实战经验;
3、有顶尖AI公司或云计算厂商相关经验者优先(例如:Google Cloud, AWS, 阿里云, OpenAI, Anthropic, Perplexity, Lovable、Poe、Replit等);
4、对分布式系统有深刻的、体系化的理解,精通分布式一致性、CAP理论、负载均衡、消息队列、缓存等核心原理 ;
5、在云原生技术栈有深厚的积累和实战经验,是以下至少一个领域的专家:
容器编排: 精通Kubernetes,有超大规模K8s集群的设计…工作职责
Steam 部门设立于2025年1月,正如蒸汽机(Steam Engine)在工业革命 1.0 中所象征的创新开端,我们也希望以此之名,积极探索云与 AI 结合的产品方向。 在当前大模型能力日新月异的情况下,唯有坚持自己的核心价值主张和对未来的判断,且面向半年至一年后的大模型能力打造应用产品,才有一战的可能。对于大模型领域的未来进展,我们相信: 1) 大模型的智商会快速接近乃至与人类齐平; 2) 大模型的多模态理解能力,特别是视觉能力将得到长足发展; 3) 在1和2前提下,信息处理类工作将最终被 AI 接管,大量替代真人员工。 对于阿里云如何做到云+ AI,我们认为"云的最大客户会是 AI",我们的行动路径是让更多现实世界的工作量从“人类脑力劳动”转移到“云端 AI 消耗的计算资源”。 在这些认知下,我们确定了“高效完成重复任务,完整替代人类工作”的产品目标,如果你也相信这个未来,欢迎上船。 1、负责整个AI Agent平台面向C端用户功能的架构设计、技术选型和长期演进路线规划,确保架构的前瞻性、健壮性和可扩展性; 2、设计、实现并持续优化AI Agent平台的核心架构模块: •大规模弹性计算调度系模块:为平台提供一套能够管理海量Agent Runtime(容器/VM/Serverless)的计算资源调度框架,确保低时延、高效调度、安全隔离且成本可控。 •外部服务管理模块: 针对Agent对海量外部API的调用,构建一套稳定高效的接入和调度体系,包括智能API网关、可用性检查、弹性伸缩和全链路流量控制,确保该能力的稳定性不被第三方服务影响。 3、稳定性与SRE建设: 建立并领导平台的稳定性保障体系。推动全链路可观测性建设、容量规划和故障演练,将系统可用性提升至业界顶尖水平; 4、性能与成本优化: 深入分析系统瓶颈,主导性能优化项目。同时,建立准确的成本度量机制并持续优化平台成本,持续推动平台性能的提升和成本的下降; 5、参与AI Agent平台其他部分功能的架构设计与评审。
1.大模型商机判断和深度技术交流: (1)赋能前端业务线/行业线,推动大模型场景业务快速拓展。 (2)作为大模型产品团队代表,支撑前线业务线开展商机判断和选择。 (3)针对复杂项目需求,协同前后团队与客户进行深度技术交流,促进商机转化,为结果负责。 2、产品解决方案设计与规模推广: (1)支持行业/区域的市场洞察,理解行业客户的业务和功能性/非功能型需求,基于客户场景,提供有技术竞争力和成本优势的产品组合方案,并在产品选型/配置报价/招投标过程中, 提供技术支持。 (2)探索创新产品的方案和场景,推动新产品快速市场覆盖。 (3)负责大模型产品落地页、商业机会挖掘、解决方案Demo中心等平台服务端架构设计与开发,提供统一平台能力,保障可用性及安全性。 (4)主导后端与前端团队的协作,完成接口设计与联调,确保产品功能高效落地。 (5)负责大模型服务的对客体验,对接客户侧功能和体验问题,负责相关问题的Triage、定位和推动问题的最终解决。 (6)负责大模型服务的对客体验,对接客户侧效果和体验问题,负责通过后训练产品实现客户场景效果目标,并交付服务。 3、产品改进: (1)深入调研客户需求,将合理需求准确地反馈到产品研发团队,负责改进需求在产品中的实现效果验收,帮助部门大模型/智能化相关产品的持续发展。 4. 市场洞察: (1)洞察产品的市场机会、市场容量和竞争格局,捕捉机会,找到方向并能影响前线和产研快速推动落地。
1. 大模型商机孵化 (1)作为通义大模型产品团队代表,-针对复杂项目需求,协同前后团队与客户进行深度技术交流,促进商机转化,为结果负责。 (2)赋能阿里云前端业务线/行业线,深入理解消费电子、短剧、数据挖掘、教育等核心行业的业务流程与痛点,识别通义大模型应用的创新机会。 (3)洞察产品的市场机会、市场容量和竞争格局,基于行业洞察,评估大模型解决方案的可行性与商业价值,推动从“0到1”的场景拓展。 (4)针对复杂项目需求,协同前后端团队与客户进行深度技术交流,通过“行业洞察+技术验证”双轮驱动,促进商机转化并为结果负责。 (5)洞察产品的市场机会、市场容量和竞争格局,捕捉机会,找到方向并能影响前线和产研快速推动落地。 2. 产品解决方案设计与规模化落地 (1) 支持行业/区域的市场洞察,理解客户功能性与非功能性需求。基于“算力-数据-模型-平台-应用”五层架构,提供具备技术竞争力和成本优势的产品组合方案,并在招投标与选型中提供核心技术支持。 (2)聚焦Agent化转型与多模态融合趋势,设计智能体矩阵解决方案。负责大模型落地页、商业机会挖掘、Demo中心等平台服务端架构设计与开发,构建可插拔、标准化的模型缝合能力,实现中长尾客户“开箱即用”。 (3) 主导对客体验闭环:对接客户侧的功能、体验及效果问题。利用RAG/PE/SFT等技术手段降低幻觉风险,通过精准的Triage定位与技术方案交付,快速解决客户痛点,保障安全可控的内容输出。 (4)负责大模型服务的对客体验,对接客户侧功能和体验问题,负责相关问题的Triage、定位和推动问题的最终解决。 3. 产研协同与市场格局洞察 (1) 深入调研客户需求,将一线聚类需求准确反馈至模型与工程团队,帮助工程团队及能力中心架构师做出技术解决方案,驱动MaaS平台及模型能力的迭代发展。 (2)洞察大模型产业机会、市场容量及竞争格局。捕捉前沿技术趋势(如推理优化、MoE架构),为产品战略及前线业务落地提供强有力的技术支撑。 (3)深入调研客户需求,将合理需求准确地反馈到产品研发团队,负责改进需求在产品中的实现效果验收,帮助部门大模型/智能化相关产品的持续发展。
1. 深刻理解负责业务的产品架构、客户场景及技术架构,结合业务线特点制定和推进有效的测试策略和测试方法。 2. 理解敏捷项目模型,能够深度参与到诸如用户故事拆分等各种敏捷产研活动。 3. 能够结合需求、研发设计、CodeReview开展测试分析,充分把控测试范围,并指导和带领比自己职级低的同学完成用例设计及用例执行工作,保证高质量的交付。 4. 负责客户端、后台等方向性能、自动化、兼容性等专项测试的建设。 5. 通过在软件开发流程、测试策略、测试方法和测试技术等方面的创新,提升产品质量和工程效率。 6. 解决测试开发工作中的复杂技术问题。
1、负责区域企业公共云市场的售前解决方案工作,支持团队拿到业务结果; 2、负责支持区域市场洞察、竞争分析、行业打法策略分析与制定,支撑行业机会点识别、行业整体业务规划和策略落地,行业包括但不限于工业制造、集成电路、能源化工、信息服务、商贸流通等; 3、洞察典型迁移上云场景及重要客户、生态伙伴需求,抽象共性要求,推动后端方案/产品升级优化 ; 4、作为技术专家,提供客户迁移上云或者关键需求实现的解决方案,并在落地过程中提供对内外部团队提供必要的技术指导,确保方案可落地、有竞争力; 5、协助客户方案比选,通过POC演示和功能/性能测试验证阿里云技术优势; 6、为客户提供整体技术平台的咨询服务,指导客户构建弹性、高可用的互联网架构; 7、建立行业影响力,传播企业业务上云技术理念和最佳实践。