logo of aliyun

阿里云阿里云智能-AI产品技术架构师(平台及服务端方向)-上海

社招全职5年以上云智能集团地点:上海状态:招聘

任职要求


1、8年以上后端或Infra领域的工作经验,其中至少3年担任高级架构师或类似角色;
2、拥有处理百万级日活跃用户 (DAU) 或同等规模的C端高并发系统的实战经验;
3、有顶尖AI公司或云计算厂商相关经验者优先(例如:Google Cloud, AWS, 阿里云, OpenAI, Anthropic, Perplexity, Lovable、Poe、Replit等);
4、对分布式系统有深刻的、体系化的理解,精通分布式一致性、CAP理论、负载均衡、消息队列缓存等核心原理 ;
5、在云原生技术栈有深厚的积累和实战经验,是以下至少一个领域的专家:
      容器编排: 精通Kubernetes,有超大规模K8s集群的设计、运维和调优经验。
      Serverless: 有深度使用无服务计算平台的经验(如AWS Lambda, Google Cloud Run)。
6、拥有复杂微服务治理或API网关项目的设计经验,熟悉IstioEnvoy服务网格技术,并对熔断、限流、降级有深刻的实践理解;
7、具备强大的问题分析和解决能力,能够快速定位和解决复杂的线上问题,并从架构层面推动系统性的改进。

加分项
1、对LLM/AI Agent的工作负载有一定理解,包括模型推理的资源需求、性能特点等;
2、有主导大型项目进行性能、成本优化并取得显著成果的经验;
3、是相关领域知名开源项目的贡献者 (Contributor/Committer)。

工作职责


Steam 部门设立于2025年1月,正如蒸汽机(Steam Engine)在工业革命 1.0 中所象征的创新开端,我们也希望以此之名,积极探索云与 AI 结合的产品方向。
在当前大模型能力日新月异的情况下,唯有坚持自己的核心价值主张和对未来的判断,且面向半年至一年后的大模型能力打造应用产品,才有一战的可能。对于大模型领域的未来进展,我们相信:
1) 大模型的智商会快速接近乃至与人类齐平;
2) 大模型的多模态理解能力,特别是视觉能力将得到长足发展;
3) 在1和2前提下,信息处理类工作将最终被 AI 接管,大量替代真人员工。
对于阿里云如何做到云+ AI,我们认为"云的最大客户会是 AI",我们的行动路径是让更多现实世界的工作量从“人类脑力劳动”转移到“云端 AI 消耗的计算资源”。
在这些认知下,我们确定了“高效完成重复任务,完整替代人类工作”的产品目标,如果你也相信这个未来,欢迎上船。

1、负责整个AI Agent平台面向C端用户功能的架构设计、技术选型和长期演进路线规划,确保架构的前瞻性、健壮性和可扩展性;
2、设计、实现并持续优化AI Agent平台的核心架构模块:
	•大规模弹性计算调度系模块:为平台提供一套能够管理海量Agent Runtime(容器/VM/Serverless)的计算资源调度框架,确保低时延、高效调度、安全隔离且成本可控。
	•外部服务管理模块: 针对Agent对海量外部API的调用,构建一套稳定高效的接入和调度体系,包括智能API网关、可用性检查、弹性伸缩和全链路流量控制,确保该能力的稳定性不被第三方服务影响。
3、稳定性与SRE建设: 建立并领导平台的稳定性保障体系。推动全链路可观测性建设、容量规划和故障演练,将系统可用性提升至业界顶尖水平;
4、性能与成本优化: 深入分析系统瓶颈,主导性能优化项目。同时,建立准确的成本度量机制并持续优化平台成本,持续推动平台性能的提升和成本的下降;
5、参与AI Agent平台其他部分功能的架构设计与评审。
包括英文材料
Python+
Go+
Java+
高并发+
微服务+
高可用+
系统设计+
AI agent+
大模型+
RocketMQ+
AWS+
分布式系统+
CAP+
消息队列+
缓存+
Kubernetes+
Istio+
Envoy+
相关职位

logo of meituan
社招5年以上核心本地商业-美

1、根据产品需求主导AI产品服务端系统的架构设计与开发,构建高可用、高并发、低延迟的分布式系统; 2、深入理解AI业务需求,设计并优化模型推理链路及性能,与算法工程师协作优化工程落地链路; 3、解决高并发场景下的雪崩、穿透、限流等稳定性问题,设计容错降级机制; 4、为产品团队提供技术可行性评估,平衡业务需求与架构合理性; 5、主导技术文档编写,推动团队技术能力提升与知识沉淀。

更新于 2025-06-22
logo of aliyun
社招5年以上云智能产品解决方

作为合作伙伴解决方案架构师,您将负责与生态伙伴共同设计、验证并推广基于阿里云的联合解决方案,确保技术架构的领先性、可落地性及市场竞争力。您需要具备深厚的技术架构能力和行业解决方案经验,通过与合作伙伴的技术协作,将阿里云产品与伙伴技术深度融合,打造标杆级解决方案,并推动其在目标市场中的规模化推广。 核心职责 1. 联合解决方案设计与打包 • 主导与合作伙伴共同设计面向不同领域的端到端技术解决方案,整合阿里云产品(如计算、存储、AI、大数据等)与伙伴技术(如行业应用、垂直工具),确保架构的高可用性、扩展性和安全性。 • 制定技术选型标准,评估新技术/工具的适用性,并推动其与阿里云平台的集成认证(如API对接、云市场兼容性)。 • 将联合解决方案转化为可复制的技术模板或产品包,包括架构设计文档、实施指南、配置脚本、自动化部署工具等,降低伙伴实施门槛。 • 设计解决方案的技术分层架构(如IaaS/PaaS/SaaS),明确阿里云与伙伴的接口规范及责任边界。 2. 技术推广与赋能 • 通过技术研讨会、白皮书发布、客户案例分享、线上直播等形式,向合作伙伴及客户推广联合解决方案的技术优势与最佳实践。 • 协助合作伙伴完成POC验证、技术演示及客户POC,提升解决方案的市场可信度。 • 设计并实施针对合作伙伴的技术培训计划,覆盖阿里云产品集成、架构设计、API开发等关键能力。 • 编写技术文档、FAQ、故障排查手册等,形成标准化知识库,支持伙伴快速掌握解决方案实施要点。 3. 合作伙伴技术协作与交付 • 深入参与合作伙伴项目,解决技术实施中的复杂问题(如性能调优、系统兼容性、数据迁移等),确保方案落地质量。 • 与阿里云内部团队(研发、产品、交付)协作,协调资源解决技术瓶颈,推动解决方案持续优化。 • 主导或协助伙伴完成阿里云集成认证(如解决方案认证、技术兼容性认证),确保产品在阿里云市场合规上架。 4. 市场洞察与技术策略 • 深度分析(xx)领域技术趋势、客户痛点及竞争格局,提出技术路线演进建议,确保解决方案的前瞻性和竞争力。 • 结合阿里云产品,规划与合作伙伴的技术合作方向,推动联合创新。

更新于 2025-07-03
logo of aliyun
社招5年以上云智能集团

作为合作伙伴解决方案架构师,您将负责与生态伙伴共同设计、验证并推广基于阿里云的联合解决方案,确保技术架构的领先性、可落地性及市场竞争力。您需要具备深厚的技术架构能力和行业解决方案经验,通过与合作伙伴的技术协作,将阿里云产品与伙伴技术深度融合,打造标杆级解决方案,并推动其在目标市场中的规模化推广。 核心职责 1. 联合解决方案设计与打包 • 主导与合作伙伴共同设计面向不同领域的端到端技术解决方案,整合阿里云产品(如计算、存储、AI、大数据等)与伙伴技术(如行业应用、垂直工具),确保架构的高可用性、扩展性和安全性。 • 制定技术选型标准,评估新技术/工具的适用性,并推动其与阿里云平台的集成认证(如API对接、云市场兼容性)。 • 将联合解决方案转化为可复制的技术模板或产品包,包括架构设计文档、实施指南、配置脚本、自动化部署工具等,降低伙伴实施门槛。 • 设计解决方案的技术分层架构(如IaaS/PaaS/SaaS),明确阿里云与伙伴的接口规范及责任边界。 2. 技术推广与赋能 • 通过技术研讨会、白皮书发布、客户案例分享、线上直播等形式,向合作伙伴及客户推广联合解决方案的技术优势与最佳实践。 • 协助合作伙伴完成POC验证、技术演示及客户POC,提升解决方案的市场可信度。 • 设计并实施针对合作伙伴的技术培训计划,覆盖阿里云产品集成、架构设计、API开发等关键能力。 • 编写技术文档、FAQ、故障排查手册等,形成标准化知识库,支持伙伴快速掌握解决方案实施要点。 3. 合作伙伴技术协作与交付 • 深入参与合作伙伴项目,解决技术实施中的复杂问题(如性能调优、系统兼容性、数据迁移等),确保方案落地质量。 • 与阿里云内部团队(研发、产品、交付)协作,协调资源解决技术瓶颈,推动解决方案持续优化。 • 主导或协助伙伴完成阿里云集成认证(如解决方案认证、技术兼容性认证),确保产品在阿里云市场合规上架。 4. 市场洞察与技术策略 • 深度分析(xx)领域技术趋势、客户痛点及竞争格局,提出技术路线演进建议,确保解决方案的前瞻性和竞争力。 • 结合阿里云产品,规划与合作伙伴的技术合作方向,推动联合创新。

更新于 2025-07-09
logo of bytedance
社招4年以上A94909

1、负责剪映AIGC基建能力开发,聚焦于解决AI相关的开发效率、能力复用及评测等方面; 2、研发高并发、高可靠、灵活扩展并支持国际化部署的服务端系统,满足复杂业务场景的需求; 3、通过调研和应用前沿的技术架构和先进实践,结合场景打造强大的研发和服务基础设施,推动剪映Capcut的AI产品快速发展; 4、搭建一体化平台,通过可视化、低代码等方式提供易用易管理的基建能力。

更新于 2023-11-09