阿里云阿里云智能-技术服务专家TAM-公共云业务-北京
社招全职3年以上云智能集团地点:北京状态:招聘
任职要求
1. 2年以上泛娱乐、零售、金融、教育等行业大型互联网应用或集团型企业应用的解决方案、架构设计、监控方案、Devops、AIops、维护、高可用改造方案经验。 2. 熟悉大模型开发框架(LangChain、Spring AI等),有提示词调优、大模型微调、RAG应用构建、大模型Agent开发等AI领域中的一项或多项技术能力和经验;有基于百炼、Dify构建大模型应用经验者优先。 3. 熟悉JAVA、Python、GO其中一门开发语言,熟悉常见中间件如Redis、Nacos、Kafka等,具有…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 作为企业客户技术服务工作的第一责任人,深入了解客户业务场景,与客户的架构、开发、运维团队深入合作,梳理分析客户现有云产品及应用架构,围绕企业客户上云、云上业务设计稳定性优化方案,从云上监控,主动发现,灾难演练,业务快恢/降级方案,高可用架构改造等方面协助客户持续优化云上稳定性。 2.通过自动化与智能化的手段高效解决对客技术服务以及客户方案落地中的各种技术问题,从客户架构视角出发进行问题处置、风险治理,并沉淀输出最佳实践及工具产品,持续推动阿里云产品及服务的优化改进。 3.结合生成式AI技术与机器学习平台工具,为客户提供从方案评估、部署实施到技术演示的一站式AI落地支持,负责算法与模型的优化,针对特定场景应用微调、评测等手动推动AI能力在客户业务中的高效转化。 4.使用阿里云的AI大模型和平台工具产品,支撑阿里云客户完成AI创新应用落地。提供Agent工程落地服务,包括数据和知识准备、工程链路搭建、提示词调优等。 5. AI相关云产品稳定性保障,AI全链路排查问题,包括SaaS层AI产品,AI相关PaaS/IaaS产品。高效排查解决产品技术售后问题,在服务过程中关注客户体验提升、有效管控客情。
包括英文材料
系统设计+
https://roadmap.sh/system-design
Everything you need to know about designing large scale systems.
https://www.youtube.com/watch?v=F2FmTdLtb_4
This complete system design tutorial covers scalability, reliability, data handling, and high-level architecture with clear explanations, real-world examples, and practical strategies.
DevOps+
https://roadmap.sh/devops
Step by step guide for DevOps, SRE or any other Operations Role in 2025
https://zhuanlan.zhihu.com/p/562036793
DevOps中的Dev指的是Development(开发),Ops指的是Operations(运维),用一句话来说,DevOps就是打通开发运维的壁垒,实现开发运维一体化。
高可用+
https://redis.io/blog/high-availability-architecture/
A high available architecture is when there are a number of different components, modules, or services that work together to maintain optimal performance, irrespective of peak-time loads.
https://www.ibm.com/think/topics/high-availability
High availability (HA) is a term that refers to a system’s ability to be accessible and reliable close to 100% of the time.
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
开发框架+
[英文] Understanding Modern Development Frameworks: A Guide for Developers and Technical Decision-makers
https://www.freecodecamp.org/news/understanding-modern-development-frameworks-guide-for-devs/
LangChain+
https://python.langchain.com/docs/tutorials/
New to LangChain or LLM app development in general? Read this material to quickly get up and running building your first applications.
https://www.freecodecamp.org/news/beginners-guide-to-langchain/
LangChain is a popular framework for creating LLM-powered apps.
Spring+
https://liaoxuefeng.com/books/java/spring/index.html
Spring是一个支持快速开发Java EE应用程序的框架。它提供了一系列底层容器和基础设施,并可以和大量常用的开源框架无缝集成,可以说是开发Java EE应用程序的必备。
https://spring.io/guides/gs/rest-service
https://spring.io/quickstart
Level up your Java code and explore what Spring can do for you.
还有更多 •••
相关职位
社招3年以上云智能集团
1. 作为出海客户企业客户技术服务工作的第一责任人,深入了解客户业务场景,与客户的架构、开发、运维团队深入合作,梳理分析客户现有云产品及应用架构,围绕企业客户上云、云上业务设计稳定性优化方案,从云上监控,主动发现,灾难演练,业务快恢/降级方案,高可用架构改造等方面协助客户持续优化云上稳定性。 2. 与阿里云各团队充分合作,从客户架构视角出发进行问题处置、护航保障、风险治理,并沉淀输出最佳实践及工具产品,面向客户痛点主动进行专项高阶服务。 3. 追踪客户关键稳定性问题,持续协助客户治理并不断推动阿里云产品及服务的优化改进。 4. 协助云上企业客户进行架构改造落地,并持续迭代降低使用成本,提升性能及业务连续性。
更新于 2026-01-30北京
社招5年以上诚云科技
1、云产品稳定性保障,风险巡检:客户云产品稳定性、体验相关事项治理,产品风险巡检,故障的应急跟进与处理; 2、客户技术专项处置与支持:复杂、疑难问题/技术方案/活动护航保障/产研共建专项主导与管理工作; 3、排查问题,管控体验:高效排查解决产品技术售后问题,在服务过程中关注客户体验提升、有效管控客情; 4、专精客户行业,技术沉淀:提炼客户行业技术服务方案,沉淀内部技术文档,持续提高公共云/混合云各行业最佳实践能力;
更新于 2025-10-13北京
社招3年以上诚云科技
1、云产品稳定性保障,风险巡检:客户云产品稳定性、体验相关事项治理,产品风险巡检,故障的应急跟进与处理; 2、客户技术专项处置与支持:复杂、疑难问题/技术方案/活动护航保障/产研共建专项主导与管理工作; 3、排查问题,管控体验:高效排查解决产品技术售后问题,在服务过程中关注客户体验提升、有效管控客情; 4、专精客户行业,技术沉淀:提炼客户行业技术服务方案,沉淀内部技术文档,持续提高公共云/混合云各行业最佳实践能力;
更新于 2026-06-05北京|深圳