阿里云阿里云智能-技术专家-客户服务平台-杭州
任职要求
1、本科及以上学历,5年以上应用开发经验; 2、具有大型分布式系统研发经验,掌握常见的架构设计方法和模式,理解大型网站所需要用到的架构和技术,对常见的中间件如分布式缓存、消息队列、RPC等有丰富的使用经验和深入理解; 3、精通Java或Python至少一种语言,熟悉该语言全技术栈(语言基础、技术框架等),熟悉面向对象设计原则,具备高并…
工作职责
1、负责阿里云国内和国际客服平台、企业客户服务平台的架构设计和平台研发工作,通过AI能力构建适合企业客户的客户服务平台和能力; 2、对业务场景保持敏锐,快速熟悉业务流程并理解业务痛点,对产品需求进行沟通、分析,完成技术方案的制定,核心系统及模块的设计与研发,驱动产品快速迭代; 3、独立完成中小型项目的落地及管理工作,确保项目进度和质量,团队内外的沟通协作,包括业务沟通,技术合作,项目及人员管理等,推动组织高效运作;
1. 作为云计算领域技术专家,处理全球专有云客户的应急事件,协助客户解决平台或使用问题,快速恢复客户业务; 2. 通过对应急事件的总结、分析、复盘,整理解决方案、工具,以及推进客户用云业务架构的优化以及云产品的优化; 3. 深入理解云计算和云产品技术架构,能站在客户用云业务稳定性保障的角度,结合客户核心业务场景,设计、开发应急演练方案,通过演练提升客户故障快恢能力; 4. 结合客户在阿里云的使用情况,协助客户制定基于阿里云的联合演练方案和应急预案,并协助实施与优化,帮助客户提升云上业务高可用能力。 5. 总结场景案例以及技术文档,构建应急大模型agent,应用到应急事件的排查处置过程中。
1、设计并实现高性能AI原生网关。构建低延迟、高并发的API网关系统,支持多模态、多协议接入,为国内及全球客户提供灵活、安全、可扩展的流量接入方案,提供完整的数据面控制与可观测能力; 2、打造智能推理调度与资源管理系统。设计并实现面向复杂分布式推理场景的请求调度和资源调度系统,结合动态负载特征与异构硬件资源,持续优化请求分发策略;建设Serverless化资源调度架构,实现资源的弹性伸缩与极致利用率提升; 3、构建先进的MLOps平台能力。深度优化模型服务的CI/CD流程,推动算法研发到生产部署的自动化与标准化;实现模型版本管理、灰度发布、监控告警、性能分析等全生命周期管理能力,提升迭代效率与系统稳定性。
1. 设计并构建面向多模态交互(语音、视觉、语言、上下文融合)的云端推理服务平台,支持Omni/Speech/VL等大模型的在线/近线推理。 2. 主导端云协同架构中云端服务模块的技术方案,包括模型服务化(Model Serving)、动态批处理(Dynamic Batching)、请求调度、弹性扩缩容、负载均衡等关键能力。 3. 优化云端推理链路的延迟、吞吐与资源利用率,针对ToB客户对SLA(如99.9% 构建统一的服务治理框架,集成监控告警、日志追踪(如OpenTelemetry)、AB测试、灰度发布、故障自愈等运维能力。 4. 与算法团队紧密协作,推动模型结构适配、量化部署、缓存策略等端云联合优化方案落地。