阿里云阿里云智能-技术服务经理TAM-公共云互联网KA客户-北京
任职要求
1. 2年以上泛娱乐、零售、金融、教育等行业大型互联网应用(含AI原生应用)或集团型企业应用的研发、架构设计、监控方案、Devops、AIops、维护、高可用改造方案经验。 2. 熟悉Agent开发框架及工具(LangChain/Dify/LlamaIndex/百炼等),模型推理框架(vLLM /sglang),模型训练框架(LlamaFactory、swift等),具备GPU集群调度、资源隔离、显存优化相关经验,能够解决大规模算力下的性能瓶颈与稳定性问题。 3. 熟悉主流大模型推理框架(如 vLLM, Triton Inference Server, TensorRT-LLM, TGI 等)。 4. 了解 NVIDIA GPU 底层架构及分布式通信机制(如 NVLink, NCCL, RDMA/RoCE 高速网络)。 5. 熟悉JAVA、Python、GO其中一门开发语言,熟悉常见中间件、数据库、大数据组件,如Redis、Nacos、K8s、Kafka、…
工作职责
岗位描述: 1. 企业级 AI Agent 工程落地指导 作为客户 AI 应用技术服务的第一责任人,深入理解客户业务场景与技术痛点,主导Agent等工程全链路落地服务:从 RAG 构建、知识库向量化、Prompt Engineering 调优,到多 Agent 协作编排、工具链集成与 Function Call调试,确保 AI Agent 在生产环境高效运行。 2. 大模型训练与推理全链路架构设计,负责从数据到模型端到端技术支持 数据侧:设计数据采集、清洗、标注流程,搭建高质量训练数据 Pipeline 训练侧:基于 PAI 平台进行模型微调(SFT/RLHF)、LoRA 适配、分布式训练集群调度 推理侧:优化推理性能(KV Cache、Flash Attention)、推理服务弹性伸缩、Tokens成本治理 3. AI 云原生稳定性保障 从客户架构视角出发,通过自动化巡检、AIOps 工具链推动问题主动发现与风险预防。构建 AI 云原生全链路可观测体系,覆盖 SaaS 层(百炼/通义)、PaaS 层(PAI/DashScope)、IaaS 层(GPU 实例/高速网络)。结合大模型业务的高并发、长文本等流量特征,制定 GPU 算力集群的弹性扩缩容策略。负责推理延迟优化、显存 OOM 治理、模型服务灰度发布、模型流量调度、算力混沌工程、故障快速定位与 RCA 沉淀。 4. 卓越架构护航从公共云企业客户的业务视角出发,基于云上卓越架构最佳实践,主导客户云系统的持续诊断与重构。围绕高性能、高可用、安全合规、运维提效与成本精细化管理五大维度,推动架构的标准化与现代化升级。攻坚 AI 基础设施与传统业务系统的异构集成难题。设计并落地云上弹性伸缩方案,确保大模型/AI 业务在云端环境下的无缝对接、平滑扩缩容与极致弹性。
1. 作为企业客户技术服务工作的第一责任人,深入了解客户业务场景,与客户的架构、开发、运维团队深入合作,梳理分析客户现有云产品及应用架构,围绕企业客户上云、云上业务设计稳定性优化方案,从云上监控,主动发现,灾难演练,业务快恢/降级方案,高可用架构改造等方面协助客户持续优化云上稳定性。 2. 与阿里云各团队充分合作,从客户架构视角出发进行问题处置、护航保障、风险治理,并沉淀输出最佳实践及工具产品,面向客户痛点主动进行专项高阶服务。 3. 追踪客户关键稳定性问题,持续协助客户治理并不断推动阿里云产品及服务的优化改进。
1.项目交付履约 • 混合云项目:作为项目交付履约的第一责任人,明确项目目标,统筹、组建项目交付资源,带领项目团队(原厂&生态)制定交付运维计划和方案,在项目预算范围内高质量完成履约交付及验收,并对客户的服务满意度负责; • 公共云项目:客户服务满意度一号位,项目管理一号位。与TAM协同完成客户全周期服务。具体包括:客户满意度维护,客户服务成本管控,重大保障项目管理,迁云搬站及大模型项目全周期规划与管理,制定和管理公共云项目目标、项目计划及里程碑,管理项目交付成本,保证项目高质量履约交付; • 项目交付全程管理、监督,对项目风险及问题进行预判、识别及诊断,并调动交付资源快速形成解决方案,主导重大问题攻坚并解决闭环。 2. 客户经营管理(混合云) • 作为交付服务1号位,以助力客户实现业务成功为目标,围绕关键客户形成稳定的服务资源,理解、响应已有客户需求,挖掘服务商机,做大服务规模,帮助经营单元与客户形成可持续的商业合作。 3. 售前支持 • 售前阶段判断、明确客户服务需求边界,识别项目潜在风险,评估交付成本,形成高质量可履约的服务SOW; • 配合BTE,按需协调技术服务资源进行必要的服务前置,通过服务方案提升产品+服务整体竞争力,促成赢单。 4. 售后运维及续约对接 • 在交付项目后期协助TAM/CRE统筹客户的日常运维,保障运维资源和质量,维护长期客情关系,跟进及促成运维服务续约。 5. 服务生态交付管理 • 组织服务生态伙伴完成项目交付,并对伙伴的项目交付质量进行评价。 6. 交付履约需求的反馈和跟进 • 在交付履约周期内识别收集客户界面关于产品、服务、流程规则等相关问题,并推动各相关部门持续改进优化,提升客户满意度。
伙伴规划和招募 • 识别所在区域/行业的目标伙伴群,招募高质量、高成长伙伴,制定BP/拓展计划 伙伴运营管理 • 基于区域市场特性及伙伴能力,明确伙伴业绩目标,对所负责伙伴的整体业绩、重点指标负责 • 与伙伴负责人、业务团队负责人合作设计和制定销售策略、业绩提升路径、伙伴解决方案升级等 • 推动合作伙伴投入相应资源以达成业务目标,包括人员投入、激励资源,市场资源(市场活动+拓新投入)等 • 负责合作伙伴整体运营管理,包含经营分析、业务review、重点战役及事项管理、市场投放、活动策划等 • 依据生态合作政策,有效进行生态品控/合规/信控管理,预防廉正等红线行为发生,提升业务安全性 伙伴销售赋能与项目落地 • 对合作伙伴销售进行常规的coach和项目review,进行客户分析、项目分析,并协调公司相关资源解决问题,提升伙伴商机转化和业绩达成能力 • 进行日常销售(包括电销、面销、售前)培训 • 带领和指导合作伙伴制定战略目标,规划业务重点和资源投入计划等对存量客户进行盘点和挖掘,并监督日常执行 客户跟进及项目管理 • 通过伙伴洞察客户需求,提供专业、及时的客户服务,帮助伙伴客户更好地使用阿里云产品和服务 • 与伙伴客户的关键人员建立长期的合作关系,提升客户满意度,并通过有效的资源整合和运作,推动实现客户的续签和Upsell • 与伙伴紧密沟通,快速响应伙伴客户问题和故障,协调内部资源以解决客户面临的问题 • 在AI、服务、运维、业务合作等多方面为伙伴客户提供体验升级 跨组织协作与影响力 • 协同内部团队(SA、TAM、伙伴运营等)构建和落地成功方法论。在内部建立跨组织关系,推动项目的落地 • 影响伙伴高层推动组织变革,构建成功案例证明合作伙伴赋能的商业价值
伙伴规划和招募 • 识别所在区域/行业的目标伙伴群,招募高质量、高成长伙伴,制定BP/拓展计划 伙伴运营管理 • 基于区域市场特性及伙伴能力,明确伙伴业绩目标,对所负责伙伴的整体业绩、重点指标负责 • 与伙伴负责人、业务团队负责人合作设计和制定销售策略、业绩提升路径、伙伴解决方案升级等 • 推动合作伙伴投入相应资源以达成业务目标,包括人员投入、激励资源,市场资源(市场活动+拓新投入)等 • 负责合作伙伴整体运营管理,包含经营分析、业务review、重点战役及事项管理、市场投放、活动策划等 • 依据生态合作政策,有效进行生态品控/合规/信控管理,预防廉正等红线行为发生,提升业务安全性 伙伴销售赋能与项目落地 • 对合作伙伴销售进行常规的coach和项目review,进行客户分析、项目分析,并协调公司相关资源解决问题,提升伙伴商机转化和业绩达成能力 • 进行日常销售(包括电销、面销、售前)培训 • 带领和指导合作伙伴制定战略目标,规划业务重点和资源投入计划等对存量客户进行盘点和挖掘,并监督日常执行 客户服务管理 • 通过伙伴洞察客户需求,提供专业、及时的客户服务,帮助伙伴客户更好地使用阿里云产品和服务 • 与伙伴客户的关键人员建立长期的合作关系,提升客户满意度,并通过有效的资源整合和运作,推动实现客户的续签和Upsell • 与伙伴紧密沟通,快速响应伙伴客户问题和故障,协调内部资源以解决客户面临的问题 • 在AI、服务、运维、业务合作等多方面为伙伴客户提供体验升级 跨组织协作与影响力 • 协同内部团队(SA、TAM、伙伴运营等)构建和落地成功方法论。在内部建立跨组织关系,推动项目的落地 • 影响伙伴高层推动组织变革,构建成功案例证明合作伙伴赋能的商业价值