阿里云阿里云智能-技术服务专家（AI全栈）-金融行业-北京/上海/广州/深圳/成都/西安

社招全职3年以上云智能集团2025-12-01地点：西安 | 成都 | 北京 | 深圳 | 广州 | 上海状态：招聘

扫码手机上打开

任职要求

1. 计算机通信或相关专业本科及以上学历，有XPU硬件适配和大模型底层软硬件工程落地交付工作经验；
2. 熟悉PyTorch或TensorFlow等机器学习框架，了解张量、梯度等的基本数据结构和前后向传播原理；
3. 熟悉大模型推理框架vLLM、SGLang等业界主流推理引擎。
4. 熟悉XPU虚拟化和RDMA网络，了解虚拟化和资源分配与调度工作原理，了解RDMA主…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 负责大模型运行所需的XPU相关软硬件平台的适配和优化工作，解决适配和优化过程中的兼容性、系统性能、稳定性、高可用等方面的技术问题；
2. 为客户提供XPU相关软硬件平台交付方案设计和部署落地服务，聚焦算力资源评估、底层软件选型、训推环境搭建、训推性能优化、大模型评测等领域为客户提供最佳实践和落地能力；
3. 为客户提供XPU算力资源池相关的高性能网络技术选型、规划设计、交付部署和性能优化服务，解决XPU、整机、POD接入和组网过程中的控制与转发技术问题；
4. 为客户提供训练数据集构建、数据合成、模型后训练、模型效果评测等服务。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

大模型+

PyTorch+

TensorFlow+

机器学习+

数据结构+

vLLM+

SGLang+

推理引擎+

还有更多 •••

登录查看完整学习资料

相关职位

诚云科技-技术服务专家-全栈AI

社招5年以上诚云科技

1、负责线下算力资源交付方案设计和落地实施，解决部署过程中遇到的软硬件兼容性和性能问题。 2、负责大模型交付方案设计和落地实施，解决部署过程中遇到的模型兼容性和性能问题。 3、负责Agent方案设计和落地实施，包括但不限于业务架构设计、智能体搭建、提示词工程、RAG和全链路优化等。 4、负责通义大模型和相关产品运维过程中的疑难问题排查、版本升级和性能诊断。

更新于 2026-01-22西安|北京|深圳

阿里云智能-技术服务专家-AI汽车行业-北京

社招3年以上云智能集团

1、作为汽车行业客户技术服务工作的第一责任人，服务汽车行业重点客户，深入理解客户的业务场景与技术架构，与客户的架构、开发，AI及运维团队紧密协同，全面评估其现有云上应用架构与产品使用现状，围绕稳定性、可观测性与成本效能，设计并推动落地高可用、高韧性、高易用的云上优化方案。覆盖领域包括但不限于：云原生监控体系建设、风险主动发现机制、混沌工程与容灾演练、业务快速恢复与降级策略、微服务架构演进、FinOps成本治理，Agentic应用及高可用架构重构等。 2、联动阿里云内部产品、研发、解决方案及技术服务团队，以客户架构视角驱动问题闭环、重大活动护航、风险治理与架构治理，沉淀可复用的最佳实践、方法论及工具产品，主动识别客户痛点并开展高阶专项服务。 3、持续追踪客户关键稳定性问题，推动根因分析与长效治理机制建设，并反哺阿里云产品与服务体系的持续优化与能力升级。 4、主导和参与客户上云技术咨询，云原生架构改造，AI原生架构的设计和规划，并能指导客户实现迁移上云，AI上云，突出云+AI的技术能力。

更新于 2025-11-25北京

阿里云智能-技术服务专家（AI云搬栈）-杭州

社招5年以上云智能集团

存量技术栈盘点与目标架构设计 • 通过对存量技术栈进行调研、盘点探查存量应用与数据系统的架构与基础资源； • 确保盘点结果的准确性，包括应用、数据组件版本、架构，各模块之间的耦合度、依赖关系、性能瓶颈以及扩展能力，发现存量架构的问题了解客户的核心驱动； • 基于盘点结果与存量技术栈清晰认知，设计目标技术栈架构，结合业务需求与技术趋势对应用架构与数据架构进行升级，更好的支撑上云后的业务发展应用、数据、AI 全栈迁移方案设计与验证 • 基于存量技术栈与目标架构调研结果设计全栈迁移方案，明确应用、元数据、数据、离线/实施作业、调度等迁移与校验方案，平台割接与回滚方案。 • 结合客户具体应用、数据、AI应用技术栈版本特性验证迁移方案可行性 • 制定迁移计划与关键里程碑，基于存量数据、应用盘点明细、组件和数据依赖关系、迁移方案，设计迁移计划以及关键里程碑；数据库国产化、应用、大数据与AI迁移实施与业务一致性、连续型保障 • 迁移上云实施，负责现场客户存量数据、作业、应用具体的同步、改造与校验工作，基于迁移工具或者产品自身能力实现存量技术栈元素到目标技术栈的迁移实施 • 作为应用、数据技术专家，解决迁移过程中的技术问题，帮助客户用户阿里云产品，解决源端技术栈与目标产品的兼容性、性能优化等问题 • 基于存量业务依赖分析，模块交互逻辑，明确客户迁移北极星指标，保证迁移后核心指标一致性，对与关键应用接口、数据服务以及报表进行一致性校验 • 结合架构、迁移方案以及各个模块依赖、数据血缘关系，分析双端差异，找到问题快速迭代推动双端平台差异收敛，达到割接标准 • 基于割接方案，协助客户进行数据、应用生产环境切换，保证客户在线业务的连续性，并持续观察支持用户新环境稳定运行方案沉淀、上云工具建设 • 基于迁移交付项目沉淀应用、数据库、大数据、AI应用的迁移上云方案，形成不同场景与技术栈上云最佳实践 • 设计迁移工具技术架构，编写代码通过工具自动化迁移过程，降低复杂架构下应用、数据、AI上云门槛，并提高迁移效率 • 结合方案与工具形成行业化、不同技术栈组合的解决方案，支持前线业务更好的售卖打单，通过迁移案例、技术方案与自动化工具配合前线进攻应用、数据专家技术服务 • 作为阿里云高级技术服务专家，为客户提供阿里云应用、中间件、数据库、大数据产品技术栈最佳实践、提供解决方案咨询、架构优化、容灾高可用等商业化服务； • 结合客户用云场景，通过工具、赋能、咨询等方式帮助客户提升云产品运维与使用技能，提供应用、大数据高可用、容灾等综合技术服务，帮助客户用好云

更新于 2025-11-21杭州

阿里云智能-技术服务专家-AI汽车行业-深圳/广州

社招3年以上云智能集团

1、深入理解客户的业务场景与技术架构，与客户的架构、开发及运维团队紧密协同，全面评估其现有云上应用架构与产品使用现状，围绕稳定性、可观测性与成本效能，设计并推动落地高可用、高韧性、高易用的云上优化方案。覆盖领域包括但不限于：云原生监控体系建设、风险主动发现机制、混沌工程与容灾演练、业务快速恢复与降级策略、微服务架构演进、FinOps成本治理及高可用架构重构等。 2、联动阿里云内部产品、研发、解决方案及技术服务团队，以客户架构视角驱动问题闭环、重大活动护航、风险治理与架构治理，沉淀可复用的最佳实践、方法论及工具产品，主动识别客户痛点并开展高阶专项服务。 3、持续追踪客户关键稳定性问题，推动根因分析与长效治理机制建设，并反哺阿里云产品与服务体系的持续优化与能力升级。 4、主导或深度参与客户云上架构改造项目的落地实施，通过架构调优、资源治理与技术选型，持续提升系统性能、业务连续性与资源使用效率，实现“稳、快、省”的云上运营目标。

更新于 2026-01-20深圳|广州