logo of aliyun

阿里云阿里云智能-AI大模型推理优化专家-杭州

社招全职5年以上云智能集团地点:杭州状态:招聘

任职要求


1. 扎实的专业基础与经验:计算机、人工智能或相关专业,5年以上AI大模型推理系统或性能优化方向工作经验,具备扎实的计算机体系结构知识和大模型技术理解。
2. 出色的工程与编程能力:精通C++/Python,熟练使用主流推理框架(如vLLM、SGLang、TensorRT-LLM)及性能分析工具,具备独立完成高性能模块开发与调优的能力。
3. 丰富的优化实战经验:在大模型推理、算子开发、模型压缩/量化、分布式部署与调度等方面有实际项目经验,熟悉GPU/AI加速库(如cuBLAS、cuDNN、Cutlass)及并行通信技术(如NVLink、模型/流水线并行)。
4. 系统性技术认知:深入理解深度学习算法原理与AI…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 主导大模型推理性能优化:通过算子优化、模型压缩/量化/稀疏化、推理引擎开发及分布式系统设计等技术手段,全面提升大模型在GPU/PPU等异构硬件上的推理速度、系统效率与部署性价比。
2. 开展软硬协同的深度调优:针对不同架构和规模的AI加速硬件(如GPU、专用AI芯片),对KV Cache管理、内存调度、计算图优化等核心模块进行定制化性能调优,突破算力与访存瓶颈。
3. 支撑多模态与前沿模型架构落地:参与大模型推理系统的核心模块研发,支持Transformer、MoE、Diffusion、LLM、VLM等多种架构的高性能推理,并与算法、产品及业务团队紧密协作,实现端到端场景优化。
4. 构建高性能AI基础设施:基于软硬件协同理念,打造业界优秀的AI推理底座,通过融合模型算法与底层硬件特性,释放组合优化潜力,形成显著的性能与成本优势。
5. 追踪和引领技术前沿:持续关注大模型推理领域的新研究成果与开源生态,推动技术创新与工程落地,发掘软硬结合的技术创新,强化技术壁垒与商业竞争力。
包括英文材料
大模型+
C+++
Python+
vLLM+
还有更多 •••
相关职位

logo of xiaohongshu
社招引擎

DirectLLM是小红书内部面向各业务场景建设的大模型API服务产品,通过标准化API接口提供LLM/MLLM等大模型推理服务,致力于为AI应用开发者提供品类丰富、数量众多的模型选择,并通过API接口为其提供开箱即用、能力卓越、成本经济的模型服务,各领域模型的能力均可通过统一的API和SDK来实现被不同业务系统集成。 工作职责: 1、参与/负责大模型推理服务平台(MaaS)的架构设计、系统研发、产品研发等工作; 2、深入参与面向大模型场景的请求调度、异构资源调度、引擎优化等核心工作,实现千亿级Token并行推理平台; 3、为内部产品线提供解决方案,协助公司内用户解决大模型应用过程中业务在平台上的使用问题。

北京|上海|深圳
logo of alibaba
社招3年以上技术类-开发

1. 负责大模型训练和推理系统的研发和性能优化,包括性能计算性能优化,大模型推理框架,大模型流量调度,高效 CUDA 算子开发,低精度计算,高并发服务请求优化等打造领先的推理引擎。 2. 负责大模型训练和推理等前瞻性技术架构的调研和引入,不限于子图匹配、编译优化、模型量化等。 3. 与算法团队深度合作,进行算法和系统的联合优化,包括分析业务性能瓶颈,通过软硬结合的 方式,高效部署和优化 AIGC 核心业务模型,建设 AI 工具链等能力,支撑 AI 业务的高速发展。

更新于 2025-12-29杭州
logo of alibaba
社招2年以上技术类-算法

【职位描述】: 1、负责AI产品开发与应用:围绕外贸商品构建B类商品模型、AI发品、负向治理等能力; 2、技术能力:电商领域多模态大模型,包括从监督微调(SFT)到强化学习人类反馈(RLHF)的全链路技术构建,以及智能Agent系统,涵盖但不限于检索增强生成(RAG)系统、Agent系统和工作流推理等。 3、推动跨境电商AI创新业务的落地实施,包括高效的商品AI大模型、AI发品和诊断Agent等解决方案。 4、开展前沿LLM技术的探索,持续迭代和优化自研模型能力,以支持AI原生产品的实施。

更新于 2026-01-23杭州
logo of aliyun
社招5年以上云智能行业解决方

1、深入理解客户业务需求,帮助客户选择适合其业务场景的技术路径和产品组合,利用AI技术知识、架构方法、咨询技能来影响客户技术决策 2、与客户合作进行模型训练、推理和模型应用等POC,含展示功能、调整模型、优化模型性能、测试分析、Agent搭建、模型调用等内容 3、依据客户需求和技术研判,推动产研部门持续优化产品,助力提升产品竞争力,同时沉淀最佳实践,以及脚本、模板、参考架构等可复用的技术资产 4、持续跟踪行业动态和技术趋势,并与产品团队协作,打造创新的人工智能(大模型、智算、一体机等)解决方案 5、支持市场活动,作为领域专家参与市场洞察、行业标准、市场排名报告、白皮书撰写等活动,并在行业峰会、技术沙龙等市场活动中进行技术传播和分享

更新于 2025-06-16北京|杭州|上海