logo of aligenie

智能互联阿里云智能-百炼模型推理服务技术专家-北京/杭州

社招全职3年以上地点:北京 | 杭州状态:招聘

任职要求


1. 计算机/人工智能相关专业硕士及以上学历,熟练掌握C++Python编程语言,和软件工程面向对象设计(OOP,OOD)等相关技术, 有很好的抽象能力。
2. 掌握性能优化方法论,能够快速定位系统瓶颈的原因,能够利用Roofline Model来计算IO、计算和带宽的理论极限,并用编程技术逼近极限。
3. …
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 多模态模型的推理功能开发和性能优化,包括对Qwen-VL、Qwen-Audio、Qwen-Omni等多模态输入/输出模型的功能支持和推理性能优化。
2. 分布式推理架构的研发,包括多机推理架构设计,P/D分离、A/F分离、VL模型分离架构的落地。
3. 推理引擎服务化,包括推理引擎如何接入线上服务平台,自动扩缩容和可观测性的适配,以及提升线上服务稳定性。
包括英文材料
学历+
C+++
Python+
面向对象+
还有更多 •••
相关职位

logo of aliyun
社招3年以上云智能集团

1. 多模态模型的推理功能开发和性能优化,包括对Qwen-VL、Qwen-Audio、Qwen-Omni等多模态输入/输出模型的功能支持和推理性能优化。 2. 分布式推理架构的研发,包括多机推理架构设计,P/D分离、A/F分离、VL模型分离架构的落地。 3. 推理引擎服务化,包括推理引擎如何接入线上服务平台,自动扩缩容和可观测性的适配,以及提升线上服务稳定性。

更新于 2026-01-19北京|杭州
logo of aliyun
社招4年以上云智能集团

负责阿里云产品安全能力前沿技术的探索与落地,包括但不限于以下方向: 1. AI应用安全:为阿里云内部平台及“百炼”大模型平台构建并完善AI应用所需的基础安全能力,保障AI应用从训练到推理全流程的安全性; 2. Confidential AI(机密AI):参与机密计算(Confidential Computing)基础架构及核心组件的设计、开发与运维,支持客户及内部服务实现 Confidential AI 功能。

更新于 2026-01-04北京|杭州
logo of aliyun
社招1年以上技术类-开发

1. 系统架构与工程落地 ● 负责AI Agent框架设计与实现,构建高可用、低延迟的AI Agent生产环境,支持百万级以上用户量的应用、部署平台 ● 负责智能体知识库、流程编排等功能开发,对接头部等流量等载体的接口,输出能力 ● 开发LLM应用基础设施,包括RAG 技术、Agent开发框架(如LangChain) MCP 协议等 ● 优化Agent与工具调用的协同机制,提升任务规划、自主决策和交互体验 ● 探索大模型与Agent技术的结合,解决复杂场景下的推理能力 2. 业务场景适配与创新 ● 推动AI Agent在搜索、营销、服务、DevOps运维等领域的落地 ● 设计符合行业需求的解决方案,如应用导购助理、客服助手、智能编程助手 ● 负责AI项目的推动落地,行业类Agent开发以及行业类RAG系统的架构设计与研发。 ● 负责技术预研、架构设计、业务模型抽象及功能开发保持对业务场景的敏锐洞察,快速熟悉业务流程并理解业务痛点,沟通并分析产品需求,制定技术方案,设计与研发核心系统及模块,推动产品快速迭代。

更新于 2025-05-28北京
logo of aliyun
社招3年以上云智能集团

团队介绍 我们是阿里云智能集团飞天实验室团队,致力于通过技术创新和工程实践推动前沿AI技术的落地与应用。团队聚焦于模型服务的基础研发,覆盖从底层架构设计到上层业务支持的全链路开发工作。我们的目标是打造业界最出色、成本最低、效率最高、规模最大、稳定、易用的模型服务平台,支撑大规模AI模型的研发、部署与推理极致优化,助力企业级AI应用的快速发展。 岗位职责 1. 负责大规模语言基础模型、多模态模型、文生图、视频生成模型等AI能力的产品化落地工作; 2. 主要负责通义千问多端核心应用的构建,支持最新模型能力的落地; 3. 支持百炼大模型开发平台上应用组件、场景化应用的开发和落地。

更新于 2025-11-20杭州