logo of aliyun

阿里云阿里云智能-百炼模型服务运行时技术专家/高级专家-杭州/北京

社招全职4年以上云智能集团地点:北京 | 杭州状态:招聘

任职要求


1. 必备技能
(1)扎实的 C++/Python 编程功底,具备模块化设计能力。
(2)大模型推理框架(vLLM/SGLang等)经验,理解模型推理原理。
(3)分布式系统开发经验,熟悉缓存、微服务与容器化技术。
(4)Linux、C…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 核心系统研发
(1)设计与优化大模型推理服务框架与分布式缓存系统。
(2)支持多推理引擎适配、多模态推理、分布式部署及高效数据管理。
(3)开发工具链与服务化能力,包括模型量化、转换、调度与生命周期管理。
2. 性能与稳定性优化
(1)优化推理服务框架的性能,包括引擎适配、生命周期管理和资源调度。
(2)深入优化kvcache的显存、内存和存储管理、批处理、缓存策略和网络传输。
(3)支持高性能通信协议、容错与负载均衡机制。
(4)提升系统可观测性,完善监控、告警与故障恢复体系。
3. 引擎与应用集成
(1)深度集成推理引擎、缓存系统和存储系统,优化访问模式与架构设计。
(2)满足大规模、多模态推理场景下的高吞吐与低延迟需求。
包括英文材料
C+++
Python+
大模型+
vLLM+
SGLang+
分布式系统+
还有更多 •••
相关职位

logo of aliyun
社招5年以上云智能集团

1. 负责百炼Agent应用层infra对接阿里云的建设,包括AgentScope运行时以及工具沙箱和阿里云云资源和云服务的对接、Agent部署、和算法适配。 2. 负责百炼Agent在阿里云和企业场景效果的调优。 3. 从阿里云数据源开始,为Agent服务的Data Connector体系的设计和建设。 4. 形成系统的Agent评测体系,沉淀为Reward Model. 5. 负责Agent RL/Tuning相关的算法和工程链路、数据反馈链路的构建。 6. 负责更加通用的Agent调优机制的设计,融入百炼Agent智能体创建流程。 7. 负责阿里云或者企业场景中相关平台算法feature的落地。

更新于 2025-11-12北京|杭州|上海
logo of aliyun
社招5年以上诚云科技

1、负责线下算力资源交付方案设计和落地实施,解决部署过程中遇到的软硬件兼容性和性能问题。 2、负责大模型交付方案设计和落地实施,解决部署过程中遇到的模型兼容性和性能问题。 3、负责Agent方案设计和落地实施,包括但不限于业务架构设计、智能体搭建、提示词工程、RAG和全链路优化等。 4、负责通义大模型和相关产品运维过程中的疑难问题排查、版本升级和性能诊断。

更新于 2025-12-04西安|北京|深圳
logo of aliyun
社招3年以上诚云科技

1、负责线下算力资源交付方案设计和落地实施,解决部署过程中遇到的软硬件兼容性和性能问题。 2、负责大模型交付方案设计和落地实施,解决部署过程中遇到的模型兼容性和性能问题。 3、负责Agent方案设计和落地实施,包括但不限于业务架构设计、智能体搭建、提示词工程、RAG和全链路优化等。 4、负责通义大模型和相关产品运维过程中的疑难问题排查、版本升级和性能诊断。

更新于 2025-12-04北京|杭州|广州
logo of aliyun
社招3年以上诚云科技

主要负责百炼管控层的设计开发工作,包括: 1、负责百炼数据层能力的设计和开发工作,包括多种异构数据(结构化/半结构化/非结构化、多模态等)接入和加工处理、安全管控等,为模型层和Agent层提供安全、合规、高效的数据获取和加工能力; 2、设计实现用户数据到百炼模型服务(调优、评测等)、Agent(RAG、Workflow、轻应用等)等场景的供给方案; 3、设计实现各类文档数据解析及处理方案; 4、设计实现通用数据加工方案,及各类数据处理算子能力; 5、其他百炼相关功能模块的设计开发; 6、面向用户的企业级API接口设计及实现。

更新于 2025-11-24北京|杭州