通义通义实验室-技术专家-推理优化

社招全职3年以上技术类-开发2025-12-17地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1、计算机/人工智能相关专业硕士及以上学历，熟练掌握C++和Python编程语言，和软件工程面向对象设计（OOP，OOD）等相关技术， 有很好的抽象能力；
2、掌握性能优化方法论，能够快速定位系统瓶颈的原因，能够利用Roofline Model来计算IO、计算和带宽的理论极限，并用编程技术逼近极限；
3、…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、多模态模型的推理功能开发和性能优化，包括对Qwen-VL、Qwen-Audio、Qwen-Omni等多模态输入/输出模型的功能支持和推理性能优化；
2、分布式推理架构的研发，包括多机推理架构设计，P/D分离、A/F分离、VL模型分离架构的落地；
3、推理引擎服务化，包括推理引擎如何接入线上服务平台，自动扩缩容和可观测性的适配，以及提升线上服务稳定性。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

C+++

Python+

面向对象+

还有更多 •••

登录查看完整学习资料

相关职位

蚂蚁集团-GPU推理优化高级技术专家-杭州/北京/上海

社招7年以上技术类-开发

1、负责安全GPU推理引擎、GPU性能优化相关技术平台，解决安全大模型GPU部署的资源弹性、性能瓶颈问题 2、了解行业最新GPU、NPU等最技术优化方案以及在安全落地 3、带领团队完成Modelops平台相关项目管理，以及平台架构规划设计

更新于 2025-08-04杭州|北京|上海

【算法】AI工程架构专家（推理优化方向）

社招技术类

1. 负责开发和优化CV模型推理和大模型推理优化； 2. 持续优化推理服务性能，提升吞吐，降低延迟并优化整体成本； 3. 负责机器学习系统前瞻技术的调研和引入。

更新于 2023-12-26上海

蚂蚁集团-AI研发平台技术专家-杭州/上海/北京【数据平台】

社招3年以上技术类-开发

1. 支撑蚂蚁集团在各个业务领域的MLOps&LMOps算法研发工作，覆盖机器学习系统多个子方向领域的工作，包括：数据配比&全链路血缘建设、数据实验&分析、深度学习/大模型预训练/后训练/推理等，建设支持AI全链路的研发平台与AI垂类应用开发平台，实现算法研发效率、和资源利用率的最大化，灵活可扩展的支持不同领域的个性化应用开发需求，为蚂蚁大模型研发链路及应用研发探索新的研发模式； 2. 对平台进行全局性和前瞻性的架构设计和核心技术细节实现，帮助团队攻克各种技术难关，保障和提升平台稳定性。

更新于 2025-10-14北京|上海|杭州

阿里云智能-百炼模型服务运行时技术专家/高级专家-杭州/北京

社招4年以上云智能集团

1. 核心系统研发（1）设计与优化大模型推理服务框架与分布式缓存系统。（2）支持多推理引擎适配、多模态推理、分布式部署及高效数据管理。（3）开发工具链与服务化能力，包括模型量化、转换、调度与生命周期管理。 2. 性能与稳定性优化（1）优化推理服务框架的性能，包括引擎适配、生命周期管理和资源调度。（2）深入优化kvcache的显存、内存和存储管理、批处理、缓存策略和网络传输。（3）支持高性能通信协议、容错与负载均衡机制。（4）提升系统可观测性，完善监控、告警与故障恢复体系。 3. 引擎与应用集成（1）深度集成推理引擎、缓存系统和存储系统，优化访问模式与架构设计。（2）满足大规模、多模态推理场景下的高吞吐与低延迟需求。

更新于 2026-01-07北京|杭州