通义通义实验室-云端推理服务技术专家-北京/杭州

社招全职3年以上技术-基础平台2026-06-08地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1.  计算机科学、软件工程或相关专业硕士及以上学历，3年以上后端/云服务/推理平台开发经验。
2.  精通Go/Python/C++至少一种语言，具备扎实的系统编程和高并发服务开发能力。
3.  熟悉主流推理框架（如Triton Inference Server、…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.  设计并构建面向多模态交互（语音、视觉、语言、上下文融合）的云端推理服务平台，支持Omni/Speech/VL等大模型的在线/近线推理。
2.  主导端云协同架构中云端服务模块的技术方案，包括模型服务化（Model Serving）、动态批处理（Dynamic Batching）、请求调度、弹性扩缩容、负载均衡等关键能力。
3.  优化云端推理链路的延迟、吞吐与资源利用率，针对ToB客户对SLA（如99.9% 构建统一的服务治理框架，集成监控告警、日志追踪（如OpenTelemetry）、AB测试、灰度发布、故障自愈等运维能力。
4.  与算法团队紧密协作，推动模型结构适配、量化部署、缓存策略等端云联合优化方案落地。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

Go+

Python+

C+++

高并发+

还有更多 •••

登录查看完整学习资料

相关职位

通义实验室-云端推理服务技术专家-北京/杭州

社招3年以上技术-基础平台

1. 设计并构建面向多模态交互（语音、视觉、语言、上下文融合）的云端推理服务平台，支持Omni/Speech/VL等大模型的在线/近线推理。 2. 主导端云协同架构中云端服务模块的技术方案，包括模型服务化（Model Serving）、动态批处理（Dynamic Batching）、请求调度、弹性扩缩容、负载均衡等关键能力。 3. 优化云端推理链路的延迟、吞吐与资源利用率，针对ToB客户对SLA（如99.9% 构建统一的服务治理框架，集成监控告警、日志追踪（如OpenTelemetry）、AB测试、灰度发布、故障自愈等运维能力。 4. 与算法团队紧密协作，推动模型结构适配、量化部署、缓存策略等端云联合优化方案落地。

更新于 2026-04-03北京|杭州

通义实验室-应用工程资深技术专家-北京/杭州

社招8年以上技术类-开发

1. 作为技术负责人，制定并推动多模态交互系统的端云整体工程架构演进路线，覆盖端侧推理、客户端集成、云端服务及协同策略。 2. 主导端侧AI推理框架的设计与优化，包括模型加载、算子加速、内存管理、功耗控制、异构计算（CPU/GPU/NPU）调度等，确保大模型在资源受限设备上的高效运行。 3. 负责Android客户端核心交互模块的架构设计与开发，包括多模态输入采集、实时通信、状态管理、离在线切换、异常恢复等关键能力。 4. 设计高并发、低延迟、可扩展的云端推理服务架构，支持语音识别、大模型生成、多模态融合等服务的弹性部署与动态扩缩容。 5. 构建端云协同机制，实现任务卸载、上下文同步、模型热更新、A/B测试等能力，提升系统整体鲁棒性与迭代效率。 6. 带领应用工程团队，负责关键技术方案评审、核心模块编码、性能压测、线上稳定性保障及团队技术能力建设。 7. 与算法、产品、芯片、测试及客户解决方案团队紧密协作，推动系统从原型验证到规模化商用落地。

更新于 2026-04-03北京|杭州

通义实验室-应用工程资深技术专家-北京/杭州

社招8年以上技术类-开发

更新于 2026-04-03北京|杭州

通义实验室-具身智能大模型与机器人工程专家-北京/杭州

社招5年以上技术类-算法

工程岗位的职责包括以下至少一个或多个方向： 1. 具身机器人应用解决方案研发（1）参与多模态/具身智能机器人在真实场景中的应用方案设计、系统集成与验证。（2）搭建端到端具身机器人任务pipeline，包括感知、理解、规划、控制、执行等模块的工程化实现。（3）推动具身智能大模型能力在机器人实际任务中的落地优化（如操作、导航、交互等）。 2. 具身大模型数据采集与处理（1）负责机器人数据采集系统搭建，包括传感器标定、采集流程、数据质量控制与自动化工具链。（2）建设具身大模型训练数据pipeline：数据清洗、切分、标注、同步、增强、格式转换等工程化流程。（3）参与构建多模态数据集（视频、RGB-D、触觉、关节状态、语言指令等）。 3. 具身大模型云端训练与推理优化（1）基于GPU/加速器的训练平台优化具身大模型训练性能（并行策略、数据流优化、算子优化）。（2）负责推理引擎优化，包括模型裁剪、编译器优化、图优化、缓存管理、多线程并发调度等。（3）参与构建具身智能模型的训练与推理服务基础设施（MLOps、分布式训练、数据版本管理等）。 4. 端侧模型量化部署与优化（1）主导端侧模型的压缩、量化（INT8/FP8/混合精度等）、剪枝、蒸馏等部署优化工作。（2）熟悉ONNXRuntime、TensorRT、TFLite、NPU/DSP编译工具链，进行端侧加加速与算子调优。（3）推动具身大模型在机器人嵌入式/边缘计算平台上的高效部署。 5. 机器人操作系统与系统优化（1）优化机器人操作系统（ROS2、RTOS、Linux）性能，包括实时性、通信延迟、资源调度、驱动层稳定性等。（2）推动机器人软硬件协同优化，包括传感器驱动、控制链路优化、系统级profiling/debugging。（3）支撑机器人任务的稳定运行与系统级可靠性优化。

更新于 2026-03-26北京|杭州