logo of tongyi

通义通义实验室-多模态模型引擎专家-通义百聆

社招全职3年以上技术类-开发地点:北京 | 杭州状态:招聘

任职要求


1. 计算机科学、人工智能、软件工程或相关领域硕士及以上学历。 至少5年的AI平台开发经验。
2. 熟悉多种机器学习框架和工具(如 TensorFlowPyTorch、Hugging Face等),具备扎实的编程能力,精通 Pytho…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


通义实验室语音工程团队主要负责通义系列模型在语音及其他更广泛的多模态交互、理解场景下的优化、落地和应用。我们在阿里云上提供业界领先、开箱即用的模型服务API,支持全世界的开发者,以及阿里集团内如钉钉、淘天、夸克等30+业务线。我们同时也在和算法科学家们共同探索最前沿模型的能力边界,构建以多模态大模型为核心的新产品,向外展示通义的技术先进性和影响力。

1. 探索多模态理解与生成大模型的技术边界,支持多模态模型的功能迭代和推理性能优化。
2. 构建极致性能的实时流式输入/输出系统,提供百毫秒级别的端到端延迟体验。
3. 建设超低延迟、高可用、可扩展的分布式模型服务系统,通过提升模型吞吐和并发,提供最普惠的AI模型服务。
4. 分析和解决复杂的软硬件技术问题,跟踪行业最新的多模态大模型和应用开发工具和技术,将最佳实践和创新集成到平台中。
包括英文材料
学历+
机器学习+
TensorFlow+
PyTorch+
还有更多 •••
相关职位

logo of tongyi
社招3年以上技术类-开发

1、多模态模型的推理功能开发和性能优化,包括对Qwen-VL、Qwen-Audio、Qwen-Omni等多模态输入/输出模型的功能支持和推理性能优化; 2、分布式推理架构的研发,包括多机推理架构设计,P/D分离、A/F分离、VL模型分离架构的落地; 3、KVCache服务的研发和落地,包括KVCache的存储和传输、与推理引擎、存储等系统的集成,以及端到端的性能优化; 4、推理引擎服务化,包括推理引擎如何接入线上服务平台,自动扩缩容和可观测性的适配,以及提升线上服务稳定性。

更新于 2025-08-14北京|杭州
logo of tongyi
社招3年以上技术类-开发

1、设计并实现高性能AI原生网关。构建低延迟、高并发的API网关系统,支持多模态、多协议接入,为国内及全球客户提供灵活、安全、可扩展的流量接入方案,提供完整的数据面控制与可观测能力; 2、打造智能推理调度与资源管理系统。设计并实现面向复杂分布式推理场景的请求调度和资源调度系统,结合动态负载特征与异构硬件资源,持续优化请求分发策略;建设Serverless化资源调度架构,实现资源的弹性伸缩与极致利用率提升; 3、构建先进的MLOps平台能力。深度优化模型服务的CI/CD流程,推动算法研发到生产部署的自动化与标准化;实现模型版本管理、灰度发布、监控告警、性能分析等全生命周期管理能力,提升迭代效率与系统稳定性。

更新于 2025-11-06北京|杭州
logo of tongyi
社招5年以上技术类-开发

通义实验室工程团队致力于打造面向公众与企业的大规模、高性能在线 AI 服务平台,支撑了通义千问、通义万相及多种开源先进模型的在线服务,并推动 AI Agents、多模态应用、MCP 等前沿技术的产品化落地。团队持续攻克异构 GPU 资源调度、多模型多地域部署、多模态任务统一推理、多样化服务等级保障(SLO),以及模型推理全链路工程化的关键挑战,不断提升资源效能和系统的性能、稳定性。 1、结合LLM技术,设计和优化RAG全链路的基础架构,提升系统的吞吐能力和响应速度; 2、构建高性能,可扩展的分布式文件处理和索引构建系统,承载海量文档的知识库的索引和检索需求; 3、规划和优化检索集群,通过合理的分片,资源分配等策略降低延迟提高吞吐,针对业务场景进行服务优化; 4、建立完善的系统监控,日志分析和trace平台,能快速定位和解决系统问题。

更新于 2025-11-06北京|杭州
logo of tongyi
社招8年以上技术类-开发

1. 作为技术负责人,制定并推动多模态交互系统的端云整体工程架构演进路线,覆盖端侧推理、客户端集成、云端服务及协同策略。 2. 主导端侧AI推理框架的设计与优化,包括模型加载、算子加速、内存管理、功耗控制、异构计算(CPU/GPU/NPU)调度等,确保大模型在资源受限设备上的高效运行。 3. 负责Android客户端核心交互模块的架构设计与开发,包括多模态输入采集、实时通信、状态管理、离在线切换、异常恢复等关键能力。 4. 设计高并发、低延迟、可扩展的云端推理服务架构,支持语音识别、大模型生成、多模态融合等服务的弹性部署与动态扩缩容。 5. 构建端云协同机制,实现任务卸载、上下文同步、模型热更新、A/B测试等能力,提升系统整体鲁棒性与迭代效率。 6. 带领应用工程团队,负责关键技术方案评审、核心模块编码、性能压测、线上稳定性保障及团队技术能力建设。 7. 与算法、产品、芯片、测试及客户解决方案团队紧密协作,推动系统从原型验证到规模化商用落地。

更新于 2025-11-20北京|杭州