通义通义实验室-技术专家-语音引擎系统开发
任职要求
1. 拥有计算机及相关专业本科及以上学历,5年以上 Python/C/C++ 项目开发经验。 2. 精通数据结构和算法设计。 3. 有CPU、GPU性能调优、定点量化等经验者优先。 4…
工作职责
1. 负责与语音大模型算法同学合作,将大模型TTS、ASR、Music、Audio等相关算法模型工程。 2. 负责服务端和移动端的大模型语音能力原型实现、性能优化等。 3. 与sdk和服务端同学合作,将算法引擎落地到各条业务线,如百炼、智能语音交互平台等。
阿里国际内部集大模型研究及智能化前沿产品研发于一体的AI部门;自研面向跨境商贸增强的多语言大模型-Marco和多模态大模型-Ovis,依托全球化的AI基础设施和算力资源,帮助AliExpress、Lazada、阿里巴巴国际站、Trendyol、Daraz 等平台全面革新跨境电商全链路的经营体验和商业效率;目前已服务超50万商家,平均日调用量已突破10亿次,覆盖营销、客户服务、商品发布、设计、合规等60+应用场景;正在基于自研的大模型与工程技术,打造新一代的智能体(Agent)和智能引擎(Deep Research)产品,持续致力于让全球商业没有语言障碍,用智能帮助跨境贸易更加简单。 该职位负责构建高性能、可扩展的搜索引擎工程架构,优化搜索效果,支持多模态搜索能力,打造行业领先的搜索产品; 工作职责 1、负责搜索引擎相关系统研发,打造高性能、低成本、多场景的搜索产品 2、设计并实现搜索系统分布式架构,确保系统的高可用性、高性能和可扩展性 3、构建支持多模态(文本、图像、视频)检索的搜索系统架构,推动多模态搜索能力落地 4、负责搜索服务端的开发工作,优化索引构建、查询处理等核心环节 5、与算法团队紧密协作,将搜索算法能力高效集成到工程系统中,实现搜索效果持续优化 6、构建搜索效果评估体系,设计A/B测试框架,通过数据驱动方式持续提升搜索质量 7、保障搜索系统的稳定性与性能,解决高并发、大规模数据处理等工程挑战,支撑复杂业务场景
1. 作为技术负责人,制定并推动多模态交互系统的端云整体工程架构演进路线,覆盖端侧推理、客户端集成、云端服务及协同策略。 2. 主导端侧AI推理框架的设计与优化,包括模型加载、算子加速、内存管理、功耗控制、异构计算(CPU/GPU/NPU)调度等,确保大模型在资源受限设备上的高效运行。 3. 负责Android客户端核心交互模块的架构设计与开发,包括多模态输入采集、实时通信、状态管理、离在线切换、异常恢复等关键能力。 4. 设计高并发、低延迟、可扩展的云端推理服务架构,支持语音识别、大模型生成、多模态融合等服务的弹性部署与动态扩缩容。 5. 构建端云协同机制,实现任务卸载、上下文同步、模型热更新、A/B测试等能力,提升系统整体鲁棒性与迭代效率。 6. 带领应用工程团队,负责关键技术方案评审、核心模块编码、性能压测、线上稳定性保障及团队技术能力建设。 7. 与算法、产品、芯片、测试及客户解决方案团队紧密协作,推动系统从原型验证到规模化商用落地。

1. 作为技术负责人,制定并推动多模态交互系统的端云整体工程架构演进路线,覆盖端侧推理、客户端集成、云端服务及协同策略。 2. 主导端侧AI推理框架的设计与优化,包括模型加载、算子加速、内存管理、功耗控制、异构计算(CPU/GPU/NPU)调度等,确保大模型在资源受限设备上的高效运行。 3. 负责Android客户端核心交互模块的架构设计与开发,包括多模态输入采集、实时通信、状态管理、离在线切换、异常恢复等关键能力。 4. 设计高并发、低延迟、可扩展的云端推理服务架构,支持语音识别、大模型生成、多模态融合等服务的弹性部署与动态扩缩容。 5. 构建端云协同机制,实现任务卸载、上下文同步、模型热更新、A/B测试等能力,提升系统整体鲁棒性与迭代效率。 6. 带领应用工程团队,负责关键技术方案评审、核心模块编码、性能压测、线上稳定性保障及团队技术能力建设。 7. 与算法、产品、芯片、测试及客户解决方案团队紧密协作,推动系统从原型验证到规模化商用落地。