通义通义实验室-技术交付专家-语音实验室
任职要求
1. 计算机科学、人工智能、机器学习或相关专业硕士研究生及以上学历。 2. 至少5年的直接参与软件开发、产品交付、客户技术和项目管理相关经验,有AI相关产品运营或开发经验优先。 3. 良好的沟通和项目管理能力,能够有效地与团队成员和跨部门合作伙…
工作职责
1. 技术咨询与支持,解决客户在产品选型、SDK接入、效果评估等不同阶段的研发、算法问题。 2. 需求分析与产品优化,识别客户高频共性问题,主导形成标准化解决方案并推动上线。 3. KA客户保障,主动预判潜在风险,协同跨团队解决重大卡点问题,确保客户业务顺利落地。 4. 承担实验室重点项目的项目管理工作,和包括售前、售后在内的产品运营相关工作。
工作职责: 1. 产品规划与路线设计:深度调研不同场景下的语音AI产品需求,结合语音AI技术演进与行业发展趋势,制定TTS产品、语音翻译产品的短中长期路线图,明确核心能力优先级、场景落地顺序及资源投入节奏。 2. 功能设计与优化:主导语音AI产品核心功能的设计与迭代,包括但不限于:TTS方向的音色库建设、语音效果优化、交互体验设计;语音翻译方向的翻译引擎优化、交互体验设计、场景化功能定制,持续提升产品在不同场景下的用户体验。 3. 跨团队协同与项目推进:作为语音AI产品落地的核心协调者,联动算法、工程、业务及测试团队,明确各环节交付标准与时间节点,解决跨部门协作中的技术瓶颈与需求冲突,确保产品在各场景顺利落地。 4. 行业动态与竞品分析:跟踪国内外语音AI技术与产品的发展动态(如新型算法、前沿应用场景、竞品功能与策略等),定期输出分析报告,为产品策略调整提供依据,确保公司语音AI产品的竞争力。
1. 设计并构建面向多模态交互(语音、视觉、语言、上下文融合)的云端推理服务平台,支持Omni/Speech/VL等大模型的在线/近线推理。 2. 主导端云协同架构中云端服务模块的技术方案,包括模型服务化(Model Serving)、动态批处理(Dynamic Batching)、请求调度、弹性扩缩容、负载均衡等关键能力。 3. 优化云端推理链路的延迟、吞吐与资源利用率,针对ToB客户对SLA(如99.9% 构建统一的服务治理框架,集成监控告警、日志追踪(如OpenTelemetry)、AB测试、灰度发布、故障自愈等运维能力。 4. 与算法团队紧密协作,推动模型结构适配、量化部署、缓存策略等端云联合优化方案落地。

1. 设计并构建面向多模态交互(语音、视觉、语言、上下文融合)的云端推理服务平台,支持Omni/Speech/VL等大模型的在线/近线推理。 2. 主导端云协同架构中云端服务模块的技术方案,包括模型服务化(Model Serving)、动态批处理(Dynamic Batching)、请求调度、弹性扩缩容、负载均衡等关键能力。 3. 优化云端推理链路的延迟、吞吐与资源利用率,针对ToB客户对SLA(如99.9% 构建统一的服务治理框架,集成监控告警、日志追踪(如OpenTelemetry)、AB测试、灰度发布、故障自愈等运维能力。 4. 与算法团队紧密协作,推动模型结构适配、量化部署、缓存策略等端云联合优化方案落地。
1. 主导面向ToB场景的Android端多模态交互系统架构设计与核心模块开发,包括语音采集/播放、摄像头控制、传感器融合、UI响应、状态管理等。 2. 与AI算法团队紧密协作,高效集成语音识别(ASR)、语音合成(TTS)、视觉理解(CV)、大语言模型(LLM)等端侧推理模块,优化模型加载、推理调度与资源协同策略。 3. 设计并实现低延迟、高并发的双工对话通道,支持实时打断、动态判停、上下文感知等高级交互能力在端侧的稳定运行。 4. 构建可扩展、可配置的SDK或中间件,支持多行业客户(如车企、手机厂商、IoT设备商)的快速接入与定制化需求。 5. 参与端云协同架构设计,在保障本地交互流畅性的同时,确保数据传输、存储与处理符合GDPR、CCPA、中国《个人信息保护法》等国内外隐私合规要求。 6. 深度集成系统级安全能力,包括应用权限管控、敏感操作审计、安全启动验证、密钥管理及安全OTA升级机制,提升端侧整体安全水位。