蚂蚁金服蚂蚁集团-语音算法专家-杭州/北京
任职要求
1. 计算机科学、电子信息、语音等相关专业本科及以上学历,2年以上人工智能算法相关工作经验; 2. 对语音方向有浓厚兴趣,熟悉语音领域的前沿技术,精通语音识别或语音合成至少一个领域;在相关领域期刊/会议(如ICASSP、InterSpeech等)发表过文章者优先; 3. 语音识别方向:精通语音识…
工作职责
1. 面向蚂蚁集团AGI产品研发语音相关能力,助力蚂蚁集团基于大模型的智能交互业务发展; 2. 探索并落地前沿的语音算法技术,方向包括但不限于语音识别、语音合成、语音克隆等; 3. 负责和承接蚂蚁集团数十个场景中涉及的语音识别、语音合成的算法能力建设。
1. 需求分析与产品规划: -深入调研开发者、企业客户及行业需求,深入理解各种模型能力,定义大模型开发平台的核心功能(如工作流、Prompt工程、RAG增强、Agent框架等),并可以基于开发平台构建 AI 效果领先的垂直场景/行业解决方案; -制定所负责产品或模块的 Roadmap,平衡技术前瞻性与商业化落地节奏。 2. 产品全生命周期管理: -主导功能设计,输出PRD、原型及交互文档,推动算法、工程团队高效交付,协同运营、销售等团队应对和总结客户需求; -负责产品上线后的迭代优化,基于用户反馈和数据洞察持续提升产品体验。 3. 跨团队协作与生态建设: -协同运营团队,推动开发者生态建设,提升平台活跃度与开发者粘性。 4. 行业洞察与竞争分析: -跟踪国内外大模型平台产品动态,制定差异化竞争策略。
岗位职责: 该职位通过大模型训练、Agent、RAG、N2SQL、NLP、语音处理等技术创新和突破,构建Agent通用平台、大模型训练平台等工具产品,同时支持对话机器人等垂直应用及智能产品的建设。欢迎敢于接受挑战的候选人加入我们,一起赋能企业客户。我们的研究方向包括但不限于: 1、通用大模型、推理大模型预训练、微调、强化对齐等技术的持续研究创新; 2、多语言大模型、领域大模型的训练技术研究与落地; 3、AI数据清洗、加工、合成、自动标注技术研究与落地; 4、文本机器人、语音机器人、质检机器人等客服域技术的研发与落地; 5、多Agent、RAG、N2SQL、自主决策等技术的研究与落地; 6、入呼大模型机器人、外呼大模型机器人研发经验;熟悉VAD, ASR, TTS等语音相关技术; 以上方向擅长其中1个即可
1. 构建文本、图像、视频、语音等多模态RAG系统及多模态大模型应用技术架构,打造极致产品体验,攻克关键技术难点,设计合理创新的技术方案,并推动落地; 2. 搭建基于大模型的智能体核心系统,实现任务规划、工具调用、多智能体协作等模块; 3. 深入理解AI应用算法,与业务、算法团队配合,保障算法工程服务落地的质量和效率,包括不仅限于模型推理性能优化、大规模向量检索能力,构建高性能、高可用AI应用工程架构。