logo of vivo

vivo语音增强算法工程师-26届蓝极星

校招全职地点:深圳 | 杭州状态:招聘

任职要求


1、教育背景:电子信息、计算机等相关专业博士学历,具备扎实的数学、信号处理与机器学习理论基础,熟悉语音处理领域;
2、科研能力:以第一作者在 IEEE TASLP 等国际期刊或 ICASSP、INTERSPEECH 等顶级会议发表 2 篇以上论文,能独立承担科研项目;
3、技术经验:精通回声消除等语音增强核心技术,掌握 PythonC++ 编程及 PyTorch深度学习框架,具备算法开发与落地能力;
4、创新与学习:具备技术洞察力与创新思维,可快速掌握前沿技术,能跨领域提出解决方案;​
5、团队协作:具备良好沟通协作能力,推动技术成果落地。

工作职责


vivo AI研究院致力于研发业界领先的人工智能技术,通过AI技术创新持续为全球5亿+vivo用户带来无处不在的惊喜和激动人心的智慧体验。

1、核心算法设计与优化:参与语音增强算法的全流程设计与开发,深度钻研回声消除、降噪、声源分离、定向拾音等核心技术,持续优化算法性能,提升语音信号质量与清晰度,推动算法在复杂环境下的适应性与稳定性达到行业领先水平;
2、前沿技术追踪与创新:紧跟国际语音增强领域前沿算法进展,深入研究算法演进路线,针对实际应用中的痛点与难点问题,提出创新性改进方案,将前沿技术成果转化为实际生产力,保持公司在语音增强技术上的竞争力与创新性;
3、跨领域协同优化:密切关注语音识别算法的最新动态,深入分析语音识别与语音增强的技术关联性,通过算法融合与创新设计,构建能够显著提升语音识别精度的增强算法体系,为语音交互系统的高效运行提供坚实技术支撑;
4、科研成果产出:积极开展学术研究与技术创新,主导或参与语音增强领域的专利申报与学术论文撰写工作,在高水平学术期刊与会议上发表具有影响力的研究成果,提升公司在行业内的学术地位与技术话语权;
5、AIGC 融合探索:深度关注 AIGC 大模型领域的最新突破与发展趋势,探索语音增强算法在人机对话场景下的创新应用,开展算法适配与优化设计工作,推动语音增强技术在不同产品场景中的落地与升级,拓展技术应用边界。
包括英文材料
学历+
机器学习+
Python+
C+++
PyTorch+
深度学习+
算法+
相关职位

logo of didi
校招算法类

1、工作包括不局限于:语音识别、音频事件检测、声纹、语音增强等算法 2、跟踪业界最新的语音算法和技术,并应用到业务中 3、与团队成员合作,按时完成项目研发、测试和上线。

更新于 2025-09-19
logo of alibaba
实习淘天集团2026

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 你的挑战: 攻克LLM全链路训练难题:主导大模型训练,优化模型Scaling Law,结合应用需求突破分布式性能瓶颈,基于RL增强模型推理能力,打造电商领域最懂用户需求的超级大脑(含多模态VLM研发)。 为什么选择淘天? 1.坐拥电商领域最大规模场景:每天处理数亿次用户交互,覆盖搜索/推荐/广告/客服/营销全链路,你将直接面对全球最复杂的电商需求场景。 2.定义未来购物标准:你研发的模型将服务数亿消费者,结合大语言和多模态模型能力满足用户偏好,影响海量商家经营决策。 3.顶级科研配置:超大规模GPU集群支持大规模参数模型训练,自研分布式框架实现训练推理效率大幅提升,顶级会议发表,前沿技术成果即时输血。 加入我们,你将获得: 1.与NLP/多模态领域顶尖团队共创,解锁大模型在商品理解、智能创作、消费决策、购物对话等场景的无限可能。 2.弹性化的技术路线选择权,既可在大模型基础技术方面突破能力上限,也可深入应用层打造现象级AI产品。 3.打通产学研用全链路:支持技术成果转化顶会论文和专利+百万级ai native用户产品。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。

更新于 2025-05-07
logo of alibaba
实习淘天集团2026

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 你的挑战: 攻克LLM全链路训练难题:主导大模型训练,优化模型Scaling Law,结合应用需求突破分布式性能瓶颈,基于RL增强模型推理能力,打造电商领域最懂用户需求的超级大脑(含多模态VLM研发)。 为什么选择淘天? 1.坐拥电商领域最大规模场景:每天处理数亿次用户交互,覆盖搜索/推荐/广告/客服/营销全链路,你将直接面对全球最复杂的电商需求场景。 2.定义未来购物标准:你研发的模型将服务数亿消费者,结合大语言和多模态模型能力满足用户偏好,影响海量商家经营决策。 3.顶级科研配置:超大规模GPU集群支持大规模参数模型训练,自研分布式框架实现训练推理效率大幅提升,顶级会议发表,前沿技术成果即时输血。 加入我们,你将获得: 1.与NLP/多模态领域顶尖团队共创,解锁大模型在商品理解、智能创作、消费决策、购物对话等场景的无限可能。 2.弹性化的技术路线选择权,既可在大模型基础技术方面突破能力上限,也可深入应用层打造现象级AI产品。 3.打通产学研用全链路:支持技术成果转化顶会论文和专利+百万级ai native用户产品。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper

更新于 2025-05-07
logo of dingtalk
校招钉钉2026届秋

语音是人人交流和人机交互中最自然、最便捷的模态,对语音AI的研究和应用已经成为人工智能领域的重要组成部分。在阿里巴巴,有关技术在流媒体播放、直播互动、智能客服、会议访谈、教育教学等场景,以及作为人机交互界面在AIoT、机器人、数字人等场景有广泛应用。 一段全新、有意思的旅程正待开启!为了更全面的展现你自己,你还可以在简历中附上你认为自己最有意思的爱好、特长、经历,或是对未来有意思的畅想,没有限制,此项非必填。加入我们,一起打开有意思的未来!

更新于 2025-10-16