logo of bilibili

哔哩哔哩算法工程师(语音方向)【2026届】

实习兼职技术类地点:上海状态:招聘

任职要求


1、编程基础扎实,熟悉Python/C++等至少一种编程语言;
2、关注行业前沿技术,动手能力强,至少掌握Tensorflow/Pytorch中一种深度学习框架;
3、对音频内容制作、音乐创作或语音合成有浓厚热情;
4、具备优秀的团队合作和沟通能力,富有创造性思维;
5、善于解决问题,有良好的学术背景,熟悉编程语言者优先录取;
6、熟悉语音、音乐相关技术,能快速将行业最新算法应用到实际项目中;
7、国际期刊发表论文者及ACM获奖经历者优先,有音乐、声音制作或表演经验者优先录取

如果你是对音频内容制作、音乐和AI技术充满热情的学生,对内容有极致追求,我们期待你的加入!

工作职责


1、负责音频相关算法研发,包括但不限于语音合成、歌声合成、声音转换、音乐理解、音乐生成等;
2、负责音频相关算法在产品中落地,建设行业先进音频内容理解和生产能力,落地公司各个业务场景;
3、跟踪前沿的算法理论,并将优秀算法应用到实际业务中,提升业务效果;
4、参与PGC语音、音乐内容的创意和制作,一同打造声音体验;
5、与多元化的团队合作,将你的语言、音乐知识应用于前沿的AI项目。
包括英文材料
Python+
C+++
TensorFlow+
PyTorch+
深度学习+
算法+
相关职位

logo of didi
校招算法类

1、车内安全业务模型与策略的开发及优化:1)通过技术进行策略体系的建设,减少车内不安全事件的发生,给司乘更安全的出行体验,深入研究业务,基于数据分析产出业务洞见,并进行策略调优与模型迭代 2)基于行程中实时的录音、录像、轨迹信息,结合订单及司机历史行为数据等,使用统计学方法、机器学习、深度学习、大模型等技术手段解决小样本、多模态数据融合等技术问题,建设车内安全相关的风险事件识别模型 2、司机生态业务模型与策略的开发及优化:通过技术搭建策略体系,建设良好的司机生态环境,使用NLP、大模型等技术,对司机生态中的风险事件进行识别,进而对司机生态进行持续治理 3、司机与乘客安全画像的构建:通过司机与乘客的历史行为信息,构建安全相关画像能力,使用数据挖掘、机器学习等技术构建标签,提供更安全的司乘出行与司机生态环境 4、安全场景的大模型应用:将大模型在安全业务场景落地应用,包括但不限于语音语义理解、多模态内容理解、智能问答、RAG等方向。

更新于 2025-09-22
logo of jj
校招北京市

1、负责负责游戏内AI机器人的开发、调试、迭代等工作 2、负责用户行为数据挖掘、图像语音文本识别、知识图谱、用户特征挖掘、用户游戏技能识别等方向的机器学习课题的解决,以及实时数据分析建模; 3、负责对应领域中课题的机器学习建模和实时分析建模; 4、负责推进机器学习平台框架建设; 5、快速跟进最新有效的机器学习技术(包括深度学习),并将这些技术实践到建模中。

更新于 2025-09-23
logo of alibaba
实习淘天集团2026

参与构建新一代电商语音认知引擎,通过大模型技术实现语音交互与商品理解的双向增强,打造全球领先的电商领域语音智能中枢,支撑淘宝亿级DAU场景的语音搜索、智能导购等核心业务。 1. 负责大模型语音模态的设计、开发和优化,包括但不限于语音音频数据清洗、模型设计、训练策略等方面的研究与应用。 2. 参与语音识别、语音合成、语音理解等相关大模型语音模态能力的建设,提升跨模态整体效果。 3. 跟踪、探索大模型方向,将各模态的SOTA能力集成到模型底座上,提升识别以及搜索能力,提升团队技术先进性。

更新于 2025-05-08
logo of xiaohongshu
社招大模型

在算力驱动的 AGI 和人文精神的烟火气交汇之处,我们真诚邀请对大模型 Omni Model 有热情的同学加入,共同打造更具影响力的智能系统。你会成为团队的一员,并和其他同事协作,共同研发 SOTA 的 Omni Model。期待你以务实和客观的科学态度来推进技术的进展,不被过往经验裹挟、不被主观偏好影响。期待你除了算法外仍然是为出色的工程师。期待你对技术有强烈的好奇心和开放心态。 区别于传统 ASR / TTS 级联技术,我们希望打造端到端的 Omni Model 在实时交互中释放大模型的智力水平,彻底改变以 Chatbot 文字为主的人机交互界面 岗位说明:你会负责围绕大模型 Omni Model 构建语音模态的相关研究工作,包括但不限于如下事项 海量的语音数据处理和构建:定性分析、定量评估数据质量,并给出 scalable 的改进方案;探索跨模态(文字/视觉/语音)混合训练的最佳实践; 探索更加高效且合理的模型架构,让模型更加理解音频,同时让模型具备更好的语音合成能力 研究并探索基于 Omni Model 的 Post Train,包含但不限于 SFT 和 RL