logo of alibaba

阿里巴巴算法工程师-语音多模态大模型

实习兼职淘天集团2026届春季实习生招聘地点:杭州状态:招聘

任职要求


【必备项】
1、计算机科学、人工智能、语音处理、机器学习或相关领域的硕士或博士学位;
2、至少2年在语音、自然语言、图像生成、音乐生成、语音翻译、数字人或相关领域的研究研发经验;
3、具备出色的编程能力,熟练掌握Pytorch深度学习框架和Python编程语言;
4、在顶级领域会议(如NeurIPSICMLICLRCVPR、ACL、AAAI、Interspeech、ICASSP等)发表过文章,有ACM竞赛获奖者优先。
【加分项】
1、在顶级领域会议发表过一作文章或在相关国际比赛获得前三名;
2、具备实际的产品化经验,了解AI智能对话技术在产品应用中的挑战;
3、有过跨领域(如自然语言处理、音频信号处理)的研究经验。

工作职责


如果你,期望参与淘天集团语音多模态大模型技术研发,推动数字人AI智能对话、语音自然交互等技术在淘宝Vision和手机淘宝等亿级用户场景的产品化落地;
如果你,期望突破语音模态与语言模型的融合边界,构建新一代Speech-to-Speech多模态基座模型,持续跟踪大模型领域国际前沿技术,通过产学研合作打造行业领先的对话交互系统;
如果你,期待与顶尖算法团队并肩作战,在开放创新的技术氛围中与自驱力强、专业过硬、追求极致的技术伙伴共同开拓多模态交互新范式;
那还在等待什么,赶紧加入我们吧!
包括英文材料
机器学习+
学历+
PyTorch+
深度学习+
Python+
NeurIPS+
ICML+
CVPR+
NLP+
相关职位

logo of bytedance
社招A259606

1、支持端到端语音多模态大模型技术在字节跳动公司内外丰富的业务场景落地,解决落地过程中的前沿问题,持续优化落地效果; 2、探索前沿的多模态技术,专注语音多模态大模型的前沿技术和算法效果,追求和探索业界最前沿算法,包括但不限于语言、音乐、语音、音频的生成与理解等; 3、深入调研和关注音频/NLP/多模态等方向的前沿技术。

更新于 2025-03-28
logo of kuaishou
实习J1010

1. 负责语音多模态大模型的研究与开发,包括Pretrain、SFT、RLHF等; 2. 负责语音处理算法的研究与开发,支撑大模型训练对数据的需求; 3. 负责大模型技术在快手业务中的落地,并探索新玩法或业务创新; 4. 负责跟踪国内外前沿技术的发展和实践,保持团队技术的敏锐性。

更新于 2025-05-08
logo of nio
实习算法

1. 参与多模态大模型语音方向的研发工作,包括但不限于语音识别、音频理解、声音事件检测、语音端到端对话等 2. 负责多模态大模型前沿算法的探索 3. 负责多模态大模型相关数据的清洗、扩增,提升数据质量 4. 参与多模态大模型的训练、优化和测试,提升模型的性能和稳定性 5. 协助团队完成相关项目的开发和落地,实现技术成果的转化

更新于 2025-07-02
logo of mi
实习

1. 研究语音多模态大模型前沿技术 2. 负责语音多模态模型算法方案研发、迭代与落地应用

更新于 2024-11-14