logo of mi

小米语音多模态算法工程师实习生

实习兼职地点:北京状态:招聘

任职要求


1. 熟悉Pytorch深度学习框架,具备大模型训练经验者优先;
2. 熟悉自然语言处理、语音算法,具备相关研究经验者优先;
3. 有一作会议和期刊文章,有开源项目经验者优先;

工作职责


1. 研究语音多模态大模型前沿技术
2. 负责语音多模态模型算法方案研发、迭代与落地应用
包括英文材料
PyTorch+
深度学习+
大模型+
NLP+
算法+
相关职位

logo of mi
实习

1、研究语音多模态大模型前沿技术 2、负责语音多模态模型算法方案研发、迭代和落地应用

更新于 2025-07-04
logo of horizon
实习算法序列

1.参与多模态大模型(VLM/VLA)的研发与优化,探索图像、文本、语音等跨模态信息的融合方法,以及在自动驾驶领域的应用; 2.研究并实现前沿的视觉技术(如Diffusion Model、GAN、VAE等),推动技术落地; 3.配合团队完成算法设计、训练、调优及部署,提升模型性能与工程化能力; 4.跟踪领域前沿研究,撰写技术文档和实验报告,参与论文发表或专利申请。

更新于 2025-05-29
logo of alibaba
实习淘天集团2026

如果你,期望参与淘天集团语音多模态大模型技术研发,推动数字人AI智能对话、语音自然交互等技术在淘宝Vision和手机淘宝等亿级用户场景的产品化落地; 如果你,期望突破语音模态与语言模型的融合边界,构建新一代Speech-to-Speech多模态基座模型,持续跟踪大模型领域国际前沿技术,通过产学研合作打造行业领先的对话交互系统; 如果你,期待与顶尖算法团队并肩作战,在开放创新的技术氛围中与自驱力强、专业过硬、追求极致的技术伙伴共同开拓多模态交互新范式; 那还在等待什么,赶紧加入我们吧!

更新于 2025-05-07
logo of aliyun
实习阿里云2026届

阿里云持续推进AI 技术深化战略布局, 围绕AI 和云计算的基础设施建设、AI基础模型平台、企业级AI应用方向构建核心场景。为此,我们正积极招募优秀人才: 1、从事多模态算法和模型的研究与开发,包括但不局限于文本-图像、文本-视频等跨模态算法研发和优化,跟进并保持业界技术领先; 2、推进跨模态内容理解/生成前沿技术的创新落地。设计和优化现有算法,提高性能和准确性,确保高质量的用户体验; 3、关注多模态/NLP/CV等方向的前沿技术,及时将新技术应用到产品中。

更新于 2025-06-17