logo of mi

小米语音多模态算法工程师实习生

实习兼职地点:北京状态:招聘

任职要求


1、熟悉Python编程,掌握PyTorch等深度学习框架
2、对机器学习算法和模型…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、研究语音多模态大模型前沿技术
2、负责语音多模态模型算法方案研发、迭代和落地应用
包括英文材料
Python+
PyTorch+
还有更多 •••
相关职位

logo of mi
实习

1. 研究语音多模态大模型前沿技术 2. 负责语音多模态模型算法方案研发、迭代与落地应用

更新于 2024-11-14北京
logo of horizon
实习算法序列

1.参与多模态大模型(VLM/VLA)的研发与优化,探索图像、文本、语音等跨模态信息的融合方法,以及在自动驾驶领域的应用; 2.研究并实现前沿的视觉技术(如Diffusion Model、GAN、VAE等),推动技术落地; 3.配合团队完成算法设计、训练、调优及部署,提升模型性能与工程化能力; 4.跟踪领域前沿研究,撰写技术文档和实验报告,参与论文发表或专利申请。

更新于 2025-05-29南京
logo of horizon
校招算法序列

1.参与多模态大模型(VLM/VLA)的研发与优化,探索图像、文本、语音等跨模态信息的融合方法,以及在自动驾驶领域的应用; 2.研究并实现前沿的视觉技术(如Diffusion Model、GAN、VAE等),推动技术落地; 3.配合团队完成算法设计、训练、调优及部署,提升模型性能与工程化能力; 4.跟踪领域前沿研究,撰写技术文档和实验报告,参与论文发表或专利申请。

更新于 2025-05-29南京
logo of mi
实习

1.岗位的主要工作内容为跟踪领域前沿研究,将研究成果投稿到机器学习/计算机视觉顶会顶刊。 2.参与多模态大模型(VLM/VLA)的研发与优化,探索图像、文本、语音等跨模态信息的融合方法,以及在自动驾驶领域的应用。 3.研究并实现前沿的技术(如WorldModel,DiffusionModel等),推动项目落地。

更新于 2025-11-11北京