小米语音多模态算法工程师实习生
实习兼职地点:北京状态:招聘
任职要求
1、熟悉Python编程,掌握PyTorch等深度学习框架 2、对机器学习算法和模型…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、研究语音多模态大模型前沿技术 2、负责语音多模态模型算法方案研发、迭代和落地应用
包括英文材料
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
还有更多 •••
相关职位

实习算法序列
1.参与多模态大模型(VLM/VLA)的研发与优化,探索图像、文本、语音等跨模态信息的融合方法,以及在自动驾驶领域的应用; 2.研究并实现前沿的视觉技术(如Diffusion Model、GAN、VAE等),推动技术落地; 3.配合团队完成算法设计、训练、调优及部署,提升模型性能与工程化能力; 4.跟踪领域前沿研究,撰写技术文档和实验报告,参与论文发表或专利申请。
更新于 2025-05-29南京
实习
1.岗位的主要工作内容为跟踪领域前沿研究,将研究成果投稿到机器学习/计算机视觉顶会顶刊。 2.参与多模态大模型(VLM/VLA)的研发与优化,探索图像、文本、语音等跨模态信息的融合方法,以及在自动驾驶领域的应用。 3.研究并实现前沿的技术(如WorldModel,DiffusionModel等),推动项目落地。
更新于 2025-11-11北京