小米Miclaw-多模态方向实习生
实习兼职地点:北京状态:招聘
任职要求
1、计算机及相关专业(CS/EE/数学/统计/自动化等)在读本硕博,对多模态处理领域有强烈科研热情与明确研究方向; 2、具备扎实的数学基础(线性代数、概率论、优化理论等)与编程能力,精通Python,熟练使用PyTorch/TensorFlow等深度学习框架,有高效代码编写与调试能力; 3、深耕多模态处理、计算机视觉或自然语言处理等相关方…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、深度参与多模态核心算法与模型的研发工作,覆盖图像/视频理解与生成、3D内容创建、声学信号(语音/音频)处理,以及跨模态(文本-视觉/听觉等)对齐、融合等关键方向; 2、主导部分子任务的设计与落地,参与实验方案制定、数据挖掘与预处理、模型训练及效果验证等全流程科研环节。参与多模态核心算法的设计与优化,针对模型精度、推理速度、显存占用等关键指标开展针对性调优;深入分析实验数据,提炼核心问题并输出创新性优化方案,助力团队突破技术瓶颈,保障核心产品的技术领先性。 3、独立或组队开展多模态、NLP、CV领域顶会(如NeurIPS/ICML/ICCV/ECCV/ACL等)及前沿开源项目的深度调研,聚焦领域核心难点与创新方向; 4、完成高质量调研报告,包含技术原理拆解、性能对比分析及落地可行性评估,推动前沿技术在团队核心项目中的转化与应用。负责核心代码的开发与维护、科研论文的撰写、技术专利的素材整理等工作,主动贡献创新性科研思路。
包括英文材料
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
还有更多 •••
相关职位
实习
我们诚邀对计算机视觉、图形学与多模态技术有浓厚兴趣的实习生加入。您将参与前沿的图像生成、视觉理解、机器人动画与导航等核心算法的研究与开发,推动技术从模型创新到在手机影像、机器人及大模型等场景中的实际应用。 核心职责 1.参与前沿视觉与图形算法的研究与实现,包括多模态大模型、图像生成与理解、机器人角色动画与端到端导航等方向。 2.负责相关算法的模型设计、训练、评估及优化,涉及模型结构创新、训练策略改进及(针对移动端或机器人的)性能优化。 3.将研发的算法应用于具体产品场景,如手机相机影像功能、机器人物理仿真与控制等,并推动其部署与迭代。 4.跟踪领域最新学术动态,进行关键技术复现与创新,参与技术成果的总结与沉淀。
更新于 2026-03-26北京