logo of mi

小米多模态大模型算法工程师实习生—武汉

实习兼职地点:武汉状态:招聘

任职要求


1、硕士及以上学历,计算机、人工智能及机器学习等相关专业;
2、有自然语言处理计算机视觉、视频理解等技术背景者优先;
3、有大模型预训练、指令微调或强化学习等项目经验者优先;
4、掌握机器学习深度学习基础知识,熟悉PytorchTensorflow等至少一种深度学习框架,熟悉常用的CV主流网络模型
5、精通PythonC/C++程序设计;
6、有相关方向知名国际会议文章、相关竞赛获奖者优先;

工作职责


1、深入调研多模态、计算机视觉和自然语言处理等方向的前沿技术
2、推进视觉信息语义分割与编码的研究,设计自监督学习任务,在大数据上训练较大参数规模模型;
3、探索视觉与语言的语义对齐方法,和多模态多任务联合训练
包括英文材料
学历+
机器学习+
NLP+
OpenCV+
大模型+
强化学习+
深度学习+
PyTorch+
TensorFlow+
Python+
C+
C+++
相关职位

logo of mi
实习

1、参与图像、视频生成相关领域研发工作,探索视觉生成领域前沿方向 2、参与图像生成与编辑、视频可控生成、多模态视觉生成、视觉生成领域强化学习等方向研究 3、分析和解决算法产品化过程中出现的效果、性能等问题 4、参与学术研究,产出影响行业的科研成果

更新于 2025-09-01
logo of mi
实习

该职位专注于自动驾驶场景下多模态大模型(VLA:Vision-Language-Action)的工程化落地,你将有机会在千万级数据上实车验证关于自动驾驶VLA的最新想法: 多模态模型工程化部署:结合视觉、语言与行为动作的联合建模机制,优化多模态模型的推理效率,支持自动驾驶系统的实时应用; 实车测试与性能验证:参与自动驾驶场景中的模型测试与性能评估,设计测试案例,分析模型在实际驾驶环境中的响应能力与行为决策效果; 数据采集与处理:负责多模态数据(视觉、语言、行为)的采集、标注与处理,构建高质量数据 pipeline,优化数据流的实时性与稳定性; 模型优化与轻量化:探索模型蒸馏、小样本泛化等技术,提升模型在自动驾驶复杂场景中的部署效率与资源利用率; 系统集成与技术支持:协助完成多模态模型与自动驾驶系统的集成测试,解决工程化落地过程中的技术问题; 技术文档与成果转化:撰写工程化技术文档,总结实车测试经验,参与技术报告、专利申请或产品转化工作。

更新于 2025-08-18
logo of mi
实习

该职位专注于自动驾驶场景下多模态大模型(VLA:Vision-Language-Action)的工程化落地,你将有机会在千万级数据上实车验证关于自动驾驶VLA的最新想法: 多模态模型工程化部署:结合视觉、语言与行为动作的联合建模机制,优化多模态模型的推理效率,支持自动驾驶系统的实时应用; 实车测试与性能验证:参与自动驾驶场景中的模型测试与性能评估,设计测试案例,分析模型在实际驾驶环境中的响应能力与行为决策效果; 数据采集与处理:负责多模态数据(视觉、语言、行为)的采集、标注与处理,构建高质量数据 pipeline,优化数据流的实时性与稳定性; 模型优化与轻量化:探索模型蒸馏、小样本泛化等技术,提升模型在自动驾驶复杂场景中的部署效率与资源利用率; 系统集成与技术支持:协助完成多模态模型与自动驾驶系统的集成测试,解决工程化落地过程中的技术问题; 技术文档与成果转化:撰写工程化技术文档,总结实车测试经验,参与技术报告、专利申请或产品转化工作。

更新于 2025-08-25
logo of mi
实习

1. 研究语音多模态大模型前沿技术 2. 负责语音多模态模型算法方案研发、迭代与落地应用

更新于 2024-11-14