logo of mi

小米多模态大模型算法实习生

实习兼职地点:北京状态:招聘

任职要求


1、拥有自然语言处理计算机视觉领域的研究和实践经验,包括但不限于以下方向:
-大语言模型:基座模型预训练、SFTprompt/instruction tuning)等相关经验
-多模态理解模型:基座模型预训练、SFTprompt/instruction tuning)等相关经验
-多模态生成模型:图像生成、视频生成、3D生成等;
2、动手能力强, 具有熟练的算法和编程能力,熟悉C/C++Python编程,并熟练使用常见深度学习工具,如:torch、TensorFlowPaddle等
3、工作积极主动, 能与团队融洽合作相处,同时能够独立完成研究工作;
4、具有一作或共同一作的行业影响力高质量论文(如:ICMLICLR、NIPS、CVPR、ACL等),或者顶尖竞赛经历的优先;

工作职责


1、负责小米汽车智能座舱内的大语言模型和多模态大语言模型的研究、开发、部署和性能优化;
2、与各职能团队团队紧密协作,参与产品设计和算法模型落地到车载芯片的相关工作;
3、跟踪新能源汽车行业动态,探索在汽车领域的应用场景和落地。
包括英文材料
NLP+
OpenCV+
SFT+
Prompt+
算法+
C+
C+++
Python+
深度学习+
TensorFlow+
PaddlePaddle+
ICML+
CVPR+
相关职位

logo of xiaohongshu
实习策略算法

1、基于大模型等前沿技术,构建多模态内容理解模型,并应用到小红书多模态搜索来解决实际业务问题 2、进行大模型前沿技术探索和研发,发表国际顶级论文 3、参与多模态大模型相关的业务落地,包括但不限于笔记图文/视频多模态内容理解、视频结构化、多模态意图理解等

更新于 2025-05-24
logo of kuaishou
实习D13918

1、跟踪、探索大模型方向/多模态预训练方向的前沿技术,将各方向的SOTA能力集成到模型底座上,提升下游任务的效果,打造团队的技术先进性; 2、多模态大模型结构的设计、训练任务的规划、预训练流程以及下游功能的开发等。

更新于 2025-07-16
logo of amap
实习高德研究型实习生

我们正在寻找对多模态技术充满热情的算法工程师,加入我们的前沿技术研发团队。您将专注于多模态理解与生成,推动其在地图数据、信息流推荐、打车服务等场景中的落地应用,为用户提供更智能、更沉浸的服务。 主要职责 1、多模态模型研发:开发业界领先的图文多模态理解与生成模型,结合扩散模型(Diffusion Models)、Transformer架构等实现高质量场景理解和动态内容生成。 2、模型优化与性能提升:优化多模态模型的推理速度和计算效率,支持端侧部署。探索适合大模型的压缩与加速技术(包括但不限于量化、剪枝、知识蒸馏等)。 3、业务场景落地:将多模态技术应用于实际业务场景,如地图数据(道路、POI等)、信息流推荐、打车服务等。与产品、工程团队合作,推动技术从研发到上线的全流程落地。 4、前沿技术探索:持续跟踪生成式AI(Generative AI)、跨模态对齐、思维链强化学习、多模态交互、具身智能等最新技术趋势,提出创新性解决方案。

更新于 2025-07-29
logo of mi
实习

1.参与视觉大语言模型(VLM)算法的研究和落地,提升手机汽车等设备的多模态交互体验。 2.参与UIAgent、屏幕理解场景下的数据合成与质量提升,探索数据配比的前沿技术。

更新于 2025-02-19