logo of mi

小米大模型算法工程师(多模态方向)实习生

实习兼职地点:北京状态:招聘

任职要求


1. 硕士及以上学历或在读,人工智能、计算机科学、电子、信息工程、机器人等专业,有C++/python开发经验;
2. 熟练掌握至少一种深度学习框架,如Tensorflow,PyTorch等;
3. 对深度学习有深刻认识,熟悉各种神经网络及背后数学原理;
4. 对大模型有设计应用经验者优先;
5. 对多模态融合算法有实…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 参与预训练AI大模型的研发,微调和部署,包括功能实现,性能优化,和部署应用等;
2. 负责以视觉大模型/语言大模型为核心的多模态感知与开放词汇识别,负责问题的梳理定义、数据的搜集整理、模型的训练部署等工作;
3. 探索自动驾驶领域的AI大模型方案以及和传统方案的结合,并撰写相关论文,专利。
包括英文材料
学历+
C+++
Python+
深度学习+
TensorFlow+
还有更多 •••
相关职位

logo of alibaba
实习淘天集团2026

1、基于淘天海量商品数据,打造技术先进的电商多模态大模型,提升对多模态异构的商品数据(图、文、视频等)的理解能力和结构化能力,输出底层算法能力和高质量结构化数据,支撑发布、比货、导购等多种电商业务场景,并面向商家和消费者探索AIGC等创新业务应用。工作内容包括模型结构设计、训练任务设计、预训练和下游能力建设等; 2、 跟踪、探索大模型方向/多模态预训练方向的前沿技术,将各方向的SOTA能力集成到模型底座上,提升下游任务的效果,打造团队的技术先进性。

更新于 2025-07-09北京|杭州
logo of horizon
实习算法序列

1.参与多模态大模型(VLM/VLA)的研发与优化,探索图像、文本、语音等跨模态信息的融合方法,以及在自动驾驶领域的应用; 2.研究并实现前沿的视觉技术(如Diffusion Model、GAN、VAE等),推动技术落地; 3.配合团队完成算法设计、训练、调优及部署,提升模型性能与工程化能力; 4.跟踪领域前沿研究,撰写技术文档和实验报告,参与论文发表或专利申请。

更新于 2025-05-29南京
logo of mi
实习

1.岗位的主要工作内容为跟踪领域前沿研究,将研究成果投稿到机器学习/计算机视觉顶会顶刊。 2.参与多模态大模型(VLM/VLA)的研发与优化,探索图像、文本、语音等跨模态信息的融合方法,以及在自动驾驶领域的应用。 3.研究并实现前沿的技术(如WorldModel,DiffusionModel等),推动项目落地。

更新于 2025-11-11北京
logo of alibaba
实习淘天集团2026

岗位课题: 探索生成和理解统一模型对视觉理解的增益 课题项目背景: 基于推荐和内容场景,通过多模态、大模型技术,应用于内容质量审核、内容基础信息完善、推荐泛化性探索等场景;我们有海量的商品、用户行为数据,能让实习生将前沿技术落地,并在真实应用和用户反馈中实现技术价值。 岗位职责: 在这里,你将深度参与并探索多模态、大模型技术给推荐、内容应用场景带来的新可能、新突破。这些技术成果,也将具体体现在每日用户使用和反馈的效果提升上。

更新于 2025-07-17北京|杭州