logo of mi

小米大模型算法工程师(多模态方向)实习生

实习兼职地点:北京状态:招聘

任职要求


1. 硕士及以上学历或在读,人工智能、计算机科学、电子、信息工程、机器人等专业,有C++/python开发经验;
2. 熟练掌握至少一种深度学习框架,如TensorflowPyTorch等;
3. 对深度学习有深刻认识,熟悉各种神经网络及背后数学原理;
4. 对大模型有设计应用经验者优先;
5. 对多模态融合算法有实际经验的优先;
额外加分项,满足一项或多项:
在AI或NLP相关顶级会议或者刊物,如ICMLNeurIPS,AAAI,ACL等发表论文者优先。
有较强的竞赛成绩,获得过ACM,NOI,NOIP或其他商业代码竞赛的任意奖项; 
有较强的学术比赛经验或者在知名数据集的Leaderboard上排名靠前; 
有较强的代码能力

工作职责


1. 参与预训练AI大模型的研发,微调和部署,包括功能实现,性能优化,和部署应用等;
2. 负责以视觉大模型/语言大模型为核心的多模态感知与开放词汇识别,负责问题的梳理定义、数据的搜集整理、模型的训练部署等工作;
3. 探索自动驾驶领域的AI大模型方案以及和传统方案的结合,并撰写相关论文,专利。
包括英文材料
学历+
C+++
Python+
深度学习+
TensorFlow+
PyTorch+
大模型+
算法+
NLP+
ICML+
NeurIPS+
相关职位

logo of alibaba
实习淘天集团2026

1、基于淘天海量商品数据,打造技术先进的电商多模态大模型,提升对多模态异构的商品数据(图、文、视频等)的理解能力和结构化能力,输出底层算法能力和高质量结构化数据,支撑发布、比货、导购等多种电商业务场景,并面向商家和消费者探索AIGC等创新业务应用。工作内容包括模型结构设计、训练任务设计、预训练和下游能力建设等; 2、 跟踪、探索大模型方向/多模态预训练方向的前沿技术,将各方向的SOTA能力集成到模型底座上,提升下游任务的效果,打造团队的技术先进性。

更新于 2025-07-09
logo of horizon
实习算法序列

1.参与多模态大模型(VLM/VLA)的研发与优化,探索图像、文本、语音等跨模态信息的融合方法,以及在自动驾驶领域的应用; 2.研究并实现前沿的视觉技术(如Diffusion Model、GAN、VAE等),推动技术落地; 3.配合团队完成算法设计、训练、调优及部署,提升模型性能与工程化能力; 4.跟踪领域前沿研究,撰写技术文档和实验报告,参与论文发表或专利申请。

更新于 2025-05-29
logo of alibaba
实习淘天集团2026

岗位课题: 探索生成和理解统一模型对视觉理解的增益 课题项目背景: 基于推荐和内容场景,通过多模态、大模型技术,应用于内容质量审核、内容基础信息完善、推荐泛化性探索等场景;我们有海量的商品、用户行为数据,能让实习生将前沿技术落地,并在真实应用和用户反馈中实现技术价值。 岗位职责: 在这里,你将深度参与并探索多模态、大模型技术给推荐、内容应用场景带来的新可能、新突破。这些技术成果,也将具体体现在每日用户使用和反馈的效果提升上。

更新于 2025-07-17
logo of alibaba
实习淘天集团2026

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 1、提升对多模态异构的商品数据(图、文、视频等)的理解能力和结构化能力,输出底层算法能力和高质量结构化数据,负责模型结构设计、训练任务设计、预训练和下游能力建设等; 2、基于淘天用户丰富的消费行为,打造技术先进的电商用户理解多模态大模型,提升对用户的异构行为本质的认知能力; 3、通过方案的优化设计帮助模型有持续scale up能力,助力模型在多模态理解任务上实现sota; 4、跟踪、探索大模型方向/多模态预训练方向的前沿技术,通过后训练强化学习提升多模态对齐、多模态推理思考能力,提升下游任务的效果。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper

更新于 2025-06-09