logo of mi

小米顶尖应届-大模型训练与推理工程师-大模型

校招全职地点:北京状态:招聘

任职要求


1. 精通机器学习深度学习),具备卓越的创新研究能力,充满对未知领域的好奇心,热衷于探索前沿技术边界;
2. 编程能力出色,熟练掌握至少两种编程语言,精通Pytorch/Tensorflow,能够将创造性想法快速转化为高效代码;
3. 研究成果丰富,在国际顶级会议或期刊(如NeurIPS、ICLR、ACL、CVPR、COLT等)发表…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 设计和实现支持大规模分布式训练的集群和框架;
2. 构建高效的推理框架,支持超1T模型大模型的在线和离线推理需求;
3. 研究PD分离、Context Caching、模型量化、推敲编码等推理优化技术。

【课题名称】
大模型训练和推理框架
【课题内容】
1. 模型训练和推理基础设施研发;
2. “训练推理x模型结构x训练算法”co-design。
包括英文材料
机器学习+
深度学习+
PyTorch+
还有更多 •••
相关职位

logo of mi
校招

将围绕多模态(文本、图像、音频、视频)理解和生成统一的基座大模型的数据、模型结构、统一建模方式、训练与推理优化、深度推理等核心问题展开研究,具体研究内容包括: 1. 多模态(文本、图像、音频、视频)数据的收集、合成及数据策略,提升质量、多样性、可扩展性; 2. 探索多模态理解与生成统一的建模方式; 3. 多模态模型的模型结构的设计与优化,高效的大规模分布式训练和推理系统(云侧和端侧); 4. 研究多模态模型的深度推理范式。 【课题名称】 多模态生成与理解统一模型 【课题内容】 突破多模态统一建模方式的技术瓶颈,训练理解与生成统一的多模态基座大模型,实现高效训练与推理系统。

更新于 2025-05-22北京
logo of mi
校招

参与大语言模型的核心技术研发,包括但不限于: - 预训练优化(数据合成、长上下文建模、训练动态分析) - 后训练技术(强化学习、奖励模型、推理能力提升) - 代码生成与理解(自动化数据构建、运行反馈优化) - 模型架构创新(MoE、高效推理、稳定性优化) - 探索AI Agent、长序列推理、在线学习等新兴方向

更新于 2025-07-09北京
logo of mi
校招

1. 负责大语言模型线上推理框架的性能优化,解决高并发、低延迟、高可靠性等核心问题,提升服务吞吐量与稳定性; 2. 设计并实现分布式大模型推理系统,优化多卡(如NVIDIA GPU集群)资源调度与通信效率,支持千卡级训练/推理场景; 3. 深度适配NVIDIA GPU硬件架构,利用CUDA、cuDNN等工具链进行算子级优化,提升模型计算效率与显存利用率; 4. 调研并引入前沿技术(如异构计算、AI编译器优化),推动模型量化、蒸馏等轻量化方案落地。 【课题名称】 大模型分布式推理加速 【课题内容】 探索和实现大模型大规模推理加速包括分布式推理架构,模型和算法优化等。

更新于 2025-06-25北京
logo of mi
校招

1、应用包括大模型、Agent、多模态等在内的 AI 技术,推进汽车大数据的智能化应用落地; 2、与业务一起探索和发现 AI 技术的在汽车领域的前沿应用落地场景,针对性进行数据建设、模型训练、模型评估等,优化模型效果,实现效能提升。 3、探索AI技术在车端轻量化部署,优化推理速度。 【课题名称】 整车大模型应用开发 【课题内容】 本课题研究大模型在汽车上的应用,利用整车跨域数据结合大模型技术,推进整车智能化进步。

更新于 2025-12-01南京