logo of mi

小米omni大模型算法专家

社招全职A228350地点:北京状态:招聘

任职要求


* 计算机、数学、信息、电子工程等相关专业硕士及以上学历;
* 扎实的算法基础,熟悉大模型训练、微调及推理优化,有多模态项目经验者优先;
* 较强的代码能力,熟练掌握PyTorch/TensorFlow等框架;
* 强烈的责任心和自驱力,能独立解决问题并推动项目落地;
* 优秀的沟通能力,具备技术方案输出和跨团队协作经验;
* 有复杂业务场景的算法落地经验者优先。

工作职责


* 负责语音及视觉多模态端到端omni大模型算法的研发和调优,探索和打造小爱同学新一代交互架构,提升小米汽车、手机、眼镜及音箱电视设备的用户体验;
* 深入理解业务需求,提出解决方案并推动技术实现;
* 跟踪前沿技术进展,结合业务场景进行技术迭代与优化。
包括英文材料
学历+
算法+
大模型+
PyTorch+
TensorFlow+
相关职位

logo of tongyi
校招通义2026届秋

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 Coder团队致力于构建能够执行、扩展并自我进化的自主系统,通过构建超智能的coding agent/digital agent,扩展数字世界,为迈向真实世界的智能奠定基础。 工作职责: 1. 负责通用模型 Qwen 的代码能力和代码专有模型 Qwen-Coder 的构建。 (1)包括但不限于数据收集、预训练、后训练(强化学习)、评测等方向上的探索。 (2)通过Large-scale Pre-training 和 Large-scaleRL来提升Code Reasoning能力,在专家级编程竞赛超越人类,并构建 Coding Agent 来解决真实世界软件开发任务; 2. 负责Computer-Use Agent (GUI-Agent)的建设,以最直观的方式—鼠标、键盘、编码等操作来代替人类执行数字世界任务。 (1)通过Scaling海量数字世界数据结合大规模合成数据,来提升Computer-Use Agent的Grouding能力。 (2)通过Long Horizon的方式进行强化训练,结合可扩展的多模态环境反馈来提升CU Agent的Reasoning的能力。

更新于 2025-08-22
logo of meituan
实习核心本地商业-基

你将做什么: 1. 从事情语音大模型方向的前沿技术探索,包括但不限于语音交互大模型、omni 大模型、ASR、TTS、音频理解、音乐合成、音频多模态等方向。 2. 调研前沿工作,跟踪业界相关进展。 3. 算法研发和模型训练,包括但不限于代码编写、数据处理。

更新于 2025-07-21
logo of xiaohongshu
社招大模型

1、探索新一代大语言模型基座架构,完成扩散模型(diffusion model)在大语言模型的重塑,突破逐个token预测的方式,实现高效的推理模式,探索全新scaling law; 2、实现大模型训练的数据清洗、合成和评估;设计和实现大模型训练的AI Infra框架。

更新于 2025-09-05
logo of xiaohongshu
校招大模型

1、探索新一代大语言模型基座架构,完成扩散模型(diffusion model)在大语言模型的重塑,突破逐个token预测的方式,实现高效的推理模式,探索全新scaling law; 2、实现大模型训练的数据清洗、合成和评估;设计和实现大模型训练的AI Infra框架。

更新于 2025-09-16