小米omni大模型算法专家
社招全职A228350地点:北京状态:招聘
任职要求
* 计算机、数学、信息、电子工程等相关专业硕士及以上学历; * 扎实的算法基础,熟悉大模型训练、微调及推理优化,有多模态项目经验者优先; * 较强的代码能力,熟练掌握PyTorch/…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
* 负责语音及视觉多模态端到端omni大模型算法的研发和调优,探索和打造小爱同学新一代交互架构,提升小米汽车、手机、眼镜及音箱电视设备的用户体验; * 深入理解业务需求,提出解决方案并推动技术实现; * 跟踪前沿技术进展,结合业务场景进行技术迭代与优化。
包括英文材料
学历+
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
还有更多 •••
相关职位
社招5年以上技术类-算法
1. 负责面向AI手机等ToB场景的多模态交互模型研发,包括语音基础模型、视觉-语言模型(VLM)、全模态大模型的后训练(CPT/SFT/RL)与推理优化。 2. 研发基于神经网络、扩散模型或大模型的端侧音频信号处理算法(如语音增强、降噪、去混响),提升复杂声学环境下的语音交互质量。 3. 构建支持自然打断、精准判停、上下文感知的实时双工交互模型,实现低延迟、高鲁棒性的流式对话体验。 4. 针对端侧资源约束,开展模型压缩、量化、蒸馏及高效部署,确保算法在DSP/NPU等嵌入式平台稳定运行。 5. 与系统、产品团队紧密协作,推动算法从原型验证到大规模商用落地。
更新于 2026-04-03北京|上海|杭州

社招5年以上技术类-算法
1. 负责面向AI手机等ToB场景的多模态交互模型研发,包括语音基础模型、视觉-语言模型(VLM)、全模态大模型的后训练(CPT/SFT/RL)与推理优化。 2. 研发基于神经网络、扩散模型或大模型的端侧音频信号处理算法(如语音增强、降噪、去混响),提升复杂声学环境下的语音交互质量。 3. 构建支持自然打断、精准判停、上下文感知的实时双工交互模型,实现低延迟、高鲁棒性的流式对话体验。 4. 针对端侧资源约束,开展模型压缩、量化、蒸馏及高效部署,确保算法在DSP/NPU等嵌入式平台稳定运行。 5. 与系统、产品团队紧密协作,推动算法从原型验证到大规模商用落地。
更新于 2026-04-03北京|杭州
社招3年以上技术类-算法
1. 负责Qwen-Omni多语言能力研发,解决多语言语音翻译、实时同传等技术问题。 2. 大模型算法前沿技术追踪、探索,建设技术影响力。 3. 研发基于多模态大模型的多语言/跨语言任务处理新范式,构建基于大模型的多语言应用。 4. 负责在电商、教育、广告、游戏等多语言业务场景的应用落地。
更新于 2026-03-26北京|杭州