小米MiMo大模型数据采集工程师

社招全职A1278702026-05-11地点：北京状态：招聘

扫码手机上打开

任职要求

我们希望你具备：
1. 熟悉 Python / JavaScript，有数据采集或安全研究相关项目经验
2. 能独立完成主流 Web 安全防护的分析与适配
3. 熟练使用 Chrome DevTools、Fiddler、Charles、mitmproxy 等调试工具
4. 具备 JS 代…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

我们在做什么：
为大模型训练和评估提供高质量的数据供给。我们需要从各类公开数据源中大规模采集文本、对话、代码等多种类型的数据，部分场景涉及复杂的接口协议和安全策略分析，对工程能力和问题拆解能力有较高要求。
你会参与：
1. 分析目标数据源的接口协议与安全策略
2. 主流 Web 安全防护机制的研究与适配
3. JS 代码分析与调试，提取关键业务逻辑
4. Web 协议分析与接口还原
5. 移动端数据通路建设（协议分析、安全机制适配）
6. 设计并开发高可用数据采集系统，完成大规模数据的清洗与结构化存储

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

Python+

JavaScript+

还有更多 •••

登录查看完整学习资料

相关职位

大模型安全能力研究员-MiMo

社招A41838

我们正在构建下一代具备自主软件安全分析能力的大模型——能够独立发现操作系统、浏览器及关键基础设施中长达数十年未被检出的零日漏洞，并在无人工干预的情况下生成可执行的漏洞利用链。核心职责 - 负设计并执行面向软件漏洞发现的大模型训练流程，包括预训练数据构造、指令精调与 RLHF/RLAIF； - 研究提升模型在二进制分析、源码审计、模糊测试指导等安全任务上推理能力的方法； - 构建并维护 Agentic 安全评估框架，设计覆盖 CVE 复现、零日发现、漏洞利用链生成的基准测试集； - 与红队工程师协作，对模型的进攻性能力进行双用途风险评估与控制； - 研究长上下文代码推理、跨文件调用链分析、符号执行辅助等关键技术；

更新于 2026-04-10北京

顶尖应届-大模型训练与推理研究员-MiMo

校招

1、设计和实现支持大规模分布式训练的集群和框架； 2、构建高效的推理框架和算子优化，支持超大规模模型的在线和离线推理需求； 3、研究PD分离、Context Caching、模型量化、推敲编码等推理优化技术。

更新于 2026-06-02北京

顶尖应届-语音大模型算法研究员-MiMo

校招

1、大规模语音模态预训练研究如何用千万小时级别语音数据在百亿级别参数模型上进行高效预训练，有效提取与利用通用声学与语义特征，提升语言理解及语音生成的一致性和自然度； 2、多语言语音理解与生成研究跨语言语音数据的共享表示方法，提升语音模型对多语言、方言的适配能力； 3、噪声环境及复杂声学场景下的处理能力研究语音大模型在嘈杂、混响、远场等典型场景下的泛化性； 4、探索高效语音信息压缩方法研究语音模态压缩方法，以实现长时理解，并适配不同类型的设备（云侧和端侧）的部署需求。

更新于 2026-06-02北京

顶尖应届-多模态大模型算法研究员-MiMo

校招

将围绕多模态（文本、图像、音频、视频）理解和生成统一的基座大模型的数据、模型结构、统一建模方式、训练与推理优化、深度推理等核心问题展开研究，具体研究内容包括： 1、多模态（文本、图像、音频、视频）数据的收集、合成及数据策略，提升质量、多样性、可扩展性； 2、探索多模态理解与生成统一的建模方式； 3、多模态模型的模型结构的设计与优化，高效的大规模分布式训练和推理系统（云侧和端侧）； 4、研究多模态模型的深度推理范式。

更新于 2026-06-02北京