小米MiMo大模型数据采集工程师
任职要求
我们希望你具备: 1. 熟悉 Python / JavaScript,有数据采集或安全研究相关项目经验 2. 能独立完成主流 Web 安全防护的分析与适配 3. 熟练使用 Chrome DevTools、Fiddler、Charles、mitmproxy 等调试工具 4. 具备 JS 代…
工作职责
我们在做什么: 为大模型训练和评估提供高质量的数据供给。我们需要从各类公开数据源中大规模采集文本、对话、代码等多种类型的数据,部分场景涉及复杂的接口协议和安全策略分析,对工程能力和问题拆解能力有较高要求。 你会参与: 1. 分析目标数据源的接口协议与安全策略 2. 主流 Web 安全防护机制的研究与适配 3. JS 代码分析与调试,提取关键业务逻辑 4. Web 协议分析与接口还原 5. 移动端数据通路建设(协议分析、安全机制适配) 6. 设计并开发高可用数据采集系统,完成大规模数据的清洗与结构化存储
MiMo 大模型团队正在寻找熟悉 sandbox、容器化和云原生基础设施的研发工程师,一起建设面向大规模强化学习训练的基础设施能力。 随着大模型 Agent 和代码能力训练进入大规模 RL 阶段,我们需要构建稳定、安全、可扩展的任务执行环境。你将参与设计和实现 sandbox 执行系统、容器调度平台、训练任务环境、隔离与资源管理机制,为大规模 Agent 任务、代码执行任务和 RL 训练提供底层 infra 支撑。 工作职责 1. 设计和建设面向 RL 训练的 sandbox 执行环境,支持代码运行、工具调用、浏览器自动化、文件系统操作、网络访问控制等能力。 2. 基于 Docker、Kubernetes 等技术,构建可大规模调度的容器化任务运行平台,支持高并发、多租户、可观测、可恢复的训练任务执行。 3. 参与大规模 RL 训练 infra 的 scaling,包括任务分发、资源调度、环境复用、状态隔离、失败恢复、日志采集和性能优化。 4. 建设安全隔离机制,降低模型生成代码、Agent 工具调用和自动化执行带来的安全风险,包括权限控制、系统调用限制、网络隔离、资源限额等。 5. 与模型训练、Agent 框架、数据和评测团队合作,将训练任务需求转化为稳定可用的执行环境和平台能力。 6. 分析大规模训练过程中的系统瓶颈和故障问题,持续优化调度效率、资源利用率、任务吞吐和环境稳定性。 7. 参与内部平台工具建设,包括任务管理、运行监控、日志查询、环境调试、指标看板和自动化运维能力。
MiMo 大模型团队正在寻找熟悉前后端工程和脚本语言的研发工程师,一起提升大模型在代码生成、复杂企业级软件开发,以及 Agent 框架构建中的能力。 这个岗位会横跨前端工程、后端服务、AI Coding、Agent Framework 和强化学习训练基础设施。你将参与构建真实软件工程任务、开发训练与评测环境、设计复杂企业级应用场景,并与模型训练、数据、评测团队协作,帮助模型更好地理解和生成高质量、可维护、可运行的工程代码。 工作职责 1. 设计和构建高质量前后端代码任务,用于提升模型的代码生成、代码修改、调试、重构和系统实现能力。 2. 针对复杂企业级软件场景,沉淀真实工程任务,包括后台系统、数据看板、工作流平台、权限管理、表单系统、API 服务、业务中台、低代码 / 配置化平台等。 3. 参与代码评测体系建设,设计可自动验证的 benchmark、单元测试、接口测试、端到端测试、视觉回归测试和交互行为验证。 4. 基于 JavaScript / TypeScript / Python 等脚本语言,参与 Agent 框架、工具调用框架、任务执行环境和强化学习训练环境的开发。 5. 构建用于 RL 训练的 Agent 任务环境,包括任务定义、状态反馈、奖励设计、执行沙箱、工具链集成、前后端联调与自动化验证等。 6. 分析模型在前后端代码生成、复杂工程实现和 Agent 任务执行中的失败案例,归因问题并设计改进数据、训练任务或评测方法。 7. 与模型训练、算法、产品和工程团队合作,将真实业务场景转化为可训练、可评测、可迭代的任务体系。
我们正在构建下一代具备自主软件安全分析能力的大模型——能够独立发现操作系统、浏览器及关键基础设施中长达数十年未被检出的零日漏洞,并在无人工干预的情况下生成可执行的漏洞利用链。 核心职责 - 负设计并执行面向软件漏洞发现的大模型训练流程,包括预训练数据构造、指令精调与 RLHF/RLAIF; - 研究提升模型在二进制分析、源码审计、模糊测试指导等安全任务上推理能力的方法; - 构建并维护 Agentic 安全评估框架,设计覆盖 CVE 复现、零日发现、漏洞利用链生成的基准测试集; - 与红队工程师协作,对模型的进攻性能力进行双用途风险评估与控制; - 研究长上下文代码推理、跨文件调用链分析、符号执行辅助等关键技术;