logo of mi

小米顶尖应届-端云协同调度工程师-MiClaw

校招全职地点:北京状态:招聘

任职要求


1. 精通 Semantic Router(语义路由器)架构,有模型路由或分类器的训练经验。
2. 熟悉分布式系统中的一致性协议,能解决端云两端“记忆碎片化”的问题。
3. 对云端大模型 API(Gemini, …
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 智能路由机制 (Dynamic Routing):研发基于语义复杂度和隐私等级的路由算法。Agent 能自动判断:简单指令(如“定闹钟”)本地解决,复杂推理(如“分析财报并写总结”)分发至云端。
2. 端云状态同步 (State Sync):确保 Agent 的“记忆”和“任务执行进度”在端云之间无缝切换。即使任务中途从本地转到云端,上下文也不丢失。
3. 隐私屏障 (Privacy-Preserving AI):在请求发送至云端前,实现本地脱敏(PII Filtering),确保用户的敏感私密信息留在手机端。
4. 弹性负载优化:监控网络环境(5G/Wi-Fi/弱网),在网络差时自动降级为全本地运行,保证 Miclaw 的“可用性”。
包括英文材料
分布式系统+
还有更多 •••
相关职位

logo of mi
校招

1、参与或主导Vector/Matrix单元微架构和算子设计,并进行性能、功耗论证; 2、参与或主导Vector/Matrix单元RTL实现与调优; 【课题名称】 通用处理器Vector及Matrix计算单元微架构及算法研究。 【课题内容】 背景:随着AI芯片在深度学习领域的爆发式应用,专用加速器在特定场景下展现出显著优势。然而通用处理器作为计算生态的核心底座,仍需在混合计算负载支持、能效比优化及异构协同能力等维度持续突破: 1. AI规模化部署需求:边缘计算、云边端协同等场景要求通用处理器高效处理AI预处理、逻辑控制与非结构化任务; 2. 摩尔定律放缓倒逼创新:在制程红利递减背景下,需通过微架构革新提升单位晶体管效能; 3. 异构计算融合趋势:通用处理器需与AI加速器深度协同,构建"CPU+XPU"的动态计算网络; 关键挑战: 1. 通用性与效率的平衡 如何在支持多样化指令集的同时,保持对AI算子(如矩阵乘、张量计算)的高效加速; 2. 动态资源调度复杂性 多任务场景下的缓存一致性、乱序执行、分支预测等机制需重构优化; 3. 异构计算通信瓶颈 跨架构内存共享、任务分配策略、低延迟互连协议设计; 4. 能效比突破困境 在先进制程逼近物理极限时,如何通过近似计算、存算一体等架构创新实现能效跃升;

更新于 2025-07-17北京
logo of tongyi
校招通义2026届秋

我们正在寻找业界顶尖的系统专家,加入我们的AI基础架构团队,共同设计和构建下一代生成式AI的“在线服务操作系统”。您的使命是解决将前沿AI能力(大模型、AI Agent、多模态等)转化为大规模、高效率、高可用在线服务时所面临的系统性、全栈性挑战。您将负责端到端的服务性能与架构演进,从顶层应用到底层硬件,全面提升AI服务的竞争力。 具体职责包括(若你对以下一个或者多个方向感兴趣均欢迎投递): 1. 大规模模型服务平台与智能调度系统设计: (1)负责承载大规模在线模型服务(Serving)平台的核心架构设计与演进,通过对底层推理引擎(如PAI平台提供)的深度适配与协同优化,实现极致的推理吞吐与资源利用率。 (2)设计并实现面向复杂混合负载(长/短序列长度、多Lora、多模型、异构资源、多租户、高/低优先级)的上层智能请求调度与资源管理系统,通过与推理引擎的深度协同,动态调整调度策略,保障服务质量(SLA)并最大化云上服务的性价比。 2. 分布式基础设施与底层硬件优化: (1)负责面向大规模模型服务的分布式推理拓扑管理与通信计算协同优化,针对张量并行、流水线并行等场景,优化跨节点通信(InfiniBand/RoCE, NVLink),降低端到端延迟。 (2)深入理解GPU、NPU等异构硬件架构与特性,负责从服务层面对底层计算、编译优化(由PAI等引擎团队提供)进行性能评测、分析与反馈,驱动端到端的硬件效能提升。 3. AI应用层运行时与算法协同优化: (1)深入AI Agent、检索增强生成(RAG)、多模态理解等复杂应用场景,设计并优化其专用的高效运行时(Runtime),解决长链条、多依赖、异步任务流的性能瓶颈。 (2)负责高性能向量检索(Vector Search)与图计算(Graph Computing)引擎的服务化与集成,优化其在RAG和复杂推理场景下的数据访问与计算效率,实现数据层与模型层的无缝高效协同。

更新于 2025-08-07北京|杭州|上海
logo of mi
校招

1. 搭建稳定、安全、高效的车云服务链路; 2. 云端大模型的预训练、推理部署等。 【课题名称】 端云协同多模态大模型提升推理精准度 【课题内容】 针对行泊车多种场景,搭建稳定、安全、高效的车云通信链路,并基于场景设计、训练大模型,识别行泊车场景,借助云端VLM能力进一步提升车端辅助驾驶能力。

更新于 2025-06-26武汉
logo of mi
校招

1. 架构设计:设计 MiClaw 在移动端的自主 Agent 编排框架,实现复杂任务的自动化拆解与执行(Planning & Reasoning)。 2. 编排优化:研发基于 ReAct、Plan-and-Execute 或 Multi-Agent 的协同模式,确保 Agent 在手机端不陷入逻辑死循环(Loop Detection)。 3. 工具调用 (Tool-use):定义端侧工具调用规范,利用 MCP/A2A/appfunctions 等协议打通手机系统能力(日历、相册、快捷指令等)。 4. 请求路由:设计端云协同的动态路由机制,根据任务意图决定在本地推理还是请求云端模型。

更新于 2026-03-30北京