小米端侧AI架构师
社招全职10年以上A169465地点:北京状态:招聘
任职要求
职位要求 1. 硬性条件 * 硕士及以上学历,计算机/电子工程/人工智能相关专业,10年以上AI系统研发经验; * 精通C++/Python,具备端侧AI框架(TensorRT/MNN/TFLite等)的二次开发能力,熟悉ONNX模型转换工具链; * 主导过至少3个百万级设备部署的端侧AI项目,在模型小型化、硬件适配等领域有成功案例; 2. 核心能力 * 深入理解CNN/Transformer等网络结构,掌握动态计算图优化、算子融合等底层技术; * 具备系统级资源管理经验,能通过Profiling工具(如Perfetto)进行功耗/内存/算力分析; 3. 领导力要求 * 具有20人以上技术团队管理经验,擅长制定技术路线图及人才梯队培养计划; * 熟悉IPD等研发管理体系,能主导跨地域团队的协作交付; 优先条件 在CVPR/NeurIPS等顶会发表过边缘计算相关论文,或主导过开源边缘AI项目; 具备芯片原厂(如高通/海思)的联合开发经验,熟悉ARM指令集优化;
工作职责
职位描述 1. 端侧AI系统架构设计 * 主导智能终端(手机/物联网设备/车载系统等)的AI算法架构设计,优化模型在ARM/NPU/DSP等异构计算平台的部署性能; * 构建端侧AI推理引擎,实现低延迟、高能效的模型运行,推动TensorRT-LLM、MNN等框架的深度定制化开发; 2. 资源优化 * 建立端侧AI算力-功耗-内存的综合评估体系,通过模型压缩(量化/剪枝/蒸馏)、异构计算调度等技术实现资源开销优化; * 制定端侧AI系统的全生命周期成本控制策略,平衡算法精度与硬件资源消耗; 3. 技术战略规划 * 主导前沿技术预研,包括端云协同计算、边缘智能体(Edge Agent)架构设计,推动技术成果专利化; * 搭建跨部门协作机制,对接芯片厂商、算法团队及产品部门,确保技术方案商业化落地;
包括英文材料
学历+
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
TensorRT+
https://docs.nvidia.com/deeplearning/tensorrt/latest/getting-started/quick-start-guide.html
This TensorRT Quick Start Guide is a starting point for developers who want to try out the TensorRT SDK; specifically, it demonstrates how to quickly construct an application to run inference on a TensorRT engine.
MNN+
https://github.com/alibaba/MNN?tab=readme-ov-file#intro
MNN is a highly efficient and lightweight deep learning framework.
ONNX+
https://github.com/onnx/tutorials
Open Neural Network Exchange (ONNX) is an open standard format for representing machine learning models.
[英文] Introduction to ONNX
https://onnx.ai/onnx/intro/
This documentation describes the ONNX concepts (Open Neural Network Exchange).
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
CVPR+
https://cvpr.thecvf.com/
NeurIPS+
https://neurips.cc/
相关职位
社招5年以上研发类
一、端侧AI系统架构设计 1、主导智能终端(手机/物联网设备/车载系统等)的AI硬件架构设计,优化模型在ARM/NPU/DSP等异构计算平台的部署性能; 2、 构建端侧AI推理引擎,实现低延迟、高能效的模型运行硬件方案和系统架构; 二、资源优化 1、建立端侧AI算力-功耗-内存的综合评估体系,通过模型压缩(量化/剪枝/蒸馏)、异构计算调度等技术实现资源开销优化; 2、制定端侧AI系统整体解决方案的成本控制策略,平衡算法精度与硬件资源消耗; 三、技术战略规划 1、 主导前沿技术预研,包括近存、存内、边缘计算等技术方向的技术预研,推动技术成果专利化; 2、 搭建跨部门协作机制,对接芯片厂商、算法团队及产品部门,确保技术方案商业化落地。
更新于 2025-06-05
社招3年以上技术类-综合
1. 系统级技术方案设计 • 主导消费级 AI 硬件产品(AI 玩具 / AI 眼镜 / AR 眼镜 / 智能耳机)技术架构,整合 AI 算法、硬件平台、传感器与交互逻辑 • 制定 0→1→ 量产的完整技术路径,平衡性能、功耗、成本与用户体验(例:99 元 AI 玩具 BOM 控制、10 h 续航方案) 2. 跨领域技术整合 • 协调算法、硬件、供应链、工业设计团队,解决技术冲突(例:高精度视觉算法 vs 低功耗芯片限制) • 设计端侧 AI 部署方案(TensorFlow Lite / ONNX Runtime),优化大模型量化、蒸馏等压缩策略 3. 市场与技术趋势洞察 • 研究消费电子前沿(TinyML、AR 光学模组、SLAM 算法),推动创新落地 • 分析竞品技术方案,制定差异化竞争策略
更新于 2025-09-08