荣耀端侧AI架构师
社招全职5年以上研发类地点:北京状态:招聘
任职要求
一、硬性条件 1、 硕士及以上学历,计算机/电子工程/人工智能相关专业,5年以上AI系统研发经验; 2、 具备端侧AI框架(TensorRT/MNN/TFLite等)的二次开发能力; 3、有部署AI端侧硬件的能力与经验; 二、核心能力要求 1、 深入理解CNN/Transformer等网络结构,掌握动态计算图优化、算子融合等底层技术; 2、 具备系统级资源管理经验,能通过Profiling工具(如Perfetto)进行功耗/内存/算力分析; 3、具备存储、近存、存内相关硬件能力; 三、个人能力要求 1、擅长制定技术路线图及人才梯队培养计划; 2、 熟悉IPD等研发管理体系,能主导跨地域团队的协作交付; 四、优先条件 1、具备主流芯片厂商的联合开发经验,熟悉ARM指令集优化。
工作职责
一、端侧AI系统架构设计 1、主导智能终端(手机/物联网设备/车载系统等)的AI硬件架构设计,优化模型在ARM/NPU/DSP等异构计算平台的部署性能; 2、 构建端侧AI推理引擎,实现低延迟、高能效的模型运行硬件方案和系统架构; 二、资源优化 1、建立端侧AI算力-功耗-内存的综合评估体系,通过模型压缩(量化/剪枝/蒸馏)、异构计算调度等技术实现资源开销优化; 2、制定端侧AI系统整体解决方案的成本控制策略,平衡算法精度与硬件资源消耗; 三、技术战略规划 1、 主导前沿技术预研,包括近存、存内、边缘计算等技术方向的技术预研,推动技术成果专利化; 2、 搭建跨部门协作机制,对接芯片厂商、算法团队及产品部门,确保技术方案商业化落地。
包括英文材料
学历+
TensorRT+
https://docs.nvidia.com/deeplearning/tensorrt/latest/getting-started/quick-start-guide.html
This TensorRT Quick Start Guide is a starting point for developers who want to try out the TensorRT SDK; specifically, it demonstrates how to quickly construct an application to run inference on a TensorRT engine.
MNN+
https://github.com/alibaba/MNN?tab=readme-ov-file#intro
MNN is a highly efficient and lightweight deep learning framework.
CNN+
https://learnopencv.com/understanding-convolutional-neural-networks-cnn/
Convolutional Neural Network (CNN) forms the basis of computer vision and image processing.
[英文] CNN Explainer
https://poloclub.github.io/cnn-explainer/
Learn Convolutional Neural Network (CNN) in your browser!
https://www.deeplearningbook.org/contents/convnets.html
Convolutional networks(LeCun, 1989), also known as convolutional neuralnetworks, or CNNs, are a specialized kind of neural network for processing data.
https://www.youtube.com/watch?v=2xqkSUhmmXU
MIT Introduction to Deep Learning 6.S191: Lecture 3 Convolutional Neural Networks for Computer Vision
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
相关职位
社招10年以上A169465
职位描述 1. 端侧AI系统架构设计 * 主导智能终端(手机/物联网设备/车载系统等)的AI算法架构设计,优化模型在ARM/NPU/DSP等异构计算平台的部署性能; * 构建端侧AI推理引擎,实现低延迟、高能效的模型运行,推动TensorRT-LLM、MNN等框架的深度定制化开发; 2. 资源优化 * 建立端侧AI算力-功耗-内存的综合评估体系,通过模型压缩(量化/剪枝/蒸馏)、异构计算调度等技术实现资源开销优化; * 制定端侧AI系统的全生命周期成本控制策略,平衡算法精度与硬件资源消耗; 3. 技术战略规划 * 主导前沿技术预研,包括端云协同计算、边缘智能体(Edge Agent)架构设计,推动技术成果专利化; * 搭建跨部门协作机制,对接芯片厂商、算法团队及产品部门,确保技术方案商业化落地;
更新于 2025-03-18
社招3年以上技术类-综合
1. 系统级技术方案设计 • 主导消费级 AI 硬件产品(AI 玩具 / AI 眼镜 / AR 眼镜 / 智能耳机)技术架构,整合 AI 算法、硬件平台、传感器与交互逻辑 • 制定 0→1→ 量产的完整技术路径,平衡性能、功耗、成本与用户体验(例:99 元 AI 玩具 BOM 控制、10 h 续航方案) 2. 跨领域技术整合 • 协调算法、硬件、供应链、工业设计团队,解决技术冲突(例:高精度视觉算法 vs 低功耗芯片限制) • 设计端侧 AI 部署方案(TensorFlow Lite / ONNX Runtime),优化大模型量化、蒸馏等压缩策略 3. 市场与技术趋势洞察 • 研究消费电子前沿(TinyML、AR 光学模组、SLAM 算法),推动创新落地 • 分析竞品技术方案,制定差异化竞争策略
更新于 2025-09-08