阿里云阿里云智能-端侧智能平台负责人 / Head of On-Device AI Platform-杭州
任职要求
基础条件 ● 计算机科学或相关专业本科及以上学历 ● 10年以上客户端或系统软件开发经验,其中3年以上团队管理经验 ● 有主导过复杂系统级客户端平台架构设计并成功交付的完整经历 核心技术能力 ● 系统工程深度:精通iOS/Android/Linux至少一个平台的系统底层原理,在端侧存储引擎、数据库、高性能中间件方向有深厚的工程积累 ● 端侧AI推理:有端侧模型部署与推理优化的实战经验,熟悉模型量化、蒸馏等轻量化技术,了解主流端侧推理框架(CoreML、TFLite、ONNX Runtime、MLC-LLM等)及NPU/GPU加速链路 ● 架构设计能力:有跨平台客户端架构设计经验,能在性能、功耗、体验之间做出精准的工程权衡 ● 端云协同理解:对端云混合架构有系统认知,能定义端侧与云端在数据、计算、隐…
工作职责
岗位定位 当AI的战场从云端延伸到每一台终端设备,我们需要一位能重新定义端侧智能体验的技术领军者。 您将全面负责端侧AI应用与智能Agent平台的技术规划与产品研发。这个平台要解决的核心命题是:如何构建一套融合 端侧智能模型、高性能低功耗端推理引擎、Agent On-Device框架、隐私计算与环境安全等能力于一体的解决方案,在手机、PC、IoT等终端设备上流畅、安全、低延迟地运行本地智能体——同时与云端大模型能力无缝协同,形成"云端深度思考、终端即时响应"的一体化智能体验。 这是一个同时跨越系统工程与AI前沿的战略级岗位。您将拥有从端侧架构定义、推理引擎优化到设备生态合作的完整决策空间,带领团队在端侧AI这个正在爆发的赛道上建立技术壁垒与产品优势。 核心职责 技术战略与端侧架构 ● 制定端侧AI应用与Agent平台的整体技术路线,定义跨iOS、Android、桌面端及IoT设备的统一终端架构 ● 设计高性能端侧存储与检索方案——包括本地向量数据库、多模态数据索引与端侧语义检索引擎,支撑海量本地文档、图片、消息等信息的毫秒级检索 ● 主导端云协同大模型应用架构的端侧落地:定义端侧与云端的能力边界与协作协议,实现查询分发、结果融合、隐私保护的端到端链路 端侧推理与Agent能力 ● 推动端侧大模型推理能力建设——模型压缩、量化、蒸馏与硬件加速适配,实现轻量化大模型在终端设备上的高效运行 ● 设计端侧Agent框架,赋予AI对设备功能的智能感知与操控能力(系统API调用、跨应用协作、传感器数据融合) ● 主导隐私增强计算方案的落地,确保本地数据处理与推理过程中的用户数据安全与合规 工程交付与生态协作 ● 领导跨平台客户端工程团队,负责端侧核心模块的架构设计、性能优化与高质量交付 ● 与芯片厂商和设备厂商建立深度技术合作,打通硬件加速能力,推动NPU/GPU推理链路的联合优化 ● 建立端侧性能评测体系,持续追踪推理延迟、内存占用、功耗等核心指标,驱动体验持续优化 组织建设与技术文化 ● 搭建兼具系统工程深度与AI能力的复合型技术团队,主导核心人才引进与梯队建设 ● 营造注重工程质量、追求极致性能与用户体验的技术文化 ● 代表团队参与行业生态交流,在端侧AI领域建立技术品牌影响力

岗位定位 当AI的战场从云端延伸到每一台终端设备,我们需要一位能重新定义端侧智能体验的技术领军者。 您将全面负责端侧AI应用与智能Agent平台的技术规划与产品研发。这个平台要解决的核心命题是:如何构建一套融合 端侧智能模型、高性能低功耗端推理引擎、Agent On-Device框架、隐私计算与环境安全等能力于一体的解决方案,在手机、PC、IoT等终端设备上流畅、安全、低延迟地运行本地智能体——同时与云端大模型能力无缝协同,形成"云端深度思考、终端即时响应"的一体化智能体验。 这是一个同时跨越系统工程与AI前沿的战略级岗位。您将拥有从端侧架构定义、推理引擎优化到设备生态合作的完整决策空间,带领团队在端侧AI这个正在爆发的赛道上建立技术壁垒与产品优势。 核心职责 技术战略与端侧架构 ● 制定端侧AI应用与Agent平台的整体技术路线,定义跨iOS、Android、桌面端及IoT设备的统一终端架构 ● 设计高性能端侧存储与检索方案——包括本地向量数据库、多模态数据索引与端侧语义检索引擎,支撑海量本地文档、图片、消息等信息的毫秒级检索 ● 主导端云协同大模型应用架构的端侧落地:定义端侧与云端的能力边界与协作协议,实现查询分发、结果融合、隐私保护的端到端链路 端侧推理与Agent能力 ● 推动端侧大模型推理能力建设——模型压缩、量化、蒸馏与硬件加速适配,实现轻量化大模型在终端设备上的高效运行 ● 设计端侧Agent框架,赋予AI对设备功能的智能感知与操控能力(系统API调用、跨应用协作、传感器数据融合) ● 主导隐私增强计算方案的落地,确保本地数据处理与推理过程中的用户数据安全与合规 工程交付与生态协作 ● 领导跨平台客户端工程团队,负责端侧核心模块的架构设计、性能优化与高质量交付 ● 与芯片厂商和设备厂商建立深度技术合作,打通硬件加速能力,推动NPU/GPU推理链路的联合优化 ● 建立端侧性能评测体系,持续追踪推理延迟、内存占用、功耗等核心指标,驱动体验持续优化 组织建设与技术文化 ● 搭建兼具系统工程深度与AI能力的复合型技术团队,主导核心人才引进与梯队建设 ● 营造注重工程质量、追求极致性能与用户体验的技术文化 ● 代表团队参与行业生态交流,在端侧AI领域建立技术品牌影响力
方向一: 客户端平台:iOS/Android 方向二: 1.客户端基础框架的定制、开发、优化。 2.Web技术研发,移动端跨端动态技术研发,包括生态语言、渲染技术 方向三: 1.面向支付宝客户端iOS/Android平台的智能化基础设施建设,赋能端内各业务场景; 2.负责端侧计算引擎的架构设计与开发,增强对用户的理解; 3.负责端云共享学习、在线学习等领域的技术体系建设; 4.负责终端大模型框架与应用落地 5.强烈责任心和团队合作精神,乐于探索未知领域。
1、嵌入式AI系统开发: • 负责RTOS系统平台上多模态AI终端产品的研发,包括方案评估、软件架构设计、核心功能模块(如人脸/手势识别、行为分析)开发与部署; • 主导端侧AI模型轻量化、跨平台推理框架适配(TensorFlow Lite/MNN/NCNN)及NPU芯片的性能优化(如内存、功耗、实时性); • 结合硬件特性设计轻量化模型架构,完成从算法训练到嵌入式端侧部署的全链路开发。 2、多模态算法工程化: • 优化计算机视觉算法在嵌入式设备(IoT/AR硬件/AI机器人)的落地效果,解决低算力、高延迟、多干扰场景下的工程挑战; • 开发芯片算子库适配方案,参与芯片选型、AI工具链优化及端云协同架构设计; • 探索多模态交互(视觉+语音+传感器)在智能终端的创新应用,如AI玩偶、陪伴机器人等。 3、跨团队协作与交付: • 与芯片厂商、算法团队、硬件团队协同开发,主导端侧SDK集成及性能调优,确保产品按时交付; • 支持产品量产落地,保障系统稳定性与用户体验。
-作为百度私有云在客户侧的售后一号位,全流程深入了解大型企业业务场景,与客户的系统运维,应用架构等人员合作,提供私有云产品的售后运维,包括但不限于组织现场进行云平台变更,对接客户需求 -基于百度私有云&AI的产品线、技术体系,帮助企业级客户制定IT架构和业务流程,包括定制的最佳实践、异常处理机制和问题应急预案等。帮助客户深度理解云服务,并持续帮助客户提升技术能力 -保障百度云平台的稳定运行,负责客户云平台的故障应急响应,后端协调,应急止损,协调产研出具故障报告,负责客户侧汇报和复盘 -推动百度云智能产品不断优化,解决客户使用云计算服务和解决方案过程中的技术问题,不断完善问题处理机制和流程,与云服务专家、产品专家直接合作,确保企业技术问题高效地解决 -现场一线驻场人员的日常运维工作管理,以及绩效考核,现场运维流程制定等运维管理工作