
智能互联阿里云智能-端侧智能平台负责人 / Head of On-Device AI Platform-杭州
任职要求
基础条件 ● 计算机科学或相关专业本科及以上学历 ● 10年以上客户端或系统软件开发经验,其中3年以上团队管理经验 ● 有主导过复杂系统级客户端平台架构设计并成功交付的完整经历 核心技术能力 ● 系统工程深度:精通iOS/Android/Linux至少一个平台的系统底层原理,在端侧存储引擎、数据库、高性能中间件方向有深厚的工程积累 ● 端侧AI推理:有端侧模型部署与推理优化的实战经验,熟悉模型量化、蒸馏等轻量化技术,了解主流端侧推理框架(CoreML、TFLite、ONNX Runtime、MLC-LLM等)及NPU/GPU加速链路 ● 架构设计能力:有跨平台客户端架构设计经验,能在性能、功耗、体验之间做出精准的工程权衡 ● 端云协同理解:对端云混合架构有系统认知,能定义端侧与云端在数据、计算、隐…
工作职责
岗位定位 当AI的战场从云端延伸到每一台终端设备,我们需要一位能重新定义端侧智能体验的技术领军者。 您将全面负责端侧AI应用与智能Agent平台的技术规划与产品研发。这个平台要解决的核心命题是:如何构建一套融合 端侧智能模型、高性能低功耗端推理引擎、Agent On-Device框架、隐私计算与环境安全等能力于一体的解决方案,在手机、PC、IoT等终端设备上流畅、安全、低延迟地运行本地智能体——同时与云端大模型能力无缝协同,形成"云端深度思考、终端即时响应"的一体化智能体验。 这是一个同时跨越系统工程与AI前沿的战略级岗位。您将拥有从端侧架构定义、推理引擎优化到设备生态合作的完整决策空间,带领团队在端侧AI这个正在爆发的赛道上建立技术壁垒与产品优势。 核心职责 技术战略与端侧架构 ● 制定端侧AI应用与Agent平台的整体技术路线,定义跨iOS、Android、桌面端及IoT设备的统一终端架构 ● 设计高性能端侧存储与检索方案——包括本地向量数据库、多模态数据索引与端侧语义检索引擎,支撑海量本地文档、图片、消息等信息的毫秒级检索 ● 主导端云协同大模型应用架构的端侧落地:定义端侧与云端的能力边界与协作协议,实现查询分发、结果融合、隐私保护的端到端链路 端侧推理与Agent能力 ● 推动端侧大模型推理能力建设——模型压缩、量化、蒸馏与硬件加速适配,实现轻量化大模型在终端设备上的高效运行 ● 设计端侧Agent框架,赋予AI对设备功能的智能感知与操控能力(系统API调用、跨应用协作、传感器数据融合) ● 主导隐私增强计算方案的落地,确保本地数据处理与推理过程中的用户数据安全与合规 工程交付与生态协作 ● 领导跨平台客户端工程团队,负责端侧核心模块的架构设计、性能优化与高质量交付 ● 与芯片厂商和设备厂商建立深度技术合作,打通硬件加速能力,推动NPU/GPU推理链路的联合优化 ● 建立端侧性能评测体系,持续追踪推理延迟、内存占用、功耗等核心指标,驱动体验持续优化 组织建设与技术文化 ● 搭建兼具系统工程深度与AI能力的复合型技术团队,主导核心人才引进与梯队建设 ● 营造注重工程质量、追求极致性能与用户体验的技术文化 ● 代表团队参与行业生态交流,在端侧AI领域建立技术品牌影响力
岗位定位 当AI的战场从云端延伸到每一台终端设备,我们需要一位能重新定义端侧智能体验的技术领军者。 您将全面负责端侧AI应用与智能Agent平台的技术规划与产品研发。这个平台要解决的核心命题是:如何构建一套融合 端侧智能模型、高性能低功耗端推理引擎、Agent On-Device框架、隐私计算与环境安全等能力于一体的解决方案,在手机、PC、IoT等终端设备上流畅、安全、低延迟地运行本地智能体——同时与云端大模型能力无缝协同,形成"云端深度思考、终端即时响应"的一体化智能体验。 这是一个同时跨越系统工程与AI前沿的战略级岗位。您将拥有从端侧架构定义、推理引擎优化到设备生态合作的完整决策空间,带领团队在端侧AI这个正在爆发的赛道上建立技术壁垒与产品优势。 核心职责 技术战略与端侧架构 ● 制定端侧AI应用与Agent平台的整体技术路线,定义跨iOS、Android、桌面端及IoT设备的统一终端架构 ● 设计高性能端侧存储与检索方案——包括本地向量数据库、多模态数据索引与端侧语义检索引擎,支撑海量本地文档、图片、消息等信息的毫秒级检索 ● 主导端云协同大模型应用架构的端侧落地:定义端侧与云端的能力边界与协作协议,实现查询分发、结果融合、隐私保护的端到端链路 端侧推理与Agent能力 ● 推动端侧大模型推理能力建设——模型压缩、量化、蒸馏与硬件加速适配,实现轻量化大模型在终端设备上的高效运行 ● 设计端侧Agent框架,赋予AI对设备功能的智能感知与操控能力(系统API调用、跨应用协作、传感器数据融合) ● 主导隐私增强计算方案的落地,确保本地数据处理与推理过程中的用户数据安全与合规 工程交付与生态协作 ● 领导跨平台客户端工程团队,负责端侧核心模块的架构设计、性能优化与高质量交付 ● 与芯片厂商和设备厂商建立深度技术合作,打通硬件加速能力,推动NPU/GPU推理链路的联合优化 ● 建立端侧性能评测体系,持续追踪推理延迟、内存占用、功耗等核心指标,驱动体验持续优化 组织建设与技术文化 ● 搭建兼具系统工程深度与AI能力的复合型技术团队,主导核心人才引进与梯队建设 ● 营造注重工程质量、追求极致性能与用户体验的技术文化 ● 代表团队参与行业生态交流,在端侧AI领域建立技术品牌影响力

1. 统筹下一代无影AI硬件的整体研发工作;负责硬件研发团队的组建、考核与梯队培养,建立高效的技术评审与研发协同流程; 2. 负责产品硬件技术Roadmap的制定,将产品定义精准转化为系统级技术规格,主导端侧AI算力需求与硬件架构的底层方案设计; 3. 深度把控产品JDM/ODM联合开发过程,严格Review并裁决原理图、Layout、整机堆叠(EE/ME)及热设计方案,攻克极致轻薄产品形态下走线、散热与天线性能的物理瓶颈; 4. 统筹Keyparts的技术选型与准入评估;拉通供应链团队,主导2nd Source器件的替代方案开发与新供应商导入验证; 5. 统管新品NPI开发全流程,主导解决EVT/DVT/PVT阶段的核心技术疑难杂症(含高速信号完整性、EMC/EMI、电源管理、系统稳定性等);协同质量与制造团队,保障硬件产品高质量、按节点达成量产交付目标。

1、客户需求洞察及方案设计 • 大模型场景洞察:理解客户业务场景、整体技术架构,主动挖掘客户核心业务中的高价值的大模型应用场景,与客户共创业务和技术的关键问题与效果标准,理解行业内AI场景的价值。 • 方案设计:基于客户业务目标与技术约束,设计端到端MaaS解决方案,涵盖模型选型、工程链路(推理/微调/RAG/Agent)、效果评估体系及上线路径。 2、售前引导和支持与实操能力 • 结合客户的业务场景需求,通过标杆案例及demo演示展示阿里云大模型的竞争优势,建立在客户侧的技术影响力,影响客户的决策。向客户高层展示阿里云AI全栈产品的竞争优势,确保技术方案与客户业务目标深度绑定。 • 技术验证:动手搭建Prompt、RAG、多Agent工作流及微调实验,快速验证业务可行性,对POC结果的安全性、稳定性、性能、可持续性和运行效率给出技术建议。对客户业务与技术双线相关人员清晰阐述AI带来的效率提升、成本节约或收入增长,建立科学的AI效果评估共识。 3、技术策略制定和项目赢单 • 分析客户的业务和技术情况,将阿里云大模型产品技术与客户业务需求结合,帮助客户拓展AI应用新场景,推动技术采用。 • 针对重点项目/客户,面向客户高层介绍阿里云大模型产品和解决方案的优势,传递技术价值及其带来的业务收益,引领客户向AI转型,推动项目顺利签约。 • 在售前规划和方案实施过程中,识别并有效应对技术和项目风险,协同产研及交付团队正常履约,实现收入转化,优化阿里云的效果与客户满意度。 4、能力沉淀和赋能 • 构建可复用的知识资产:沉淀面向细分领域/场景的大模型调用最佳实践、细分领域标杆案例等知识文档。 • 内部团队、生态伙伴、客户赋能和培训。 5、产品需求和改进反馈 • 识别和理解阿里云大模型的技术问题和机会,传递客户需求和反馈给产品团队,影响功能开发和未来产品路线图,保持阿里云产品的市场竞争力。 •了解客户大模型使用的情况恶化效果,将客户使用中遇到的影响客户体验的问题,反向推动内部解决,推动内部产品解决方案和流程体系的改进。
1. 深入研究不同行业SaaS/AI原生软件的行业发展方向、典型场景清单、业务流程、技术架构等,梳理各场景在AI应用的需求和价值,帮助SaaS等软件企业设计AI落地路径; 2. 从头部AI原生软件/SaaS类客户典型业务场景出发,结合阿里云千问模型、百炼、Agent平台等AI核心产品,帮助软件企业设计和落地大模型解决方案(覆盖客服、金融、办公OA、ERP、CRM、零售、营销、制造、医疗等行业赛道),包括如下: 1)客户需求洞察及方案设计 • 大模型场景洞察:理解客户业务场景、整体技术架构,主动挖掘客户核心业务中的高价值的大模型应用场景,与客户共创业务和技术的关键问题与效果标准,理解行业内AI场景的价值。 • 方案设计:基于客户业务目标与技术约束,设计端到端MaaS解决方案,涵盖模型选型、工程链路(推理/微调/RAG/Agent)、效果评估体系及上线路径。 2)售前引导和支持与实操能力 • 结合客户的业务场景需求,通过标杆案例及demo演示展示阿里云大模型的竞争优势,建立在客户侧的技术影响力,影响客户的决策。向客户高层展示阿里云AI全栈产品的竞争优势,确保技术方案与客户业务目标深度绑定。 • 技术验证:动手搭建Prompt、RAG、多Agent工作流及微调实验,快速验证业务可行性,对POC结果的安全性、稳定性、性能、可持续性和运行效率给出技术建议。对客户业务与技术双线相关人员清晰阐述AI带来的效率提升、成本节约或收入增长,建立科学的AI效果评估共识。 3)能力沉淀和赋能 • 构建可复用的知识资产:沉淀面向细分领域/场景的大模型调用最佳实践、细分领域标杆案例等知识文档。 • 内部团队、生态伙伴、客户赋能和培训。 4)产品需求和改进反馈 • 识别和理解阿里云大模型的技术问题和机会,传递客户需求和反馈给产品团队,影响功能开发和未来产品路线图,保持阿里云产品的市场竞争力。 • 了解客户大模型使用的情况恶化效果,将客户使用中遇到的影响客户体验的问题,反向推动内部解决,推动内部产品解决方案和流程体系的改进。