小鹏汽车AI软件栈开发工程师
任职要求
1.精通 C/C++,了解经典数据结构原理,具备良好的软件工程习惯 2.熟悉 Linux 系统基本原理并具备 Linux 内核驱动开发经验,或者熟悉至少一种 RTOS 原理并具备相关软件开发经验 3.熟…
工作职责
1.负责自研芯片上 AI 加速器系统集成验证 2.负责高性能计算软件栈生态的建设
1、对于这个岗位,您将参与针对自研指令集及架构的完整的编译工具链设计与开发; 2、工作范围涉及图编译、算子与指令编译,Pythonic DSL及其编译器设计与开发,完整的编程语言与编译器配套软件开发; 3、与相关领域专家一起深度程参与自研芯片项目架构设计、硅前硅后AI大模型测试验证、汽车与机器人等场景量产部署全流程。 工作内容: 1、GPGPU特定的指令编译方案设计与开发,包含指令选择、指令调度等; 2、针对大模型的下一代AI编译器设计与开发,包括图编译、Cost-Model、低bit量化算法等; 3、Triton、Tilelang、Cutlass/Cute、Cute DSL/CuTile、Torch(torch.compile)等AI生态软件适配与支持;
1.参与SoC智能调度引擎开发,突破多核异构SoC能效瓶颈,实现设备续航提升20%-30%+; 2.研发基于AI预测模型的动态调度框架,完成CPU/NPU/GPU/DSP混合计算单元毫秒级资源切换与三维能效评估; 3.设计指令级功耗建模工具与自适应DVFS算法,提升典型用户场景10%+的能效提升; 4.深度协同澎湃芯片及小米全栈技术生态,覆盖手机/汽车/机器人等亿级设备,技术成果直通国际顶会转化通道。 【课题名称】 端侧高效整机性能&能效优化技术研究 【课题内容】 小米玄戒芯片能效优化与智能调度体系研究课题背景: 面对手机/汽车/机器人等多场景的极端能效需求,玄戒SoC芯片需突破多核异构的能效瓶颈,通过智能调度引擎与AI驱动的功耗建模技术,构建"芯片+系统+生态"的三维能效优化体系。结合澎湃系列芯片低功耗研发经验(硬件利润率≤5%原则)及AI实验室全栈技术积累,实现续航提升20%-30%+的行业领先能效比,技术成果直通国际顶会转化通道。 挑战: 1. SoC异构计算单元智能调度引擎开发 - 构建基于AI预测模型的动态调度框架,实现CPU/NPU/GPU/DSP混合计算单元的毫秒级资源切换与负载均衡。 - 设计多目标优化算法,在典型用户场景(如多模态交互、自动驾驶感知)中达成计算资源利用率与能效比的协同提升。 2. 指令级功耗建模与自适应能效调控 - 开发面向玄戒O1架构特征的指令级功耗建模工具链,建立微架构-指令-场景的三维能效评估体系。 - 研发自适应DVFS算法与异构缓存协同机制,确保在影像处理、边缘推理等典型场景下实现10%+能效增益。 3. 全栈技术生态协同优化 - 深度整合澎湃芯片家族(C1/G1/S1)的异构调度能力,构建覆盖MIUI系统、车载OS、机器人OS的统一能效优化方案。 - 设计可扩展的调度框架,支持手机/汽车/机器人等设备的差异化能效需求,推动技术方案在IEEE/ACM等顶会的成果转化。
团队介绍:TRAE(The Real AI Engineer),是字节跳动旗下产品,一个能理解需求、调动工具、独立完成开发任务的 AI 工程师,为用户提供端到端生成真实软件的服务。TRAE是当前国内最受欢迎的AI编程产品之一,也是全球首个端到端AI软件开发Agent产品,可覆盖简单到复杂全场景。我们正在寻找充满热情、富有创造力的人才。期待你的加入,与我们共同重塑开发范式,定义未来开发的形态。 1、参与建设AI编程助手开发产品,深入理解各类研发场景,完成不同业务场景AI编程能力的落地; 2、负责跟进和探索AI领域最新的技术和趋势,结合研发效能场景,提供技术解决方案; 3、负责AI编程助手技术架构的稳定性、性能进行优化和重构; 4、负责相关技术的基础设施搭建,提高工程效率和工程质量。
团队介绍:TRAE(The Real AI Engineer),是字节跳动旗下产品,一个能理解需求、调动工具、独立完成开发任务的 AI 工程师,为用户提供端到端生成真实软件的服务。TRAE是当前国内最受欢迎的AI编程产品之一,也是全球首个端到端AI软件开发Agent产品,可覆盖简单到复杂全场景。我们正在寻找充满热情、富有创造力的人才。期待你的加入,与我们共同重塑开发范式,定义未来开发的形态。 1、参与建设AI Coding产品,深入理解各类研发场景,完成不同业务场景AI编程能力的落地; 2、负责跟进和探索AI领域最新的技术和趋势,结合研发效能场景,提供技术解决方案; 3、负责AI编程助手技术架构的稳定性、性能进行优化和重构; 4、负责相关技术的基础设施搭建,提高工程效率和工程质量。