蔚来端侧工程 - 智能驾驶软件工程师
任职要求
1. 优秀的软件架构能力,对软件设计原则有深入理解与实践。 2. 5年及以上C++/rust软件开发、自动驾驶系统开发及相关经验,具备大型项目经验; 3. 优秀的工程编译/构建/发版能力,问题快速发现、定位及解决能力; 4. 优秀的编程风格习惯、文档撰写能力,团队沟通协作能力; 5. 熟知业界前沿技术并具备快速学习能力。 加分项: 有管理或横向拉通经验
工作职责
1. 负责自动驾驶端工程架构,熟悉自动驾驶业务整体系统集成架构、自动驾驶中间件架构、自动驾驶端侧Infra架构等一种或几种; 2. 负责自动驾驶业务整体工程落地,包括需求分析、项目管理、设计、开发、验证、上线,并负责工程专项的跨团队推动; 3. 负责前沿技术预研、验证,确保端工程技术的先进性。
1. 智能设备算法加速和模型板端部署:优化SLAM(同步定位与建图)、视觉感知、路径规划、运动控制等核心算法,提高实时性和计算效率; 2. 硬件加速优化:基于 GPU(CUDA)、BPU(Horizon RDK)、NPU、FPGA 等硬件加速器,实现高效并行计算,优化推理和训练速度; 3. 深度学习优化:针对目标检测、语义分割、三维点云处理等任务,使用 TensorRT、TVM、oneDNN 等框架进行推理加速。 4. 算子优化:基于 TensorFlow、PyTorch、ROS 等生态,优化自定义算子,提高计算图执行效率。 5. 系统集成:与机器人软件、硬件团队协作,确保优化后的算法可无缝集成,并满足实时性和功耗需求。 6. 跨平台开发,负责智慧工厂存量&增量设备系统端应用开发;
1.参与SoC智能调度引擎开发,突破多核异构SoC能效瓶颈,实现设备续航提升20%-30%+; 2.研发基于AI预测模型的动态调度框架,完成CPU/NPU/GPU/DSP混合计算单元毫秒级资源切换与三维能效评估; 3.设计指令级功耗建模工具与自适应DVFS算法,提升典型用户场景10%+的能效提升; 4.深度协同澎湃芯片及小米全栈技术生态,覆盖手机/汽车/机器人等亿级设备,技术成果直通国际顶会转化通道。 【课题名称】 端侧高效整机性能&能效优化技术研究 【课题内容】 小米玄戒芯片能效优化与智能调度体系研究课题背景: 面对手机/汽车/机器人等多场景的极端能效需求,玄戒SoC芯片需突破多核异构的能效瓶颈,通过智能调度引擎与AI驱动的功耗建模技术,构建"芯片+系统+生态"的三维能效优化体系。结合澎湃系列芯片低功耗研发经验(硬件利润率≤5%原则)及AI实验室全栈技术积累,实现续航提升20%-30%+的行业领先能效比,技术成果直通国际顶会转化通道。 挑战: 1. SoC异构计算单元智能调度引擎开发 - 构建基于AI预测模型的动态调度框架,实现CPU/NPU/GPU/DSP混合计算单元的毫秒级资源切换与负载均衡。 - 设计多目标优化算法,在典型用户场景(如多模态交互、自动驾驶感知)中达成计算资源利用率与能效比的协同提升。 2. 指令级功耗建模与自适应能效调控 - 开发面向玄戒O1架构特征的指令级功耗建模工具链,建立微架构-指令-场景的三维能效评估体系。 - 研发自适应DVFS算法与异构缓存协同机制,确保在影像处理、边缘推理等典型场景下实现10%+能效增益。 3. 全栈技术生态协同优化 - 深度整合澎湃芯片家族(C1/G1/S1)的异构调度能力,构建覆盖MIUI系统、车载OS、机器人OS的统一能效优化方案。 - 设计可扩展的调度框架,支持手机/汽车/机器人等设备的差异化能效需求,推动技术方案在IEEE/ACM等顶会的成果转化。
前沿技术研究 1. 跟踪全球手机领域的前沿软件技术动态(如操作系统优化、基础软件优化、硬件协同创新、端侧AI系统优化等),分析技术趋势并输出研究报告; 2. 深入研究学术界顶会论文(如OSDI/SOSP/FAST/NSDI/SIGCOMM/ASPLOS/CGO/ICSE等),提炼可落地的技术方案,推动技术预研与创新。 竞争洞察与行业分析 1. 监测友商技术动态,评估其技术路线、专利布局及产品实现,为小米技术战略提供决策支持。 PoC概念验证开发 1. 对于高价值关键技术点的原型开发,完成算法优化、性能测试及可行性验证,推动创新成果向实际产品转化。 跨领域协同 1. 与OS、硬件、AI、自动驾驶等团队合作,探索手机与智能生态(IoT、汽车、机器人)的软件技术融合方案。 技术成果输出 1. 撰写高质量学术论文,申请技术专利,参与行业技术标准制定,提升小米在学术界和产业界的影响力。 【课题名称】 下一代操作系统研究 【课题内容】 1.前沿技术探索 a. 研究基础软件领域,如操作系统轻量化内核架构(如Unikernel混合部署模型)、编译器与AI融合优化(MLIR动态代码生成)、低损耗容错中间件等关键技术; b. 研究系统关键模块(调度系统/内存管理/驱动框架/协议栈)的创新机会,如形式化验证驱动的确定性高稳定协议栈。 2. PoC验证与落地转化 a. 针对高潜力方向(如编译时-运行时联合优化、异构资源池化调度),在原型系统完成技术可行性验证。
关于我们:小鹏机器人中心致力于研发先进的人形机器人技术,包括机器人的行走,操作,智能导航,在大语言模型支撑下的人机交互等。我们拥有世界一流的软硬件团队,分布于深圳,上海,广州和北美。作为计算机视觉和机器学习工程师,你将和机器人中心相关领域的团队成员共同解决科研和工程问题。我们将共同成长,在人形机器人前沿领域留下自己印记。 • 训练机器人需要的感知算法,包括端到端导航 (VLA),场景理解,人物识别理解等任务。 • 在以下领域开发行业领先(SOTA)的算法:基于VLA的端到端轨迹预测,物体的检测识别,人物跟踪,多任务学习,大规模分布式训练,多传感器融合,视觉深度估计, 大语言模型(LLM),视觉语言模型(VLM)等。 • 优化算法及其相应的预处理和后处理,和软件工程师合作对算法进行端侧部署。