理想汽车AI芯片算法适配专家
任职要求
1、计算机、人工智能、电子、软件工程的直接相关专业,或运筹学、统计学、数学类的基础专业; 2、有算法工程经验,对自动驾驶、座舱等领域的业务算法有在英伟达、高通等平台的部署实践经历; 3、熟悉算法的pytorch训练框架/导出手段,掌握roofline等基础性能分析手段; 4、熟练使用Python/C/C++语言之一,掌握计算机体系架构知识,或AI编译、推理引擎的相关基础知识更优。
工作职责
1、承接公司内部的自动驾驶、座舱业务算法模型,将算法部署到自研芯片上; 2、对算法部署到自研芯片上的精度/性能问题进行分析和优化,提升交付质量; 3、分析自动驾驶、座舱领域的前瞻算法,构建车载/机器人领域的参考负载; 4、将参考负载进行计算/存储/带宽的量化分析,转换为对芯片规格的需求。
1、负责AIGC方向及LLM模型端侧化落地,包括模型小型化技术、计算加速技术和硬件优化技术以及虚拟人渲染相关及; 2、了解SoC IP和芯片架构设计,负责移动端硬件的深度分析,建立硬件能力量化分析方法论,指导AI业务端侧落地性能功耗优化,指导算法适配硬件设计; 3、负责平台硬件设计分析,横向分析行业硬件选型优劣势与应用方向,为平台硬件选型规划、算法硬化定制等提供改善建议; 4、结合业务方向,AI算法设计,为AI算法的芯片定制化提供指导。
1. 在AI 芯片上移植开源深度学习框架,分析解决移植过程中各类问题 2. 分析和验证各类深度学习算法在AI芯片上的功能、性能与精度,从算法与框架层分析并解决发现的功能、精度与性能问题,为芯片设计与AI软件栈提供参考实现 3. 对模型、框架、AI生态做竞品对比、原理分析,构建差异化竞争力,为AI芯片客户提供问题支持和解决方案
职位概述: 作为平头哥数据中心产品线深度学习算法框架高级技术专家,将负责设计、开发和优化深度学习算法框架,提升算法模型在PTG AI芯片上的运行效率和性能。跨团队协作,确保高质量的代码和技术实现,同时为团队提供技术指导。 主要职责: 算法框架适配与开发: 对开源AI软件框架的内部实现有深入理解,能够快速将广大开源软件适配到 AI 芯片上,同时确保性能达到最优。同时根据公司AI芯片的差异化的功能,在框架层面实现软硬件结合的解决方案。 性能优化: 分析和优化深度学习模型的训练和推理性能,提升计算效率和资源利用率。 根据芯片硬件特点使用多种技术手段,包括分布式计算、模型压缩和量化,优化算法在实际应用中的表现。 跨团队协作: 与其他团队(如编译器、驱动、客户支持等)紧密合作,确保技术指标的达成,并实现符合用户需求和市场趋势的功能。 为团队成员提供技术指导和支持,推动团队技能的持续提升。 技术研究与创新: 跟踪深度学习和机器学习领域的最新研究动态,探索并实施新算法和技术。 参与编写技术文档和论文,促进技术的分享与传播。
团队介绍 我们是平头哥AI 芯片软件互联团队,主要职责是积极拥抱社区生态、并基于平头哥AI 芯片产品来打造我们自己的互联通信库。 越来越好的大模型对算力需求日益高涨,而大模型训练与推理的高效部署都依赖越来越多的芯片通过互联在一起,高效协同以发挥出线性增长的计算效率。我们会与架构/硬件/Model 同学紧密合作以共同打造越来越符合业界需求的芯片,同时也会协同服务器/网络等伙伴共同打造基于平头哥芯片的高性能集群 solution,还会深入到各种应用场景去洞察并满足用户对多卡训练、推理在性能、鲁棒性、故障定位等各方面的需求,协同各方共同打造最高效、易用的平头哥多卡产品软件解决方案。 职位描述 1. 为芯片设计开发高性能、有竞争力的互联通信库; 2. 基于芯片、服务器、网络集群架构特性与互联通信应用模式进行极致性能优化; 3. 增强在大规模机器任务下发生 hang 或 crash 时的专家分析与诊断、定位能力; 4. 支持多卡或多机互联场景下各种用户问题分析与定位; 5. 和其他团队紧密合作,影响芯片、服务器与集群架构等方案设计和演进。