
智能互联平头哥-AI 框架技术专家-上海/杭州
任职要求
1. 硕士以上,计算机科学相关专业, 至少5+年AI领域相关的开发经验。 2. 熟练掌握Python、C/C++编程语言,掌握AI Vibe Coding技术,良好的逻辑思维与问题分析能力 3. 熟悉SOTA大语言模型、多模态模型、VLA模型的架构与原理 4. 熟悉主流深度学习框架Pytorch、Tensor…
工作职责
1. 在AI 芯片上适配SOTA开源框架和SOTA模型,分析解决适配过程中发现的功能、性能与精度问题,为AI芯片客户提供问题支持和解决方案 2. 对SOTA模型和框架做原理分析,竞对分析、构建差异化产品竞争力,贡献开源社区提升产品影响力 3. 构建SOTA模型和框架端到端粒度、算子粒度、Kernel粒度的仿真框架,在芯片设计阶段提前发现精度、性能问题,保障芯片设计成功
1. 在AI 芯片上适配SOTA开源框架和SOTA模型,分析解决适配过程中发现的功能、性能与精度问题,为AI芯片客户提供问题支持和解决方案 2. 对SOTA模型和框架做原理分析,竞对分析、构建差异化产品竞争力,贡献开源社区提升产品影响力 3. 构建SOTA模型和框架端到端粒度、算子粒度、Kernel粒度的仿真框架,在芯片设计阶段提前发现精度、性能问题,保障芯片设计成功
团队介绍 我们是平头哥AI 芯片软件互联团队,主要职责是积极拥抱社区生态、并基于平头哥AI 芯片产品来打造我们自己的互联通信库。 越来越好的大模型对算力需求日益高涨,而大模型训练与推理的高效部署都依赖越来越多的芯片通过互联在一起,高效协同以发挥出线性增长的计算效率。我们会与架构/硬件/Model 同学紧密合作以共同打造越来越符合业界需求的芯片,同时也会协同服务器/网络等伙伴共同打造基于平头哥芯片的高性能集群 solution,还会深入到各种应用场景去洞察并满足用户对多卡训练、推理在性能、鲁棒性、故障定位等各方面的需求,协同各方共同打造最高效、易用的平头哥多卡产品软件解决方案。 职位描述 1. 为芯片设计开发高性能、有竞争力的互联通信库; 2. 基于芯片、服务器、网络集群架构特性与互联通信应用模式进行极致性能优化; 3. 增强在大规模机器任务下发生 hang 或 crash 时的专家分析与诊断、定位能力; 4. 支持多卡或多机互联场景下各种用户问题分析与定位; 5. 和其他团队紧密合作,影响芯片、服务器与集群架构等方案设计和演进。
1. 设计开发高性能计算加速算法,包括但不限于MoE、Attention、卷积、矩阵乘及相关的融合和量化。 2. 基于硬件特性进行极致性能分析和优化,制定通用性能调优策略,适配和调优各种主流框架和开源代码。 3. 深度分析各种实际应用,如生成式AI/大语言模型推理和训练等场景,发明和改进能发挥硬件优势的加速算法。 4. 和其他团队紧密合作,参与并影响芯片架构、编程模型和软件平台的设计和路线演进。
1、参与人工智能芯片的软硬件协同设计,指令集功能验证; 2、参与人工智能芯片的编译器算法设计和实现, 工具链开发与维护,网络模型的性能调优; 3、参与深度学习软件栈的设计和实现; 1. Working closely with hardware/architecture engineering and software teams to understand the hardware and software requirements. 2. Responsible for compiler and tool chain design, implementation, maintaining and performance tuning. 3. Responsible for the design and implementation of deep learning software stack.