平头哥平头哥-AI计算加速软件专家-上海/杭州

社招全职5年以上技术-芯片2025-11-13地点：杭州 | 上海状态：招聘

扫码手机上打开

任职要求

1. 计算机/电子/数学相关专业硕士及以上学历，3年或以上相关从业经验。
2. 精通 C/C++，具备出色的程序开发、设计、调试和调优能力。
3. 精通各种基本算法，对操作系统、计算机体系结构有深入的理解。
4. 良好的沟通和解决问题能力、时间管理能力、自我驱动能力、英文读写能力。
5. 满足以下一种或多种条件者从优：
ꔷ      具备大模型推理或训练相关开源模块的开发经验，如 cutlass、Flash-Attention、FlashInfer、MoE、DeepGemm 等；
ꔷ      熟悉主流框架，如 Pytorch、T…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 设计开发高性能计算加速算法，包括但不限于MoE、Attention、卷积、矩阵乘及相关的融合和量化。
2. 基于硬件特性进行极致性能分析和优化，制定通用性能调优策略，适配和调优各种主流框架和开源代码。
3. 深度分析各种实际应用，如生成式AI/大语言模型推理和训练等场景，发明和改进能发挥硬件优势的加速算法。
4. 和其他团队紧密合作，参与并影响芯片架构、编程模型和软件平台的设计和路线演进。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

C+

C+++

算法+

CUDA+

OpenCL+

深度学习+

还有更多 •••

登录查看完整学习资料

相关职位

阿里云智能-AI加速计算产品研发专家-杭州/上海

社招5年以上云智能集团

1. 依据公共云统一架构、OpenAPI规范、软件技术栈以及交付运维体系，负责专属云产品的研发与交付。深度参与灵骏裸金属服务器及EGS云计算服务器的研发流程，包括硬件架构预研、方案设计、软硬件结合的系统优化、线上服务质量保证以及提供专家技术支持等关键环节，确保产品从研发到运维的全生命周期高效管理。 2. 跟踪并把握GPU架构设计的发展趋势，探索前沿的GPU架构设计技术。联合高性能网络团队共同设计网络互联架构，针对分布式训练和推理业务场景，在软硬件协同及高性能网络方向上寻找性能优化的新途径，构建阿里云加速计算云服务器的核心竞争力。 3. 研发并持续改进系统的稳定性和安全性，确保平台的安全可靠运行，并不断提升对外服务质量标准。

更新于 2025-11-09杭州|上海

阿里云智能-AI加速计算产品技术专家-杭州/上海

社招5年以上云智能集团

1. 依据公共云统一架构、OpenAPI规范、软件技术栈以及交付运维体系，负责公共云异构计算产品的研发与交付。深度参与研发流程，确保产品从研发到运维的全生命周期高效管理； 2. 跟踪和了解新的异构计算产品技术和趋势，探索前沿的GPU架构设计与技术，理解业务战略及重点，基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地； 3. 联合网络团队共同设计网络互联架构，针对分布式训练和推理业务场景，在软硬件协同及高性能网络方向上寻找性能优化的新途径，构建阿里云加速计算云服务器的核心竞争力； 4. 研发并持续改进系统的稳定性和安全性，制定稳定性策略，寻找并解决产品系统中的潜在风险和瓶颈，覆盖线上疑难杂症问题，提高产品稳定性和性能确保平台的安全可靠运行，并不断提升对外服务质量标准。

更新于 2025-11-09杭州|上海

高性能计算专家（上海&杭州）

社招5年以上研发类

1. 负责影像基础画质方向的SDK方案设计与实现，通过整合指令集优化、内部线程调度、内存池等技术最大化性能功耗使用效率； 2. 评估模块SDK的新平台可行性评估； 3. 理解系统架构、硬件架构，根据业务需求驱动厂商硬件与软件的本地化实现。

上海|杭州

阿里云智能-AI Infra 高级研发工程师-北京/杭州/上海

社招3-5年云智能集团

弹性计算异构AI推理团队，承担着构建阿里云IAAS资源在公共云竞争力的职责。在AI领域，团队对接业界主要AI用户的业务需求，承接提升GPU、AI加速器等芯片在AI场景的竞争力职责。和团队一起通过专家领域知识和软硬件分析能力构建阿里云在AI场景的核心竞争力和加速解决方案。 1. 负责基于云上AI真实场景的解决方案和性能分析系统建设，构建性能标尺。 2. 负责基于云上大规模推理场景的构建和底层软件性能优化工作。 3. 负责包括CIPU、GPU、AI加速器等硬件在阿里云AI场景的竞争力构建。 4. 与厂商和内部业务团队合作，为阿里云的AI用户提供具有竞争力的AI解决方案。

更新于 2025-07-15北京|杭州|上海