logo of thead

平头哥平头哥-编译器技术专家-AI软件-上海/北京/杭州

社招全职5年以上技术-芯片地点:上海 | 北京 | 杭州状态:招聘

任职要求


1. 熟练掌握C/C++/Python等编程技能,有扎实的编程基础、良好的编程风格和工作习惯;
2. 熟悉编译原理和算法实现,二年及以上编译器开发经验;
3. 对机器学习算法/深度学习有一定了解尤佳;
4. 有GCCLLVM和Open64等开源编译器相关开发经验尤佳;
5. 有CUDA/OpenCL/汇编级优化经验尤佳;
6. 有深度学习相关框架中如Caffe/Tensorflow/PyTorch/MXNet等图优化开发经验尤佳;
7. 有计算机体系结构背景,熟悉芯片架构/微架构(包括CPU/GPU/SoC/FPGA), 有软硬件协同设计经验尤佳;
8. 具有独立解决问题的能力,良好的团队合作意识和沟通能力;

Requirements:
1. Strong C/C++/Python programming skills and solid knowledge of data structure and algorithm.
2. Familiarity with compiler theory, and experience on compiler devel…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与人工智能芯片的软硬件协同设计,指令集功能验证;
2、参与人工智能芯片的编译器算法设计和实现, 工具链开发与维护,网络模型的性能调优;
3、参与深度学习软件栈的设计和实现;

1. Working closely with hardware/architecture engineering and software teams to understand the hardware and software requirements. 
2. Responsible for compiler and tool chain design, implementation, maintaining and performance tuning.
3. Responsible for the design and implementation of deep learning software stack.
包括英文材料
C+
C+++
Python+
算法+
机器学习+
深度学习+
GCC+
LLVM+
CUDA+
还有更多 •••
相关职位

logo of aliyun
社招3-5年云智能集团

弹性计算异构AI推理团队,承担着构建阿里云IAAS资源在公共云竞争力的职责。在AI领域,团队对接业界主要AI用户的业务需求,承接提升GPU、AI加速器等芯片在AI场景的竞争力职责。和团队一起通过专家领域知识和软硬件分析能力构建阿里云在AI场景的核心竞争力和加速解决方案。 1. 负责基于云上AI真实场景的解决方案和性能分析系统建设,构建性能标尺。 2. 负责基于云上大规模推理场景的构建和底层软件性能优化工作。 3. 负责包括CIPU、GPU、AI加速器等硬件在阿里云AI场景的竞争力构建。 4. 与厂商和内部业务团队合作,为阿里云的AI用户提供具有竞争力的AI解决方案。

更新于 2025-07-15北京|杭州|上海
logo of nio
社招7-10年数字技术

1. 负责主导 AI 编译引擎及内部各子模块的方案选择、设计、实现及优化; 2. 负责支撑自动驾驶算法落地,确保算法模型正确、高效运行。

更新于 2024-12-12北京|上海
logo of mi
社招3年以上D7842

1.负责AI芯片编译器的方案及开发实现(侧重点为高能效比与加速器的高利用率); 2.负责编译器及相应工具链的开发和维护; 3.结合AI算法,架构和产品需求,完成AI编译器的方案及软件开发; 4.模型的性能优化,研发性能和功耗分析及优化工作 5.结合业界编译器的发展动态,规划自研编译器的演进

更新于 2023-01-31北京|上海
logo of xpeng
社招

-我们正在寻找一名机器学习高级工程师-AI推理方向。理想的候选人需要拥有深厚的ML推理知识和强烈的热情来 优化我们的模型,以最高效的利用我们的AI加速器的每一个FLOP和每一个字节的内存。 -我们的使命是解决自动驾驶难题。您将与才华横溢的软件工程师、机器学习工程师和研究科学家团队合作,推动最先进的自动驾驶人工智能。 1、为深度学习模型在小鹏定制的AI加速器上的部署做优化。 2、为小鹏的AI加速器编开发内核。 3、为关键内核的性能估计建立数学模型。

更新于 2024-11-28上海|北京