logo of thead

平头哥平头哥-编译器技术专家-AI软件-上海/北京

社招全职5年以上技术-芯片地点:上海 | 北京状态:招聘

任职要求


1. 熟练掌握C/C++/Python等编程技能,有扎实的编程基础、良好的编程风格和工作习惯;
2. 熟悉编译原理算法实现,二年及以上编译器开发经验;
3. 对机器学习算法/深度学习有一定了解尤佳;
4. 有GCCLLVM和Open64等开源编译器相关开发经验尤佳;
5. 有CUDA/OpenCL/汇编级优化经验尤佳;
6. 有深度学习相关框架中如Caffe/Tensorflow/PyTorch/MXNet等图优化开发经验尤佳;
7. 有计算机体系结构背景,熟悉芯片架构/微架构(包括CPU/GPU/SoC/FPGA), 有软硬件协同设计经验尤佳;
8. 具有独立解决问题的能力,良好的团队合作意识和沟通能力;

Requirements:
1. Strong C/C++/Python programming skills and solid knowledge of data structure and algorithm.
2. Familiarity with compiler theory, and experience on compiler development at least two year
3. Familiarity with machine learning or deep learning is a good plus.
4. Experience on open source compiler project such as GCC/LLVM/Open64 is a good plus.
5. Experience on Shader/CUDA/OpenCL assembler level performance is a good plus.
6. Experience on graph level compiler development on Caffe/Tensorflow/PyTorch/MXNet etc. is a good plus.
7. Familiarity with CPU or GPU architecture is a good plus.
8. Self motivated, team work, and good communication are a must.

工作职责


1、参与人工智能芯片的软硬件协同设计,指令集功能验证;
2、参与人工智能芯片的编译器算法设计和实现, 工具链开发与维护,网络模型的性能调优;
3、参与深度学习软件栈的设计和实现;

1. Working closely with hardware/architecture engineering and software teams to understand the hardware and software requirements. 
2. Responsible for compiler and tool chain design, implementation, maintaining and performance tuning.
3. Responsible for the design and implementation of deep learning software stack.
包括英文材料
C+
C+++
Python+
算法+
机器学习+
深度学习+
GCC+
LLVM+
CUDA+
OpenCL+
TensorFlow+
PyTorch+
MXNet+
SOC+
FPGA+
Shader+
编译原理+
Caffe+
相关职位

logo of nio
社招7-10年数字技术

1. 负责主导 AI 编译引擎及内部各子模块的方案选择、设计、实现及优化; 2. 负责支撑自动驾驶算法落地,确保算法模型正确、高效运行。

更新于 2024-12-12
logo of mi
社招3年以上D7842

1.负责AI芯片编译器的方案及开发实现(侧重点为高能效比与加速器的高利用率); 2.负责编译器及相应工具链的开发和维护; 3.结合AI算法,架构和产品需求,完成AI编译器的方案及软件开发; 4.模型的性能优化,研发性能和功耗分析及优化工作 5.结合业界编译器的发展动态,规划自研编译器的演进

更新于 2023-01-31
logo of xpeng
社招

-我们正在寻找一名机器学习高级工程师-AI推理方向。理想的候选人需要拥有深厚的ML推理知识和强烈的热情来 优化我们的模型,以最高效的利用我们的AI加速器的每一个FLOP和每一个字节的内存。 -我们的使命是解决自动驾驶难题。您将与才华横溢的软件工程师、机器学习工程师和研究科学家团队合作,推动最先进的自动驾驶人工智能。 1、为深度学习模型在小鹏定制的AI加速器上的部署做优化。 2、为小鹏的AI加速器编开发内核。 3、为关键内核的性能估计建立数学模型。

更新于 2024-11-28
logo of sensetime
社招3年以上技术产品管理

团队介绍 商汤科技国产化团队致力于将行业领先的AI大模型技术与国内自主创新的算力基础设施深度融合。团队负责打通从底层异构芯片到上层大模型应用的全链路,构建高效、稳定、自主的AI生产力平台。加入我们,你将有机会与顶尖的技术专家合作,定义和打造适配国产算力生态的下一代AI产品,亲身参与并引领这场波澜壮阔的技术变革。 岗位职责 1. 市场与技术洞察: 深入研究和分析国产异构算力芯片的技术路线、生态发展及市场趋势;深刻理解主流大模型(LLM、多模态等)的技术架构、训练与推理范式。 2. 产品规划与定义: 负责大装置在国产化算力上的适配与优化产品规划。主导需求分析,撰写高质量的产品需求文档(PRD),清晰定义产品功能、性能指标、验收标准及技术边界。 3. 项目推动与协同: 作为产品负责人,与算法、AI框架、底层硬件优化、测试及业务团队紧密合作,拉通端到端的产品研发流程,确保产品按时、高质量交付。 4. 技术方案对齐: 深度参与技术方案讨论,能够从产品视角出发,对模型适配、算子开发、编译优化、推理部署等关键技术环节提出建设性意见,确保技术方案最大化满足产品和市场需求。 5. 生态合作与赋能: 与国内主流芯片厂商、服务器厂商及重要客户建立技术交流渠道,传递产品价值,收集核心需求,共同推动国产AI生态的繁荣。 6. 产品生命周期管理: 负责产品的全生命周期管理,持续跟进产品上线后的表现,收集用户反馈,并基于数据和反馈驱动产品的迭代优化。

更新于 2025-08-21