logo of liauto

理想汽车AI编译专家

社招全职5年以上智能与信息技术地点:上海状态:招聘

任职要求


1. 计算机、人工智能等相关专业硕士以上学历,5年研发经验;
2. 熟悉AI编译器,有LLVM、TVM、MLIR、XLA、Torch Compiler Backends 等编译开发方面的经验;
3. 扎实的代码能力,有较强的软件架构设计能力,熟练掌握C/C++/CUDA/Python等编程语言;
4. 熟悉TensorFlowPyTorch等框架,熟悉掌握深度学习性能加速技术,包括但不限于计算图优化、低精度优化、算子加速,以及DeepSpeed、Megatron等并行加速技术;
5. 熟悉大规模并行计算集群、分布式存储基础架构、高性能Collective 通信原语等;熟悉计算机体系结构,对CPU/GPU/DSA微架构或内存子系统有深刻理解;
6. 深度理解自动驾驶、CV、NLP/LLM等领域相关算法模型;
7. 三年以上团队技术管理经验。

工作职责


作为 AI 加速和 AI 编译器专家,负责开发和优化AI算法的编译器和工具链,设计和实施软硬件协同策略,推动AI技术在多个平台上的高效执行和应用。
1. 设计、开发和优化面向云上AI应用的Compiler Toolchain,提高算法在硬件上的性能和效率。
2. 研究和实现先进的软硬件协同设计方法,以优化AI模型的运行时性能和能效。
3. 与算法研发团队合作,确保AI模型的高效部署和执行。
4. 持续跟踪行业最新动态,评估和集成新的编程模型和软硬件技术。
包括英文材料
学历+
LLVM+
C+
C+++
CUDA+
Python+
TensorFlow+
PyTorch+
深度学习+
自动驾驶+
NLP+
大模型+
算法+
相关职位

logo of nio
社招7-10年数字技术

1. 负责主导 AI 编译引擎及内部各子模块的方案选择、设计、实现及优化; 2. 负责支撑自动驾驶算法落地,确保算法模型正确、高效运行。

更新于 2024-12-12
logo of horizon
社招8年以上软件序列

1、AI芯片中Vector相关部件的编译器实现和优化 2、AI异构计算框架的实现和优化

更新于 2025-08-14
logo of momenta
社招3年以上

岗位职责: 1.负责设计、开发和维护DSA架构下的NPU编译器工具链,确保其高效稳定运行。 2.扩展和优化深度学习框架(包括TensorFlow、PyTorch、ONNX等)的支持能力,提升AI模型兼容性。 3.负责计算图优化,包括各种网络的常见通用优化以及针对硬件平台的优化。 4.优化编译器工具链中的各种算法,以提高编译质量和执行效率。 5.与芯片设计团队及软件开发团队紧密合作,进行系统层面的编译器性能调优。 6.对开源编译器框架TVM/LLVM(MLIR)进行二次开发,以满足自驾业务需求。

更新于 2025-10-06
logo of horizon
社招5年以上软件序列

1、基于客户(使用)视角,定义和设计AI工具链(含编译和量化),通过使能算法高效部署,帮助客户达成最佳智驾体验; 2、对于既有平台:基于既有芯片和编译器,结合实际算法,持续优化,挖掘芯片平台的性能上限;并能使能客户达到性能上限;继而达成最佳智驾体验; 3、对于下一代平台:基于既有平台的使用经验积累、行业和智驾算法演进的判断,提供匹配下一代芯片的编译器的设计输入。

更新于 2025-08-18