logo of antgroup

蚂蚁金服蚂蚁集团-运行时Runtime工程师-上海【蚂蚁密算】

社招全职5年以上技术-基础平台地点:上海状态:招聘

任职要求


1、计算机相关专业,本科及以上学历,5年以上底软开发经验,熟练掌握C/C++/Makefile/bash等语言的使用;
2、精通Linux内核,包括但不限于bootloader,init,内存管理,设备驱动等;
3、精通C/C++,具有异构Runtime开发和量产交付经验优先;
4、熟悉TVM/MLR等框架Runtime系统,熟悉AI模型推理部署链路,内存管理等;
5、熟悉深度学习算法大模型基本结构,熟悉相关推理框架,如llama.cppvLLM、OLLAMA 等;
6、熟悉NPU/GPGPU架构和工作原理;

工作职责


1、基于自研AI芯片开发Runtimee/UMD软件栈;
2、负责异构调度开发;
3、参与硬件整个设计流程,迭代驱动设计以满足model/emulation/hardware的需求;
4、分析和解决KMD/UMD的功能、性能和稳定性问题,确保高质量软件交付;
5、跟踪行业趋势和实践,持续改进driver的设计和实现;
包括英文材料
学历+
C+
C+++
Bash+
Linux+
内核+
深度学习+
算法+
大模型+
Llama+
vLLM+
相关职位

logo of nio
社招3-5年算法

负责开发深度学习AI模型的runtime软件,完成计算资源调度、内存管理、host-device并行优化工作。 1,分析和解决KMD/UMD的功能、性能和稳定性问题,确保高质量交付AI系统的运行时软件; 2,与编译器、驱动工程师协同提供定制优化项和编程api; 3,参与故障检测和恢复机制设计,保证AI系统的可靠性; 4,参与Profiling工具设计,保证AI系统的性能可视化和瓶颈定位; 5,持续改进通信和调度机制, 与业务团队协作完成多模型部署,提高芯片的综合计算效率和系统吞吐量;

更新于 2025-05-27
logo of nio
社招3-5年算法

1、参与算子编译器、图编译器和算子 Kernel 的设计、开发与优化; 2、负责 AI 推理引擎及 Runtime 的架构设计、性能调优和稳定性提升; 3、与智能辅助驾驶算法团队及硬件工程师紧密协作,将算法模型高效地落地到编译器和运行时环境; 4、 编写高质量、可维护的 C/C++代码,完成模块测试、文档编写及代码评审; 5、定期进行性能分析与瓶颈定位,推动系统整体吞吐与延迟指标的持续改进; 6、跟踪业界最新 AI 编译及推理技术,评估并引入前沿方案,推动技术演进。

更新于 2025-06-13
logo of mi
社招A217478

1 技术竞争力提升:参与产品编译器和运行时的技术竞争力提升,协助识别性能突破点并提出优化方案,支持产品卖点特性构建。 2 能力构建与提升:参与产品编译器和运行时的能力构建及提升,协助识别并构建领域内关键技术竞争力。 3 前沿技术研究与竞品分析:参与编译器和运行时领域的前沿技术研究,协助进行竞品分析,导入先进技术,支撑产品能力提升。

更新于 2025-02-11
logo of liauto
社招5年以上智能与信息技术

1.NPU Firmware方案设计、开发与交付; 2.收集软件开发需求,参与NPU指令集架构定义; 3.Pre-silicon阶段协同架构/DV/CV团队建立验证基础设施,支持C-Model/Simulation/Emulation平台算子开发和整网串联; 4.Post-silicon阶段NPU Bringup; 5.编译工具链联调交付、支持编译器和算法工程团队进行问题定位分析; 6.支持自动驾驶模型整网在VDK/Zebu平台端到端部署。