logo of liauto

理想汽车AI高性能计算工程师-北京

校招全职算法与软件地点:北京状态:招聘

任职要求


1. 计算机、软件相关专业,硕士及以上学历;
2. 熟悉C/C++/Python语言,编程技能扎实;
3. 熟悉ARM/RISC-V体系架构,有SIMD/RVV向量指令性能优化经验优先;
4. 熟悉Linux操作系统,对k…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. NPU Firmware/运行时库开发与交付;
2. NPU Firmware指令集设计与开发;
3. 参与硅前验证case开发,支持各种仿真平台算子与整网联调;
4. 参与硅后NPU Bringup;
5. 大模型在NPU芯片上量产部署。
包括英文材料
学历+
C+
C+++
Python+
RISC-V+
Linux+
还有更多 •••
相关职位

logo of honor
社招研发类

1、负责深度学习框架的基础功能开发,实现各种计算操作,支持常见芯片平台; 2、使用各种高性能计算库提升深度学习框架计算速度; 3、紧跟业内最新技术,甄别技术成熟度。

更新于 2025-08-18北京
logo of tencent
社招5年以上CSIG技术

1.参与基于GPU的高性能计算(HPC)项目设计与开发,负责GPU芯片(NVIDIA/AMD等)的底层性能优化与调优; 2.针对大模型推理、训练等场景,优化和扩展vLLM、SGLang等框架的核心模块,提升计算效率与资源利用率; 3.深入分析GPU硬件架构特性(如Tensor Core、显存带宽、通信机制等),设计并实现高性能算子与算法; 4.与算法训练团队协作,解决分布式推理下模型并行(Model Parallelism)、数据并行(Data Parallelism)等场景下的性能瓶颈问题; 5.探索前沿技术方向(如混合专家模型MoE、动态计算图优化等),推动AI工程化落地的效率提升。

更新于 2025-09-04上海
logo of tencent
社招2年以上Venus技术

1.负责大语言模型推理加速引擎一念(https://github.com/Tencent/KsanaLLM)的研发和业务应用,助力业务降本提效; 2.与算法团队、产品团队紧密协作,理解业务需求并提供定制化的高性能计算解决方案; 3.持续跟踪HPC领域的前沿技术,推动新技术在一念的应用与创新; 4.解决高性能计算场景下的复杂技术问题,确保系统的稳定性和可扩展性。

更新于 2025-12-03深圳
logo of antgroup
社招2年以上技术类-开发

● 参与以GPU等AI芯片为基础的高性能计算项目,深度分析GPU硬件体系结构,建设打磨极致的算子优化和显存优化等技术,逼近硬件理论性能峰值,突破大模型训推的显存墙,提升蚂蚁异构计算集群的硬件效率。 ● 针对蚂蚁大模型训推的性能和效率等问题,持续迭代算子库、显存优化技术和工具链,构建AI系统生态。 ● 持续跟踪行业前沿技术,参与开源社区的贡献。

更新于 2025-12-01北京|杭州