logo of liauto

理想汽车AI高性能计算工程师-北京

校招全职算法与软件地点:北京状态:招聘

任职要求


1. 计算机、软件相关专业,硕士及以上学历;
2. 熟悉C/C++/Python语言,编程技能扎实;
3. 熟悉ARM/RISC-V体系架构,有SIMD/RVV向量指令性能优化经验优先;
4. 熟悉Linux操作系统,对kernel内存管理/进程管理/任务调度等核心机制比较了解,熟悉ThreadX/FreeRTOS等开源项目更优;
5. 掌握CNN/Transformer/LLM等相关算法基础知识;
6. 有AI算法在嵌入式系统部署经验更优。

工作职责


1. NPU Firmware/运行时库开发与交付;
2. NPU Firmware指令集设计与开发;
3. 参与硅前验证case开发,支持各种仿真平台算子与整网联调;
4. 参与硅后NPU Bringup;
5. 大模型在NPU芯片上量产部署。
包括英文材料
学历+
C+
C+++
Python+
RISC-V+
Linux+
内核+
FreeRTOS+
CNN+
Transformer+
大模型+
算法+
相关职位

logo of tencent
社招5年以上CSIG技术

1.参与基于GPU的高性能计算(HPC)项目设计与开发,负责GPU芯片(NVIDIA/AMD等)的底层性能优化与调优; 2.针对大模型推理、训练等场景,优化和扩展vLLM、SGLang等框架的核心模块,提升计算效率与资源利用率; 3.深入分析GPU硬件架构特性(如Tensor Core、显存带宽、通信机制等),设计并实现高性能算子与算法; 4.与算法训练团队协作,解决分布式推理下模型并行(Model Parallelism)、数据并行(Data Parallelism)等场景下的性能瓶颈问题; 5.探索前沿技术方向(如混合专家模型MoE、动态计算图优化等),推动AI工程化落地的效率提升。

更新于 2025-09-04
logo of tencent
社招2年以上Venus技术

1.负责大语言模型推理加速引擎一念(https://github.com/Tencent/KsanaLLM)的研发和业务应用,助力业务降本提效; 2.与算法团队、产品团队紧密协作,理解业务需求并提供定制化的高性能计算解决方案; 3.持续跟踪HPC领域的前沿技术,推动新技术在一念的应用与创新; 4.解决高性能计算场景下的复杂技术问题,确保系统的稳定性和可扩展性。

更新于 2025-09-11
logo of antgroup
社招2年以上技术类-开发

● 参与以GPU等AI芯片为基础的高性能计算项目,深度分析GPU硬件体系结构,建设打磨极致的算子优化和显存优化等技术,逼近硬件理论性能峰值,突破大模型训推的显存墙,提升蚂蚁异构计算集群的硬件效率。 ● 针对蚂蚁大模型训推的性能和效率等问题,持续迭代算子库、显存优化技术和工具链,构建AI系统生态。 ● 持续跟踪行业前沿技术,参与开源社区的贡献。

更新于 2025-06-18
logo of youku
社招4年以上

1、参与AI训练与推理系统的定制和优化,基于计算-存储-通信协同设计,为算法和模型迭代提供优秀的分布式训练和推理解决方案 2、构建高性能计算集群,提供跨地域异构算力的管理,解决通信、存储、调度等系统级瓶颈 3、深入AI框架底层(如PyTorch、Megatron、vLLM等),改进分布式计算、自动并行、显存优化等核心模块 4、支持AI服务的规模化部署,参与加速优化,算力调度优化和稳定性保障工作,提供通用的模型加速,问题诊断,可观测性等解决方案 5、探索前沿技术方向,如编译优化、post-train训练、agent基础框架等,参与算法模型和工程技术的联合创新实践,解决AI落地业务应用过程中,新出现的效率、规模问题

更新于 2025-07-29