logo of bytedance

字节跳动高性能异构计算工程师-PICO(北京/上海)

社招全职A167397地点:北京状态:招聘

任职要求


1、硕士研究生及以上学历,计算机相关专业优先;
2、熟悉主流并行编程以及性能优化技术,如NEON、Hexagon DSP、OpenCLCUDA、Vulkan等;
3、具备良好的沟通能力,及时关注业界最新技术,追求高质量代码与架构设计。

加分项:
1、熟悉Triton、MLIR、XLA、TVM、Halide等编译优化技术;
2、熟悉模型定点量化、稀疏化、裁剪、知识蒸馏、NAS等模型优化技术;
3、具备机器学习平台研发经验。

工作职责


1、负责机器学习平台和训推框架的研发,提升GPU利用率;
2、负责高性能计算框架的研发,低功耗算法优化;
3、负责模型结构在不同硬件上压缩、量化、稀疏化,裁剪方面的加速落地;
4、负责算法性能评估和分析,制定技术规划和性能标准,补齐关键竞争力。
包括英文材料
学历+
OpenCL+
CUDA+
系统设计+
机器学习+
相关职位

logo of baidu
社招TPG

-参与深度学习平台飞桨( PaddlePaddle)推理框架的设计、开发和业务支持 -负责深度学习框架的性能优化工作,包括但不限于功能模块在CPU/GPU上的深度优化工作 -负责深度学习推理框架前瞻技术的跟踪调研,实现技术创新突破 -参与深度学习框架的易用性优化工作,使开发者能够以更简单的方式实现各类任务,降低学习成本和开发成本 -负责异构高性能计算平台的设计、研发,高性能计算库、通信库开发与优化 -负责文心一言、萝卜快跑、搜索等业务大模型的推理性能优化

更新于 2025-06-10
logo of baidu
社招ACG

-建设业界领先的AI异构算力容器平台,提供高性能、高稳定性、高易用性的百舸产品,支持AIGC、智算中心、金融、 -结合 SOTA 模型训练推理优化原理,深入模型结构与设计思路,将训练推理优化手段工程实践化,为客户提供系统性加速方案,提升训推效率 -在自研芯片上适配常见大模型,结合深度学习训推框架特性,开发或调优相关算子,提升模型在芯片上的性能和精度表现,辅助客户进行芯片选型和应用 -针对大规模异构集群场景下,探索训推任务管理、异构资源调度、虚拟化混布、容器存储、高性能网络、分布式训练和推理等技术的创新和应用 -探索业界最新技术方向,参与机器学习框架等开源社区,提升百度混合云AI核心竞争力

更新于 2025-05-15
logo of baidu
社招ACG

-负责百度AI计算集群高性能通信库研发工作 -负责百度AI计算集群训推框架通信优化工作 -负责百度AI计算集群通信性能与可用性诊断工作 -负责百度AI计算集群与通信关联的其他软件研发与维护工作

更新于 2025-07-11
logo of anker
校招

1. 设计并优化AI大模型训练框架,通过混合并行加速、训推一体复用等技术,提升大模型训练性能; 2. 针对模型的训练和推理任务进行底层代码级优化(CPU/GPU/异构计算); 3. 研发高效的故障定位系统和容错机制,保障大规模训练的稳定性,监控训练任务日志,快速识别和修复问题。

更新于 2025-08-14