logo of bytedance

字节跳动性能优化工程师(AI计算方向)-基础库与工具链

社招全职A245711地点:北京状态:招聘

任职要求


1、了解计算机体系结构、操作系统原理、编译原理、计算机网络中的基本概念和原理;
2、任一场景,LLM/NLP/推荐/视觉/语音下的训练、推理部署优化相关实践经验;
3、熟悉一种AI模型训练或推理框架(PyTorch或者Tensorflow);
4、了解AI场景的模型/算子编译优化(例如Xla/Torch.Compile/Triton)优先;
5、有性能评估/预估,算子性能优化、AI计算软硬件协同设计相关实践经验者优先。

工作职责


1、观测和分析在离线推理和训练场景的业务特点,例如软件热点,硬件瓶颈等,提出优化方案;
2、利用通用CPU(如ARM、X86、RISC-V等)、GPU、AI加速器架构特点、结合编译/操作系统/高性能库等底层软件技术,联合业务团队,极致优化指定业务性能;
3、导入异构卡构建/编译方案,适配业务场景,并进行性能评估。
包括英文材料
大模型+
NLP+
PyTorch+
TensorFlow+
相关职位

logo of bytedance
社招A157582B

1、观测和分析在离线推理和训练场景的业务特点,例如软件热点,硬件瓶颈等,提出优化方案; 2、利用通用CPU(如ARM、X86、RISC-V等)、GPU、AI加速器架构特点、结合编译/操作系统/高性能库等底层软件技术,联合业务团队,极致优化指定业务性能; 3、导入异构卡构建/编译方案,适配业务场景,并进行性能评估。

更新于 2025-05-27
logo of bytedance
社招A15269

1、观测和分析在离线推理和训练场景的业务特点,例如软件热点,硬件瓶颈等,提出优化方案; 2、利用通用CPU(如ARM、X86、RISC-V等)、GPU、AI加速器架构特点、结合编译/操作系统/高性能库等底层软件技术,联合业务团队,极致优化指定业务性能; 3、导入异构卡构建/编译方案,适配业务场景,并进行性能评估。

更新于 2025-05-27
logo of anker
校招

1. 模型部署与调优: 将训练好的AI模型部署上线,进行性能优化与效果监控; 2. 数据处理工程: 负责大规模数据的清洗、预处理和特征工程; 3. 业务系统集成: 协助将AI能力集成到现有产品或业务流程中,解决实际业务问题; 4. 效果追踪与反馈: 协助模型部署集成及性能优化,分析业务效果,收集反馈并协助迭代优化。

更新于 2025-08-15
logo of anker
校招

1. 模型部署与调优: 将训练好的AI模型部署上线,进行性能优化与效果监控; 2. 数据处理工程: 负责大规模数据的清洗、预处理和特征工程; 3. 业务系统集成: 协助将AI能力集成到现有产品或业务流程中,解决实际业务问题; 4. 效果追踪与反馈: 协助模型部署集成及性能优化,分析业务效果,收集反馈并协助迭代优化。

更新于 2025-08-15