logo of bytedance

字节跳动硬件加速模型编译优化工程师

社招全职A245845地点:上海状态:招聘

任职要求


1、深入理解深度学习框架和软件栈,熟悉C++Python等编程语言; 
2、有主动学习、快速解决问题的能力和自我驱动力。

以下为加分项: 
1、熟悉计算机体系结构和并行计算; 了解编译器和代码优化技术,熟悉MLIR、TVM、XLA等中间表示,有相关开发经验; 
2、对常…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责业务模型在自研AI编译器的端到端编译支持工作;
2、负责模型编译优化工作;
3、对接前端框架(Pytorch/Tensorflow)模型解析工作;
4、负责图层面算子融合的优化工作;
5、业务前沿模型及硬件适配性评估,软硬件协同优化工作;
6、负责模型量化编译工作。
包括英文材料
深度学习+
C+++
Python+
还有更多 •••
相关职位

logo of bytedance
社招A68454

1、负责业务模型在自研AI编译器的端到端编译支持工作; 2、负责模型编译优化工作; 3、对接前端框架(Pytorch/Tensorflow)模型解析工作; 4、负责图层面算子融合的优化工作; 5、业务前沿模型及硬件适配性评估,软硬件协同优化工作; 6、负责模型量化编译工作。

更新于 2024-12-24杭州
logo of mi
社招A113845

1. 负责大语言模型线上推理框架的性能优化,解决高并发、低延迟、高可靠性等核心问题,提升服务吞吐量与稳定性 2. 设计并实现分布式大模型推理系统,优化多卡(如NVIDIA GPU集群)资源调度与通信效率,支持千卡级训练/推理场景 3. 深度适配NVIDIA GPU硬件架构,利用CUDA、cuDNN等工具链进行算子级优化,提升模型计算效率与显存利用率 4. 调研并引入前沿技术(如异构计算、AI编译器优化),推动模型量化、蒸馏等轻量化方案落地

更新于 2024-09-24北京
logo of xpeng
社招智能机器人板块

1、负责超大规模机器学习系统架构的设计开发,解决系统高并发、高可靠性、高可扩展性等技术难关; 2、覆盖机器学习系统多个子方向领域的工作,包括:资源调度、分布式模型训练、数据管理、高性能计算等; 3、负责机器学习系统前瞻技术的调研和引入,比如:最新硬件架构、异构计算系统、编译优化技术、强化学习RL/Agent环境交互技术等的引入落地; 4、与算法部门深度合作,进行算法与系统的联合优化。

更新于 2025-08-19深圳|上海|北京
logo of bytedance
社招A58008

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责超大规模机器学习系统架构的设计开发,解决系统高并发、高可靠性、高可扩展性等技术难关; 2、覆盖机器学习系统多个子方向领域的工作,包括:资源调度、分布式模型训练、数据管理、高性能计算等; 3、负责机器学习系统前瞻技术的调研和引入,比如:最新硬件架构、异构计算系统、编译优化技术、强化学习RL/Agent环境交互技术等的引入落地; 4、与算法部门深度合作,进行算法与系统的联合优化。

更新于 2025-05-08北京