logo of bytedance

字节跳动硬件加速算子编译器工程师

社招全职A15860地点:上海状态:招聘

任职要求


1、熟悉编译原理以及相关编译优化技术;
2、有良好的算法和编程基础;
3、熟悉LLVM 编译器架构;
4、熟悉Intel/AMD x86-64或ARM64、RISC-V体系结构,精通x86-64、ARM…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责硬件加速平台多款芯片的传统编译器开发和优化;
2、负责Clang前端混合编译语法支持;
3、负责异构编译技术针对AI领域与异构硬件的功能开发与性能优化;
4、负责新架构的研究和讨论。
包括英文材料
算法+
LLVM+
还有更多 •••
相关职位

logo of antgroup
社招3年以上技术-开发

1、全同态/AI编译器开发:设计并实现高效的编译器框架,支持全同态加密或AI模型的自动编译与优化。开发编译器前端、中间表示(IR)及后端,确保编译器能够高效处理复杂的数学运算和加密逻辑。优化编译器性能,提升生成代码的执行效率和资源利用率。 2、算子DSL设计与实现:设计并实现领域特定语言(DSL),用于描述全同态加密或AI算子的数学表达式和计算流程。确保DSL具备良好的可扩展性,支持多种硬件平台和算法需求。提供清晰的DSL接口文档和开发者工具链,降低用户使用门槛。 3、算子优化:针对全同态加密或AI算子进行深度优化,包括但不限于内存访问模式、并行化策略和硬件加速。分析现有算子的性能瓶颈,提出并实施优化方案,显著提升计算效率。探索新型算法和硬件架构(如GPU、TPU、FPGA等)在算子优化中的应用。 4、跨团队协作:与算法团队、硬件团队及产品团队紧密合作,确保编译器和算子优化方案满足实际业务需求。参与技术讨论和代码评审,推动团队技术水平的整体提升。 5、技术研究与创新:跟踪全同态加密和AI领域的最新研究成果,探索其在编译器优化中的潜在应用。发表相关技术论文或专利,提升公司在行业内的技术影响力。

更新于 2025-09-24北京|上海
logo of bytedance
社招A68454

1、负责业务模型在自研AI编译器的端到端编译支持工作; 2、负责模型编译优化工作; 3、对接前端框架(Pytorch/Tensorflow)模型解析工作; 4、负责图层面算子融合的优化工作; 5、业务前沿模型及硬件适配性评估,软硬件协同优化工作; 6、负责模型量化编译工作。

更新于 2024-12-24杭州
logo of bytedance
社招A245845

1、负责业务模型在自研AI编译器的端到端编译支持工作; 2、负责模型编译优化工作; 3、对接前端框架(Pytorch/Tensorflow)模型解析工作; 4、负责图层面算子融合的优化工作; 5、业务前沿模型及硬件适配性评估,软硬件协同优化工作; 6、负责模型量化编译工作。

更新于 2024-08-19上海
logo of bytedance
社招A224630

1、负责硬件加速器训练框架调研; 2、参与软硬件协同设计,对关键硬件参数进行仿真; 3、负责实际业务模型训练任务调研; 4、负责训练中通信算子研发以及性能优化。

更新于 2025-04-02上海