字节跳动硬件加速算子编译器工程师
任职要求
1、熟悉编译原理以及相关编译优化技术; 2、有良好的算法和编程基础; 3、熟悉LLVM 编译器架构; 4、熟悉Intel/AMD x86-64或ARM64、RISC-V体系结构,精通x86-64、ARM…
工作职责
1、负责硬件加速平台多款芯片的传统编译器开发和优化; 2、负责Clang前端混合编译语法支持; 3、负责异构编译技术针对AI领域与异构硬件的功能开发与性能优化; 4、负责新架构的研究和讨论。
1、全同态/AI编译器开发:设计并实现高效的编译器框架,支持全同态加密或AI模型的自动编译与优化。开发编译器前端、中间表示(IR)及后端,确保编译器能够高效处理复杂的数学运算和加密逻辑。优化编译器性能,提升生成代码的执行效率和资源利用率。 2、算子DSL设计与实现:设计并实现领域特定语言(DSL),用于描述全同态加密或AI算子的数学表达式和计算流程。确保DSL具备良好的可扩展性,支持多种硬件平台和算法需求。提供清晰的DSL接口文档和开发者工具链,降低用户使用门槛。 3、算子优化:针对全同态加密或AI算子进行深度优化,包括但不限于内存访问模式、并行化策略和硬件加速。分析现有算子的性能瓶颈,提出并实施优化方案,显著提升计算效率。探索新型算法和硬件架构(如GPU、TPU、FPGA等)在算子优化中的应用。 4、跨团队协作:与算法团队、硬件团队及产品团队紧密合作,确保编译器和算子优化方案满足实际业务需求。参与技术讨论和代码评审,推动团队技术水平的整体提升。 5、技术研究与创新:跟踪全同态加密和AI领域的最新研究成果,探索其在编译器优化中的潜在应用。发表相关技术论文或专利,提升公司在行业内的技术影响力。
1、负责业务模型在自研AI编译器的端到端编译支持工作; 2、负责模型编译优化工作; 3、对接前端框架(Pytorch/Tensorflow)模型解析工作; 4、负责图层面算子融合的优化工作; 5、业务前沿模型及硬件适配性评估,软硬件协同优化工作; 6、负责模型量化编译工作。
1、负责业务模型在自研AI编译器的端到端编译支持工作; 2、负责模型编译优化工作; 3、对接前端框架(Pytorch/Tensorflow)模型解析工作; 4、负责图层面算子融合的优化工作; 5、业务前沿模型及硬件适配性评估,软硬件协同优化工作; 6、负责模型量化编译工作。