字节跳动性能优化工程师(AI计算方向)-基础库与工具链
社招全职A245711地点:北京状态:招聘
任职要求
1、了解计算机体系结构、操作系统原理、编译原理、计算机网络中的基本概念和原理; 2、任一场景,LLM/NLP/推荐/视觉/语音下的训练、推理部署优化相关实践经验; 3、熟悉一种AI模型训练或推理框架(PyTorch或者Tensorflow); 4、了解AI场景的模型/算子编译优化(例如Xla/Torch.Compile/Triton)优先; 5、有性能评估/预估,算子性能优化、AI计算软硬件协同设计相关实践经验者优先。
工作职责
1、观测和分析在离线推理和训练场景的业务特点,例如软件热点,硬件瓶颈等,提出优化方案; 2、利用通用CPU(如ARM、X86、RISC-V等)、GPU、AI加速器架构特点、结合编译/操作系统/高性能库等底层软件技术,联合业务团队,极致优化指定业务性能; 3、导入异构卡构建/编译方案,适配业务场景,并进行性能评估。
包括英文材料
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
相关职位
社招A157582B
1、观测和分析在离线推理和训练场景的业务特点,例如软件热点,硬件瓶颈等,提出优化方案; 2、利用通用CPU(如ARM、X86、RISC-V等)、GPU、AI加速器架构特点、结合编译/操作系统/高性能库等底层软件技术,联合业务团队,极致优化指定业务性能; 3、导入异构卡构建/编译方案,适配业务场景,并进行性能评估。
更新于 2025-05-27
社招A15269
1、观测和分析在离线推理和训练场景的业务特点,例如软件热点,硬件瓶颈等,提出优化方案; 2、利用通用CPU(如ARM、X86、RISC-V等)、GPU、AI加速器架构特点、结合编译/操作系统/高性能库等底层软件技术,联合业务团队,极致优化指定业务性能; 3、导入异构卡构建/编译方案,适配业务场景,并进行性能评估。
更新于 2025-05-27
校招
1. 模型部署与调优: 将训练好的AI模型部署上线,进行性能优化与效果监控; 2. 数据处理工程: 负责大规模数据的清洗、预处理和特征工程; 3. 业务系统集成: 协助将AI能力集成到现有产品或业务流程中,解决实际业务问题; 4. 效果追踪与反馈: 协助模型部署集成及性能优化,分析业务效果,收集反馈并协助迭代优化。
更新于 2025-08-15