快手【留用实习】大模型训练引擎性能优化工程师
实习兼职J1020地点:北京状态:招聘
任职要求
1.本科及以上学历,计算机科学、软件工程或相关专业优先,具备扎实的计算机基础知识。 2.熟练掌握C++和Python编程语言,熟悉Linux开发环境,具备良好的代码编写习惯。 3.了解深度学习框架(如PyTorch、TensorFlow等),熟悉Transformer架构及其优化技术。 4.具备使用性能分析工具(如nsys、torch…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.性能分析与优化:使用先进的性能分析工具(如nsys、torch profiler等),对大模型训练引擎进行性能剖析,定位瓶颈并提出优化方案。 2.分布式训练优化:深入研究分布式训练技术,探索并实现高效的并行策略,提升大规模模型训练的速度与效率。 3.代码优化与重构:参与训练引擎代码的优化与重构工作,提升代码质量与运行效率,确保系统的稳定性和可扩展性。 4.前沿技术研究:跟踪大模型训练领域的最新研究成果,复现并集成先进的优化技术,推动训练引擎的性能提升。
包括英文材料
学历+
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Linux+
https://ryanstutorials.net/linuxtutorial/
Ok, so you want to learn how to use the Bash command line interface (terminal) on Unix/Linux.
https://ubuntu.com/tutorials/command-line-for-beginners
The Linux command line is a text interface to your computer.
https://www.youtube.com/watch?v=6WatcfENsOU
In this Linux crash course, you will learn the fundamental skills and tools you need to become a proficient Linux system administrator.
https://www.youtube.com/watch?v=v392lEyM29A
Never fear the command line again, make it fear you.
https://www.youtube.com/watch?v=ZtqBQ68cfJc
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
还有更多 •••
相关职位
实习J1014
1、参与快手大规模深度学习推理引擎、大模型训练解决方案的研发与优化,包括大模型推理、模型训练框架、微调平台等; 2、参与底层算子的优化、通过优化访存pattern、计算提升推理性能,与算法部门合作,为公司大模型定制训练方案,探索RLHF、MoE、多模态、longcontext等前沿方向,提升训练性能; 3、优化推理框架上层调度策略,通过机内、机间的计算任务调度和通讯优化提升引擎性能;优化现有大语言模型相关工具和平台,提高模型训练、维护效率,降低成本,提升训练服务稳定性。
更新于 2025-05-23北京
实习J1020
1、负责依据不同业务场景的特点和新硬件特性,结合系统软硬件栈的整体调优,提出并实施性能优化方案; 2、负责持续跟踪业内软硬件相关领域的技术发展趋势,结合不同业务场景未来需求,开展方案预研以及推广应用工作。 具体包括以下两种场景或者两种之一: 1)AI计算相关场景,例如:大模型训练场景,AIGC、NLP、推荐等常规推理场景; 2)以容器云、大数据计算平台为例的通用计算平台场景。
更新于 2025-03-11上海|北京
实习J1020
1、负责依据不同业务场景的特点和新硬件特性,结合系统软硬件栈的整体调优,提出并实施性能优化方案; 2、负责持续跟踪业内软硬件相关领域的技术发展趋势,结合不同业务场景未来需求,开展方案预研以及推广应用工作; 具体包括以下三种场景或者三种之一: 1)以容器云、大数据计算平台为例的通用计算平台场景; 2)AI计算相关场景,例如:大模型训练场景,AIGC、NLP、推荐等常规推理场景; 3)结构化以及非结构化数据存储场景。
更新于 2025-03-04北京