快手【快Star-X实习】深度学习训练平台研发工程师
实习兼职J1020地点:北京状态:招聘
任职要求
1、硕士及以上学历,专业不限,计算机相关专业优先; 2、掌握Python/C++编程语言,了解RPC框架、集合通信和CUDA编程更佳; 3、了解AI infra 整体技术栈需求,有训练框架或推理…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、研发业界领先的推广搜深度学习训练框架,提供面向大规模稀疏数据的解决方案,服务于快手内部所有推荐类业务场景,包括 短视频、海外、广告、电商、直播等; 2、多样的业务形态和庞大的业务规模使得框架的开发与优化极富挑战性:万量级 GPU 卡,千亿量级样本,万亿量级参数,PB 量级训练数据。
包括英文材料
学历+
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
RPC+
https://javaguide.cn/distributed-system/rpc/rpc-intro.html
为什么要 RPC ? 因为,两个不同的服务器上的服务提供的方法不在一个内存空间,所以,需要通过网络编程才能传递方法调用所需要的参数。并且,方法调用的结果也需要通过网络编程来接收。
https://www.youtube.com/watch?v=S2osKiqQG9s
This video is part of an 8-lecture series on distributed systems, given as part of the undergraduate computer science course at the University of Cambridge.
CUDA+
https://developer.nvidia.com/blog/even-easier-introduction-cuda/
This post is a super simple introduction to CUDA, the popular parallel computing platform and programming model from NVIDIA.
https://www.youtube.com/watch?v=86FAWCzIe_4
Lean how to program with Nvidia CUDA and leverage GPUs for high-performance computing and deep learning.
还有更多 •••
相关职位
实习J1020
1、参与快手大规模深度学习推理引擎、大模型训练解决方案的研发与优化,包括大模型推理、模型训练框架、微调平台等; 2、参与底层算子的优化、通过优化访存pattern、计算提升推理性能。与算法部门合作,为公司大模型定制训练方案,探索RLHF、MoE、多模态、longcontext等前沿方向,提升训练性能; 3、优化推理框架上层调度策略,通过机内、机间的计算任务调度和通讯优化提升引擎性能;优化现有大语言模型相关工具和平台,提高模型训练、维护效率,降低成本,提升训练服务稳定性。
更新于 2025-06-04北京
实习J1020
1、参与快手模型训练推理的深度研发,提升模型训练、推理的框架性能; 2、与算法部门合作,为快手大模型定制训练方案,探索大模型的 RLHF、MoE、多模态、longcontext等前沿方向,提升训练性能; 3、分析服务器、手机端模型的推理特点,对计算、访存和通讯做出针对性优化; 4、关注前沿技术,跟进业内最新研究进展和应用趋势,提出创新思路和方向。
更新于 2025-05-06北京
实习
1. 参与人形机器人Vision-Language-Action (VLA)算法的研发,包括数据采集、模型训练与部署、多模态大模型在机器人操作任务中的应用; 2. 负责机器人动力学建模、轨迹优化、实时运动规划算法开发与调优; 3. 探索VLA模型与传统运动规划算法(RRT、轨迹优化、MPC等)的结合方式; 4. 跟踪Learning for Planning / Planning for Learning领域最新进展,推动技术创新; 5. 参与机器人数据集的构建、清洗与标注流程优化;
更新于 2025-12-01深圳