快手【留用实习】训推框架编译优化工程师
实习兼职J1020地点:北京状态:招聘
任职要求
1、硕士及以上学历,专业不限,计算机相关专业优先; 2、了解AI infra 整体技术栈需求,有训练框架或推理框架实战经验、熟悉Tensorflow 或 PyTorch 的使用、有二次开发能力或开源社区贡献经历更佳; 加分项: 1、有大模型相关训练或推理优化经验或GPU 高性能算子开发经验…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、参与研发业界领先的深度学习编译技术,落地计算优化、显存优化及分布式优化技术到训练框架和推理框架中,赋能深度学习算法落地; 2、XLA 相关编译优化功能开发; 3、结合pytorch/tensorflow等上下游框架适配与集成; 4、异构大模型推理引擎优化,负责调研NV 上各种推理引擎的优化技术,并支持大模型推理各种优化技术在异构硬件上的落地。
包括英文材料
学历+
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
还有更多 •••
相关职位
社招J1020
1、参与大模型推理/训练优化。通过研发业界领先的AI Compiler 技术,支撑搜推场景在GPU上的训练计算性能优化;支持大模型推理优化技术在异构硬件上的落地; 2、参与各种大模型推理所需的功能性开发任务;相关编译优化功能开发,以图优化、算子融合、GPU高性能算子开发及自动Codegen等技术手段不断推高在不同卡型上的计算性能极限; 3、参与支持日常的大模型推理服务部署,参与内部日常提效工具的研发。
更新于 2025-05-26北京
实习J1014
1、负责快手各产品后端系统、平台系统的研发工作,通过敏捷开发支持产品需求快速迭代,不断优化系统架构,支撑业务规模增长,保障服务稳定; 2、对现有系统的不足进行分析,找到目前系统的瓶颈,改进提高系统性能; 3、参与解决海量数据分布式处理、高效查询、数据一致性、准确性等方面带来的各种技术难题和挑战。
更新于 2025-05-20北京
实习J1014
1、负责容器云平台的一个或多个领域的设计与开发; 2、基于Kubernetes完善统一调度、多集群联邦能力,提升集群运维效率; 3、基于但不限于servicemesh技术栈,实现微服务架构业务&离线计算任务的流量管控、链路追踪等基础能力; 4、负责公司混合计算平台及相关技术的设计与开发,提升异构资源管理效率; 5、结合容器领域前沿技术,负责容器云全局技术优化与落地实践。
更新于 2025-05-20杭州|北京