快手【留用实习】训推框架编译优化工程师
实习兼职J1020地点:北京状态:招聘
任职要求
1、硕士及以上学历,专业不限,计算机相关专业优先; 2、了解AI infra 整体技术栈需求,有训练框架或推理框架实战经验、熟悉Tensorflow 或 PyTorch 的使用、有二次开发能力或开源社区贡献经历更佳; 加分项: 1、有大模型相关训练或推理优化经验或GPU 高性能算子开发经验…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、参与研发业界领先的深度学习编译技术,落地计算优化、显存优化及分布式优化技术到训练框架和推理框架中,赋能深度学习算法落地; 2、XLA 相关编译优化功能开发; 3、结合pytorch/tensorflow等上下游框架适配与集成; 4、异构大模型推理引擎优化,负责调研NV 上各种推理引擎的优化技术,并支持大模型推理各种优化技术在异构硬件上的落地。
包括英文材料
学历+
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
还有更多 •••
相关职位
社招J1020
1、参与大模型推理/训练优化。通过研发业界领先的AI Compiler 技术,支撑搜推场景在GPU上的训练计算性能优化;支持大模型推理优化技术在异构硬件上的落地; 2、参与各种大模型推理所需的功能性开发任务;相关编译优化功能开发,以图优化、算子融合、GPU高性能算子开发及自动Codegen等技术手段不断推高在不同卡型上的计算性能极限; 3、参与支持日常的大模型推理服务部署,参与内部日常提效工具的研发。
更新于 2025-05-26北京
社招5-8年D0668
1、贴近业务,深入了解业务发展及组织现状,发现问题并积极主动推动解决; 2、建立有效的沟通渠道,保证信息在组织内传递通畅并形成有效的信息管理追踪机制; 3、推动公司人力资源重点项目在所支持业务单元的落地与实施,并对实施效果进行反馈与改进; 4、梳理各业务单元HC,优化人员配置,推动并协助招聘团队实现人员的及时补充与培育留用; 5、帮助管理者提升团队向心力,包括新员工融入、团队建设、员工关怀等。
更新于 2025-04-22北京