快手多元算力AI优化工程师(上海)
社招全职D8950地点:上海状态:招聘
任职要求
1、对AI领域的基本理论与常见模型算法,有深刻的理解; 2、熟练使用tensor flow或pytorch,进行模型训练或推理优化; 3、对使用GPU做AI算法加速有相关经历,熟悉GPU CUDA编程; 4、对计算机体系结构有深刻理解,至少对以下子领域中的两个或两个以上有相关经历:CPU、GPU微架构性能分析,Linux内核,网络协议,集合通讯原理。
工作职责
从事AIGC相关领域的硬件解决方案开发与性能优化工作,具体包括以下二者或二者之一: 1、大规模训练集群在LLM模型训练负载下的性能分析与相关优化工作; 2、业界AIGC主流模型在推理侧的性能分析与优化工作。
包括英文材料
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
CUDA+
https://developer.nvidia.com/blog/even-easier-introduction-cuda/
This post is a super simple introduction to CUDA, the popular parallel computing platform and programming model from NVIDIA.
https://www.youtube.com/watch?v=86FAWCzIe_4
Lean how to program with Nvidia CUDA and leverage GPUs for high-performance computing and deep learning.
Linux+
https://ryanstutorials.net/linuxtutorial/
Ok, so you want to learn how to use the Bash command line interface (terminal) on Unix/Linux.
https://ubuntu.com/tutorials/command-line-for-beginners
The Linux command line is a text interface to your computer.
https://www.youtube.com/watch?v=6WatcfENsOU
In this Linux crash course, you will learn the fundamental skills and tools you need to become a proficient Linux system administrator.
https://www.youtube.com/watch?v=v392lEyM29A
Never fear the command line again, make it fear you.
https://www.youtube.com/watch?v=ZtqBQ68cfJc
内核+
https://www.youtube.com/watch?v=C43VxGZ_ugU
I rummage around the Linux kernel source and try to understand what makes computers do what they do.
https://www.youtube.com/watch?v=HNIg3TXfdX8&list=PLrGN1Qi7t67V-9uXzj4VSQCffntfvn42v
Learn how to develop your very own kernel from scratch in this programming series!
https://www.youtube.com/watch?v=JDfo2Lc7iLU
Denshi goes over a simple explanation of what computer kernels are and how they work, alonside what makes the Linux kernel any special.
相关职位
社招1年以上ACG
-负责云原生产品 Kubernetes 容器引擎、镜像服务、可观测服务等的设计与研发工作,提升产品竞争力及体验 -负责大规模 AI Infra 云原生底座的设计与研发工作,基于云原生技术打造异构多元芯算力底座,支持国产化信创,支持业务进行大规模训练、容错及弹性推理,构建异构多元芯算力底座 -负责打造现代化的云原生智能运维能力,设计和实现覆盖 AI 场景全栈的故障感知、诊断及自愈能力 -持续提升云原生产品服务及基础设施的稳定性,优化服务性能,提升架构的可扩展性 -探索业界最新技术方向,参与开源社区,提升百度云原生核心竞争力
更新于 2025-04-28
社招ACG
-AI大模型方案设计与优化。负责为客户构思、设计并实施AI大模型的先进解决方案,旨在从AI算力基础设施、AI开发工具、AI大模型的数据与算法,以及AI大模型的应用场景等多个层面,推动客户在百度云平台上实现AI应用快速实验与落地 -深度客户管理。主动与客户进行深度沟通,洞察其业务需求与挑战,最终实现客户成功的结果。通过持续的实践经验积累,形成具有行业特色的AI解决方案,并致力于在行业中实现突破性的应用 -项目执行与推动。担任关键角色,推动客户上云、用云的项目顺利进行,确保项目从商务合作、技术方案、业务进度、风险把控、资源分配等各方面的协同工作得以落地执行 -产品创新与升级。不断将客户的需求转化为实际的云标准产品功能,积极推动百度云平台上产品的持续进步与迭代,确保我们的产品与服务始终保持在行业的前沿
更新于 2024-01-31
社招D8950
从事AIGC相关领域的平台级软硬件解决方案开发与性能优化工作,具体包括以下二者或二者之一: 1、大规模训练集群在LLM模型训练负载下的性能分析与相关优化工作; 2、AIGC主流模型(SD/类Sora)在训练/推理侧的性能分析与优化工作。
更新于 2025-06-05