logo of bytedance

字节跳动高性能优化工程师-Seed

社招全职A248506地点:北京状态:招聘

任职要求


1、计算机或相关专业研究生及以上学历;
2、熟练使用PythonC++,有良好的数据结构算法基础,了解计算机体系结构;
3、熟悉PyTorch/TensorFlow之一的训练框架,具备模型性能分析手段;
4、熟悉主流的并行编程以及性能优化技术,有CUDA开发经验,有使用NCCL/MPI进行分布式开发经验优先;
5、有DeepSpeed/Megatron等训练框架或TensorRT/TVM等推理引擎经验优先。

工作职责


1、使用混合精度、算子融合、分布式计算等手段,加速AI4S模型的训练和推理;
2、与算法团队深入合作,使用AI模型解决材料与生物领域复杂科学问题;
3、跟踪业界的最新进展,与团队共同建立广泛深入的专业认知。
包括英文材料
学历+
Python+
C+++
数据结构+
算法+
PyTorch+
TensorFlow+
CUDA+
DeepSpeed+
Megatron+
TensorRT+
推理引擎+
相关职位

logo of bytedance
社招A00725A

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责开发和优化字节跳动公司级的大模型推理框架; 2、主要通过GPU、CUDA性能优化的手段,结合线上实际情况,打造业界领先的高性能LLM推理引擎; 3、负责机器学习系统前瞻技术的调研和引入; 4、与算法部门深度合作,进行算法与系统的联合优化。

更新于 2024-05-08
logo of bytedance
社招3年以上A14035

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责语音场景下高性能训推计算平台开发,支撑各业务场景下的训练、推理性能优化需求并推动业务落地; 2、负责训推高性能方案建设,跟进前沿技术,补足关键能力,构建领先的高性能训推平台。

更新于 2023-04-21
logo of bytedance
社招A232395

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、深度参与图像生成、视频生成、多模态视觉理解等视觉大模型训推一体化平台建设; 2、负责视觉大模型训练优化算法研究和落地,通过5D并行、通信优化、AutoCheckpointing等分布式训练手段提升模型的训练速度与效率; 3、通过编译优化、模型并行优化、图融合、高性能算子开发、低精度计算、Memory复用、Cache优化、高并发服务请求优化等技术,打造业界领先的高性能大模型训推引擎; 4、与算法部门深度合作,分析性能瓶颈,通过软硬结合提升模型训推效率,优化和部署视觉大模型,支持AI工具链和技术生态建设,推动字节跳动AI关键业务发展。

更新于 2024-06-06
logo of bytedance
社招A54366

团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、评估:负责评估符合业务要求的异构计算芯片,建立/完善评估体系、负载模型,预估业务收益; 2、推理:负责异构计算芯片落地实际推理业务,适配异构计算芯片特性,降低推理时延,提高推理吞吐; 3、训练:负责异构计算芯片落地实际训练业务,根据芯片计算、通信特性,优化显存占用,提高训练吞吐; 4、算子:负责开发异构计算芯片的高性能算子,根据芯片特性,优化算力、带宽利用率; 5、编译:负责通过编译技术实现异构计算芯片在不同业务场景中落地,负责实现更加高效的异构硬件编程范式; 6、调研:负责调研、验证前沿软硬件结合方向,比如稀疏计算(Sparse Computation)、存内计算(In-Memory Computing)、数据流计算(DataFlow)等。

更新于 2024-05-08