logo of sohu

搜狐高性能计算研发工程师

社招全职智能媒体研发中心地点:北京状态:招聘

任职要求


1、硕士及以上学历,计算机专业出身。

2、熟悉CPU/GPU架构与工作原理,有深度学习系统研发经验,熟悉CUDA、Triton Language 等算子编写的相关技术。

3、熟悉LLM/多模态相关的算法技术以及推理加速方法,具有LLM训练及开发经验,如大模型数据处理、模型微调、预训练、强化学习等,了解SGLangVLLM,TRT-LLM大模型推理加速框架

4、具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化等,并能够根据不同场景和硬件平台进行针对性的优化。

5、熟悉常见的深度学习框架,如PyTorchTensorFlow等,并能够根据业务需求进行算法实现和调试。

6、具备较强的团队合作和沟通能力,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。

工作职责


1、负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等,负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度。

2、负责LLM/多模态模型的端到端部署和流程优化,探索包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。

3、负责设计和研发AI端到端任务编排体系,提升AI大模型在业务中的应用效率。

4、负责优化计算集群的资源调度和弹性计算策略,提升集群的资源利用率。

5、负责算法底层工程的链路设计和工程落地,提高服务的运行效率。
包括英文材料
学历+
深度学习+
CUDA+
大模型+
算法+
强化学习+
SGLang+
vLLM+
PyTorch+
TensorFlow+
相关职位

logo of sensetime
社招1-5年系统开发

1. 开发多模态场景下的高性能推理计算平台,优化车载大模型业务训练与推理性能,助力业务落地; 2. 构建自研高性能引擎,跟踪前沿技术,打造领先的推理平台; 3. 基于 GPU/CPU 搭建推理系统,提升 AI 系统技术水平,加速多模态视觉及语言模型; 4. 负责音频、视频、文本多模态工程全周期开发,涵盖数据准备 / 处理加速、模型部署评估;

更新于 2025-03-20
logo of baidu
社招TPG

-参与深度学习平台飞桨( PaddlePaddle)推理框架的设计、开发和业务支持 -负责深度学习框架的性能优化工作,包括但不限于功能模块在CPU/GPU上的深度优化工作 -负责深度学习推理框架前瞻技术的跟踪调研,实现技术创新突破 -参与深度学习框架的易用性优化工作,使开发者能够以更简单的方式实现各类任务,降低学习成本和开发成本 -负责异构高性能计算平台的设计、研发,高性能计算库、通信库开发与优化 -负责文心一言、萝卜快跑、搜索等业务大模型的推理性能优化

更新于 2025-06-10
logo of baidu
社招3-5年ACG

-参与百度智能云高性能计算系统的研发,包括集群管理、资源管理、任务调度、软件市场等方面 -参与高性能计算系统的易用性优化工作,使用户能够以更简单的方式实现管理并运行计算任务,降低学习成本和使用成本 -负责高性能计算系统的性能优化工作,包括但不限于功能模块在CPU/GPU上的深度优化工作 -探索业界新技术方向,将容器技术与高性能计算系统结合

更新于 2024-01-31
logo of bytedance
社招A232395

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、深度参与图像生成、视频生成、多模态视觉理解等视觉大模型训推一体化平台建设; 2、负责视觉大模型训练优化算法研究和落地,通过5D并行、通信优化、AutoCheckpointing等分布式训练手段提升模型的训练速度与效率; 3、通过编译优化、模型并行优化、图融合、高性能算子开发、低精度计算、Memory复用、Cache优化、高并发服务请求优化等技术,打造业界领先的高性能大模型训推引擎; 4、与算法部门深度合作,分析性能瓶颈,通过软硬结合提升模型训推效率,优化和部署视觉大模型,支持AI工具链和技术生态建设,推动字节跳动AI关键业务发展。

更新于 2024-06-06