logo of baidu

百度资深异构计算架构师(J84309)

社招全职ACG地点:北京状态:招聘

任职要求


-本科及以上学历,计算机、AI相关专业背景
-熟悉PyTorchTensorFlowPaddlePaddle深度学习框架,熟悉GPU芯片架构,了解MegatronvLLM大模型训推框架,有大规模训练推理实践经验者优先
-熟悉推理优化:负载均衡、模型压缩(蒸馏/量化)、缓存策略、异构计算加速等
-熟悉训练优化:分布式训练、显存优化(如Zero/Offload)、混合精度、MoE架构调优等
-优秀的编码能力,熟悉Golang/Python/Java/C/C++至少一项,有扎实的算法数据结构基础
-熟悉Kubernetes工作原理,熟悉调度器、资源扩展机制、容器运行时、容器网络等技术,有Kubernetes开发和维护经验
-有独立的分析问题和解决问题的能力,强烈的责任心,较强的学习能力,沟通能力

工作职责


-负责建设业界领先的AI异构算力容器平台,提供高性能、高稳定性、高易用性的混合云产品,支持AIGC、智算中心、智驾、金融能源等客户AI应用高效部署
-负责云原生AI容器相关产品的架构设计和产品研发,引入开源社区先进的AI框架、AI调度、AI工作流和AI可观测能力组件构建全栈AI应用云原生解决方案
-结合 SOTA 模型训练推理优化原理,深入模型结构与设计思路,将训练推理优化手段工程实践化,为客户提供系统性加速方案,提升训推效率
-针对大规模异构集群场景下,探索训推任务管理、异构资源调度、虚拟化混布、容器存储、高性能网络、分布式训练和推理等技术的创新和应用
-探索业界最新技术方向,参与机器学习框架等开源社区,提升百度混合云AI核心竞争力,提升团队技术影响力
包括英文材料
学历+
PyTorch+
TensorFlow+
PaddlePaddle+
深度学习+
Megatron+
vLLM+
大模型+
缓存+
Go+
Python+
Java+
C+
C+++
算法+
数据结构+
Kubernetes+
相关职位

logo of didi
社招技术

1. 主导大模型推理引擎的架构设计与核心模块开发,支撑千亿参数模型的高效分布式推理。 2. 研发面向GPU/NPU等异构计算平台的高性能算子,提升硬件利用效率。 3. 参与模型低精度量化,图优化,编译优化等性能优化工作。 4. 攻克分布式推理中的动态负载均衡、通信优化、显存管理等核心技术难题。 5. 跟踪学术界与工业界前沿技术(如vLLM、TGI、TensorRT-LLM等),推进框架迭代。

更新于 2025-08-05
logo of xpeng
社招3年以上

1.负责xpu的linux内核态或用户态驱动程序的设计开发 2.高性能AI异构计算的性能分析与定位 3.driver相关工具的设计开发

更新于 2024-07-12
logo of antgroup
实习OceanBas

你将与OB的资深工程师紧密合作,参与自研LLM推理框架的研发,通过学习开源社区优秀实践,结合工程创新,打造具有极致性价比的下一代LLM推理系统。 作为实习生,你可以直面工业级AI系统的真实挑战,在师兄的指导下,你可以完整经历从技术调研、方案设计、代码实现到效果验证的全研发流程,积累顶尖企业级项目经验,同时系统掌握LLM推理优化的方法论与技术体系。 你的优秀成果将直接整合进OceanBase智能计算引擎,服务亿级用户场景。

logo of xpeng
社招

1、负责小鹏座舱推理引擎的加速优化,包括模型结构优化(MoE、Mamba)及底层计算加速(INT4、FP8)。 2、负责小鹏多模态大模型压缩技术探索,涵盖量化(QAT/PTQ)、剪枝、蒸馏、稀疏化、NAS等。 3、调研前沿模型压缩算法,推动技术开发与落地应用。 4、参与生成式大模型的结构探索、开发及实际场景部署。

更新于 2025-03-18