百度搜索-模型架构工程师-2026AIDU(J85315)
任职要求
-熟练掌握计算机体系结构、数据结构、分布式系统设计、高性能计算等基础知识,精通C/C++、Python等编程语言; -熟练掌握机器学习、深度学习核心算法(Transformer、GPT、BERT等)与主流框架(PyTorch、TensorFlow等); -精通模型量…
工作职责
-负责先进大模型在搜索业务中的应用,设计并建设超大规模在线模型推理系统,实现数万张XPU卡的高效调度与管理,支持百万级QPS的实时推理请求; -负责研究并落地大模型预训练、量化、蒸馏、稀疏化等最新技术,持续优化业务模型训练、推理成本,支持大模型分布式高效训练与推理等; -负责面向搜索的一站式机器学习平台的设计和研发,支持从数据处理、模型训练、推理优化到上线部署的全流程自动化,不断提升模型迭代效率; -紧跟业界大模型技术发展动态与业务应用情况,积极参与并打造行业领先的智能化搜索新产品,共同推动百度搜索技术不断创新、完成变革。
-负责模型优化工程架构研发工作,涵盖预估架构、特征工程、模型训练、推理优化等; -优化模型核心推理/训练性能,负责自研推理&训练框架的演进迭代; -优化在线的高并发高可用服务架构以及离线的高负载大数据量的服务架构; -和团队一起攻克高性能、高并发、高可用性等各种不同技术场景下的技术挑战。
我们致力于构建全球领先的AI异构计算加速引擎和加速平台。建立融合推理(Inference)、训练(Training)的软硬件一体的AI计算加速解决方案,并应用于行业最大的规模的AI数据中心,解决云计算、搜索、信息流、图像、视觉、语音、自然语言处理等的算法优化与计算加速问题。 -负责大规模AI前向计算引擎(Inference Engine)框架和底层算子开发与优化; -负责大规模AI计算通信库及通信算法开发与优化; -负责面向CPU/GPU/FPGA/ASIC等多元化计算架构的编译系统开发、编译优化和算法加速; -负责异构高性能计算平台的设计、研发,高性能计算库、通信库开发与优化。

base地 北京/上海/广州/深圳 1.进行数据闭环,分布式模型训练框架和管理系统的软件研发; 2.基于云原生和 Kubernetes 生态系统,打造高可用和高稳定性的复杂业务系统; 3.负责训练框架前沿技术的探索和研究,负责分布式训练架构体系的演进; 4.打造自动驾驶领域的数据闭环系统,自动驾驶大规模离线仿真技术等高水平大模型基础软件。
1、负责实现和优化大模型分布式训练以及在线推理系统,提升训练效率和推理性能,包括不限于:架构设计、算子开发、数据处理加速、Checkpoint保存与加载、通信优化等; 2、研究和优化大规模异构加速集群调度、存储、通信互联、监控、Profiling等组件,提升整体硬件利用效率; 3、研究并实现各种模型并行策略(DP/TP/PP/EP/CP)、混合精度、Zero、FSDP、MOE、FP8等技术,加速模型训练,优化显存开销; 4、设计和开发高效的离线、在线推理系统,优化TensorRT-LLM、ONNX-Runtime、vLLM等推理框架,加速整体推理性能;