logo of baidu

百度自动驾驶系统架构工程师(GPU推理方向)(J92525)

社招全职IDG地点:北京状态:招聘

任职要求


-熟悉C/C++,良好的编程习惯,熟悉计算机基础算法和数据结构,熟悉Linux开发环境
-熟悉常见的软件调优方法,有大型项目性能优…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


-负责高性能推理框架研发与维护工作
-参与自动驾驶核心算法模块工程优化(代码效率、调度优化、资源管理)
-负责模型推理、量化等GPU异构计算加速的技术研发和探索
-满足自动驾驶的高稳定性与实时计算需求
包括英文材料
C+
C+++
编程规范+
还有更多 •••
相关职位

logo of meituan
实习自动车配送部

负责全公司机器学习基础设施的研发,包括大规模分布式训练架构、高性能推理服务、深度学习编译优化、GPU硬件加速、RDMA网络优化等,支撑公司所有机器学习相关业务,如:搜索、推荐、广告、图像、NLP、语音、自动驾驶等。

更新于 2025-02-26北京|上海|深圳
logo of meituan
校招自动车配送部

负责全公司机器学习基础设施的研发,包括大规模分布式训练架构、高性能推理服务、深度学习编译优化、GPU硬件加速、RDMA网络优化等,支撑公司所有机器学习相关业务,如:搜索、推荐、广告、图像、NLP、语音、自动驾驶等。

更新于 2025-02-26北京
logo of hello
社招软研类

1. 仿真引擎:负责自动驾驶仿真引擎的开发,实现高并发、高稳定性、高效率的仿真云平台,支撑自动驾驶端到端模型的训练和评测。 2. 仿真评测,负责开发感知、端到端等评价框架,支撑和维护仿真评价体系。 3. 工程优化:基于Cuda和TenseorRT开发推理框架,优化工具链,综合运用指令集优化,线程调度策略,内存池管理技术,实现极致性能与资源利用,实现世界模型在仿真云平台的部署与调优

更新于 2025-12-23上海
logo of xiaohongshu
社招5-10年引擎

我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。

更新于 2026-03-28上海|北京