logo of baidu

百度百度百舸_AI计算通信加速研发工程师(J77978)

社招全职ACG地点:北京状态:招聘

任职要求


-计算机等相关专业本科及以上学历
-对操作系统、体系结构、网络、大模型计算等有深入了解
-熟悉AI集群内常见的服务器和网络技术,如PCIe、RDMA等
-熟练掌握pythonshell等语言编程

工作职责


-负责百度百舸AI集群的需求定义
-负责百度百舸AI集群的交付验证
-负责百度百舸AI集群的问题定位
-负责百度百舸AI集群的相关工具研发
包括英文材料
学历+
大模型+
Python+
Bash+
相关职位

logo of baidu
社招ACG

-负责百度百舸AI集群的需求定义 -负责百度百舸AI集群的交付验证 -负责百度百舸AI集群的问题定位 -负责百度百舸AI集群的相关工具研发

更新于 2025-02-24
logo of baidu
社招ACG

-负责百度百舸AI集群的需求定义 -负责百度百舸AI集群的交付验证 -负责百度百舸AI集群的问题定位 -负责百度百舸AI集群的相关工具研发

更新于 2024-12-04
logo of baidu
社招ACG

-建设业界领先的AI异构算力容器平台,提供高性能、高稳定性、高易用性的百舸产品,支持AIGC、智算中心、金融、 -结合 SOTA 模型训练推理优化原理,深入模型结构与设计思路,将训练推理优化手段工程实践化,为客户提供系统性加速方案,提升训推效率 -在自研芯片上适配常见大模型,结合深度学习训推框架特性,开发或调优相关算子,提升模型在芯片上的性能和精度表现,辅助客户进行芯片选型和应用 -针对大规模异构集群场景下,探索训推任务管理、异构资源调度、虚拟化混布、容器存储、高性能网络、分布式训练和推理等技术的创新和应用 -探索业界最新技术方向,参与机器学习框架等开源社区,提升百度混合云AI核心竞争力

更新于 2025-05-15
logo of baidu
社招ACG

-建设业界领先的AI异构算力容器平台,提供高性能、高稳定性、高易用性的百舸产品,支持智驾、AIGC、金融能源、智算中心客户AI应用高效部署 -负责云原生AI容器相关产品的架构设计和产品研发,引入开源社区先进的AI框架、AI调度、AI工作流和AI可观测能力组件构建全栈AI应用云原生解决方案 -构建异构多元芯算力底座,支持国产化信创,支持GPU虚拟化和混部调度,提升AI应用资源效率 -无缝对接客户和云上AI开发平台,支持文心和开源大模型训练推理任务部署,提供训练容错和弹性伸缩能力 -对接客户基础设施环境构建异构算力平台解决方案,支持大模型训练/推理ToB交付 -探索业界最新技术方向,参与开源社区,提升百度云原生AI核心竞争力

更新于 2025-03-10