logo of baidu

百度AI计算部-云原生AI计算工程师(J84405)

社招全职ACG地点:北京状态:招聘

任职要求


-计算机及相关专业本科及以上学历
-熟悉Kubernetes工作原理,熟悉调度器、资源扩展机制、容器运行时、容器网络等技术,有Kubernetes开发和维护经验
-对Kubeflow、Volcano、P…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队介绍:百度智能云AI计算部云原生AI计算团队致力于构建先进的通用和人工智能算力基础设施。在这个团队中,您将有机会与一流的工程师合作,深入参与到训练推理任务管理、异构资源调度、虚拟化混布、容器存储、分布式训练和推理等技术的创新和应用中。这是一个非常令人兴奋和有挑战性的团队,让我们携手,一起深入探索AI和云计算的无尽潜力
岗位职责:
-负责大规模AI计算集群基础设施和产品的设计与研发工作,支撑内部业务和外部客户需求
-构建异构多芯计算集群,优化GPU资源调度、虚拟化混布等核心能力,有效提升多芯供应能力和集群资源效率
-基于标准Kubernetes技术,负责云原生AI组件研发工作,包括训练推理服务编排、GPU资源调度和混布、AI存储、高性能网络等
-基于AI计算集群基础设施,设计和研发异构计算平台和解决方案,支持开发、训练、推理等多场景能力
-提升服务和产品的稳定性,优化服务性能和可扩展性
包括英文材料
学历+
Kubernetes+
还有更多 •••
相关职位

logo of baidu
社招ACG

团队介绍:百度智能云AI计算部云原生AI计算团队致力于构建先进的通用和人工智能算力基础设施。在这个团队中,您将有机会与一流的工程师合作,深入参与到训练推理任务管理、异构资源调度、虚拟化混布、容器存储、分布式训练和推理等技术的创新和应用中。这是一个非常令人兴奋和有挑战性的团队,让我们携手,一起深入探索AI和云计算的无尽潜力 岗位职责: -负责大规模AI计算集群基础设施和产品的设计与研发工作,支撑内部业务和外部客户需求 - 构建异构多芯计算集群,优化GPU资源调度、虚拟化混布等核心能力,有效提升多芯供应能力和集群资源效率 -基于标准Kubernetes技术,负责云原生AI组件研发工作,包括训练推理服务编排、GPU资源调度和混布、AI存储、高性能网络等 -基于AI计算集群基础设施,设计和研发异构计算平台和解决方案,支持开发、训练、推理等多场景能力 - 提升服务和产品的稳定性,优化服务性能和可扩展性

更新于 2024-03-05北京
logo of baidu
社招ACG

-负责大规模AI计算集群基础设施和产品的设计与研发工作,支撑内部业务和外部客户需求 -构建异构多芯计算集群,优化GPU资源调度、虚拟化混布等核心能力,有效提升多芯供应能力和集群资源效率 -基于标准Kubernetes技术,负责云原生AI组件研发工作,包括训练推理服务编排、GPU资源调度和混布、AI存储、高性能网络等 -基于AI计算集群基础设施,设计和研发异构计算平台和解决方案,支持开发、训练、推理等多场景能力 -提升服务和产品的稳定性,优化服务性能和可扩展性

更新于 2024-10-11北京
logo of antgroup
社招技术类-算法

1、研发面向云计算底座海量数据的大模型,包括但不限于代码大模型、全模态、大规模图学习等领域相关的大模型的应用算法研发; 2、参与大模型应用研发全流程的工作,包括但不限于模型算法设计、代码开发、训练、部署优化、调试、评测;技术创新如专利、论文的撰写;外部技术影响力交流等; 3、推动大模型在DevOps提效、内外部智能体业务应用、爆款AI原生应用、安全和技术风险防控等场景的业务落地;

更新于 2025-07-14北京|杭州
logo of baidu
社招ACG

-建设业界领先的AI异构算力容器平台,提供高性能、高稳定性、高易用性的百舸产品,支持智驾、AIGC、金融能源、智算中心客户AI应用高效部署 -负责云原生AI容器相关产品的架构设计和产品研发,引入开源社区先进的AI框架、AI调度、AI工作流和AI可观测能力组件构建全栈AI应用云原生解决方案 -构建异构多元芯算力底座,支持国产化信创,支持GPU虚拟化和混部调度,提升AI应用资源效率 -无缝对接客户和云上AI开发平台,支持文心和开源大模型训练推理任务部署,提供训练容错和弹性伸缩能力 -对接客户基础设施环境构建异构算力平台解决方案,支持大模型训练/推理ToB交付 -探索业界最新技术方向,参与开源社区,提升百度云原生AI核心竞争力

更新于 2025-03-10北京