logo of baidu

百度云原生AI计算工程师(J71045)

社招全职ACG地点:北京状态:招聘

任职要求


任职资格
-计算机及相关专业本科及以上学历
- 熟悉Kubernetes工作原理,熟悉调度器、资源扩展机制、容器运行时、容器网络等技术,有Kubernetes开发和维护经验
- 对KubeflowVolcanoPytorch、GPU芯片架构有一定了解者优先
- 具备良好的沟通能力和团队协作精神,严谨的工作态度,注重工程质量,有独立解决各种系统问题的能力
- 善于学习新的知识,动手能力强,有强烈的责任心,喜欢钻研技术

工作职责


团队介绍:百度智能云AI计算部云原生AI计算团队致力于构建先进的通用和人工智能算力基础设施。在这个团队中,您将有机会与一流的工程师合作,深入参与到训练推理任务管理、异构资源调度、虚拟化混布、容器存储、分布式训练和推理等技术的创新和应用中。这是一个非常令人兴奋和有挑战性的团队,让我们携手,一起深入探索AI和云计算的无尽潜力
岗位职责:
-负责大规模AI计算集群基础设施和产品的设计与研发工作,支撑内部业务和外部客户需求
- 构建异构多芯计算集群,优化GPU资源调度、虚拟化混布等核心能力,有效提升多芯供应能力和集群资源效率
-基于标准Kubernetes技术,负责云原生AI组件研发工作,包括训练推理服务编排、GPU资源调度和混布、AI存储、高性能网络等
-基于AI计算集群基础设施,设计和研发异构计算平台和解决方案,支持开发、训练、推理等多场景能力
- 提升服务和产品的稳定性,优化服务性能和可扩展性
包括英文材料
学历+
Kubernetes+
Kubeflow+
Volcano+
PyTorch+
相关职位

logo of baidu
社招ACG

-负责大规模AI计算集群基础设施和产品的设计与研发工作,支撑内部业务和外部客户需求 -构建异构多芯计算集群,优化GPU资源调度、虚拟化混布等核心能力,有效提升多芯供应能力和集群资源效率 -基于标准Kubernetes技术,负责云原生AI组件研发工作,包括训练推理服务编排、GPU资源调度和混布、AI存储、高性能网络等 -基于AI计算集群基础设施,设计和研发异构计算平台和解决方案,支持开发、训练、推理等多场景能力 -提升服务和产品的稳定性,优化服务性能和可扩展性

更新于 2024-10-11
logo of baidu
社招ACG

团队介绍:百度智能云AI计算部云原生AI计算团队致力于构建先进的通用和人工智能算力基础设施。在这个团队中,您将有机会与一流的工程师合作,深入参与到训练推理任务管理、异构资源调度、虚拟化混布、容器存储、分布式训练和推理等技术的创新和应用中。这是一个非常令人兴奋和有挑战性的团队,让我们携手,一起深入探索AI和云计算的无尽潜力 岗位职责: -负责大规模AI计算集群基础设施和产品的设计与研发工作,支撑内部业务和外部客户需求 -构建异构多芯计算集群,优化GPU资源调度、虚拟化混布等核心能力,有效提升多芯供应能力和集群资源效率 -基于标准Kubernetes技术,负责云原生AI组件研发工作,包括训练推理服务编排、GPU资源调度和混布、AI存储、高性能网络等 -基于AI计算集群基础设施,设计和研发异构计算平台和解决方案,支持开发、训练、推理等多场景能力 -提升服务和产品的稳定性,优化服务性能和可扩展性

更新于 2025-04-14
logo of baidu
社招3年以上IDG

-建设业界领先的面向智能驾驶的AI计算平台,提供高性能、高稳定性、高易用性的AI模型计算平台,支持智驾数据和模型的高效迭代和部署 -负责云原生AI容器相关产品的架构设计和产品研发,结合业界先进的AI框架、调度、工作流和可观测能力组件构建全栈AI计算平台 -对接客户基础设施环境构建案,支持AI平台的跨云多云部署和交付 -与产品、运营等团队紧密合作,提供技术支持和协作

更新于 2024-01-05
logo of bytedance
社招A103504B

1、负责混合云云原生AI Infra技术架构设计、推理场景系统优化、云原生AI套件等开发工作。 2、负责研发AI异构计算软件栈,通过结合不同硬件、高性能网络、缓存等技术,实现AI计算的全链路优化,助力打造高可靠、高性能、高效率的AI算力基础设施; 3、洞察人工智能及深度学习的发展趋势,积极参与下一代AI基础设施的设计与研发。

更新于 2025-02-26