百度云原生AI研发工程师(J70063)
任职要求
-计算机、数学、统计学或相关专业本科及以上学历,3年以上AI系统开发经验 -优秀的编码能力,熟悉Golang/Python/Java/c/c++至少一项,有扎实的算法及数据结构基础,有良好的编程习 -精通kubernetes基本工作原理,了解调度器、device-plugin、容器运行时运行机制、容器网络、RDMA通信;有Kubeflow、Volcano等相关开发经验优先 -熟悉Tensorflow/Caffe/Pytorch框架者优先,有大规模训练实践经验者优先 -对异构芯片虚拟化、CUDA编程、RDMA有一定了解者优先 -有toB云端系统开发和交付经验者优先 -优秀的团队协作能力;具备较强的ownership,以结果为导向,负责领域内善于思考并积极改进
工作职责
-建设业界领先的面向智能驾驶的AI计算平台,提供高性能、高稳定性、高易用性的AI模型计算平台,支持智驾数据和模型的高效迭代和部署 -负责云原生AI容器相关产品的架构设计和产品研发,结合业界先进的AI框架、调度、工作流和可观测能力组件构建全栈AI计算平台 -对接客户基础设施环境构建案,支持AI平台的跨云多云部署和交付 -与产品、运营等团队紧密合作,提供技术支持和协作
-建设业界领先的AI异构算力容器平台,提供高性能、高稳定性、高易用性的百舸产品,支持智驾、AIGC、金融能源、智算中心客户AI应用高效部署 -负责云原生AI容器相关产品的架构设计和产品研发,引入开源社区先进的AI框架、AI调度、AI工作流和AI可观测能力组件构建全栈AI应用云原生解决方案 -构建异构多元芯算力底座,支持国产化信创,支持GPU虚拟化和混部调度,提升AI应用资源效率 -无缝对接客户和云上AI开发平台,支持文心和开源大模型训练推理任务部署,提供训练容错和弹性伸缩能力 -对接客户基础设施环境构建异构算力平台解决方案,支持大模型训练/推理ToB交付 -探索业界最新技术方向,参与开源社区,提升百度云原生AI核心竞争力
-建设业界领先的AI异构算力容器平台,提供高性能、高稳定性、高易用性的百舸产品,支持智驾、AIGC、金融能源、智算中心客户AI应用高效部署 -负责云原生AI容器相关产品的架构设计和产品研发,引入开源社区先进的AI框架、AI调度、AI工作流和AI可观测能力组件构建全栈AI应用云原生解决方案 -构建异构多元芯算力底座,支持国产化信创,支持GPU虚拟化和混部调度,提升AI应用资源效率 -无缝对接客户和云上AI开发平台,支持文心和开源大模型训练推理任务部署,提供训练容错和弹性伸缩能力 -对接客户基础设施环境构建异构算力平台解决方案,支持大模型训练/推理ToB交付 -探索业界最新技术方向,参与开源社区,提升百度云原生AI核心竞争力
1、负责混合云云原生AI Infra技术架构设计、推理场景系统优化、云原生AI套件等开发工作。 2、负责研发AI异构计算软件栈,通过结合不同硬件、高性能网络、缓存等技术,实现AI计算的全链路优化,助力打造高可靠、高性能、高效率的AI算力基础设施; 3、洞察人工智能及深度学习的发展趋势,积极参与下一代AI基础设施的设计与研发。