logo of baidu

百度智能运维平台研发工程师(J82985)

社招全职ACG地点:北京状态:招聘

任职要求


-计算机科学、软件工程、人工智能或相关专业大学本科及以上学历学位
-优秀的编码能力,精通Golang/Python/Java至少一项
-掌握常见的大模型优化方案,熟悉主流的训练和推理加速方法者优先
-熟悉常见开源推理引擎vLLM/SGLang/TGI等)者优先
-对LangGraph/CrewAI/AutoGen或其他Multi-Agent开发框架有一定理解者优先
-优秀的团队协作能力,工作态度积极主动,具备较强的逻辑思维和表达能力

工作职责


-负责智能运维相关产品的架构设计、核心功能研发及技术优化,包括但不限于故障定位及预测、DevOps、运维自动化等
-参与大模型运维平台核心功能(部署、压测、弹性调度等)的研发及技术优化,提升模型部署效率、优化推理性能及成本
-参与大语言模型在运维领域落地的相关研发工作,支持智能运维客服、智能故障诊断等产品落地
-持续跟踪行业内大语言模型及智能运维技术的发展趋势,引入先进的技术和理念,推动平台的持续升级
包括英文材料
学历+
Go+
Python+
Java+
大模型+
推理引擎+
vLLM+
AutoGen+
AI agent+
开发框架+
相关职位

logo of kuaishou
实习J1014

1、建设支撑快手百万微服务业务系统的智能运维平台及产品,涵盖基于优秀DevOps理念的自动化持续发布与部署平台,基于PB级海量数据的链路追踪、智能定位技术的监控平台,基于先进大数据分析、人工智能技术的稳定性保障平台; 2、负责超大规模平台和系统建设,包括技术选型、架构设计、研发工作,通过敏捷开发支持产品需求快速迭代,不断优化系统架构,支撑业务规模增长,保障服务稳定; 3、跟进业界先进理论和实践,结合公司实际业务需求,打造业界领先的智能运维体系。

更新于 2025-03-04
logo of kuaishou
校招J1014

1、建设支撑快手百万微服务业务系统的智能运维平台及产品,涵盖基于优秀DevOps理念的自动化持续发布与部署平台,基于PB级海量数据的链路追踪、智能定位技术的监控平台,基于先进大数据分析、人工智能技术的稳定性保障平台; 2、负责超大规模平台和系统建设,包括技术选型、架构设计、研发工作,通过敏捷开发支持产品需求快速迭代,不断优化系统架构,支撑业务规模增长,保障服务稳定; 3、跟进业界先进理论和实践,结合公司实际业务需求,打造业界领先的智能运维体系。

更新于 2025-07-30
logo of bytedance
社招A167113

1、负责字节跳动边缘云稳定性及运维平台系统设计、开发; 2、包括但不仅限于变更,监控,应急等智能运维平台的建设; 3、负责通用组件、优化工具的设计和开发; 4、参与边缘云稳定性产品定义,规划及建设。

更新于 2025-06-04
logo of amap
社招3年以上技术类-运维

高德运维研发团队主要负责高德运维平台的建设,对服务稳定性和用户体验负责,主要围绕如下几个方向进行卓有成效的工作: - 高可用方向:围绕混沌工程、故障自愈、全链路故障定位 等前沿技术方向进行平台化建设和智能运维大规模业务落地,提升系统的稳定性水平。 - 资源管理方向:将机器学习技术应用于超大规模集群的资源管理实践中,围绕 资源画像、应用画像、容量管理、全自动化弹性伸缩 等前沿方向进行算法优化和平台化建设。 - 云原生方向:基于实际业务场景,建设云原生时代的云上运维平台,提升云上业务在变更发布、资源调度 等方面的效率。

更新于 2025-08-12