logo of baidu

百度运维部_SRE工程师(J52021)

社招全职ACG地点:北京状态:招聘

任职要求


-深入理解 Linux 操作系统;具备较好的计算机网络和体系结构基础
-熟练掌握 C/C++/Python/Go/Shell等至少…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


-负责百度大规模分布式系统及各类在线服务可靠、稳定、 高效运行
-参与在线系统和各类产品架构设计及自动化系统的实现,满足严格的质量与效率要求
-负责超大规模流量接入系统的优化,演进和新接入技术探索和应用
-关注业界相关技术动态,对齐混部技术方向(Docker 等),贡献与引领业界技术趋势
-设计研发服务运维解决方案,包括网站加速、持续交付、容量管理、弹性计算、故障分析、 流量分配、性能调优等
包括英文材料
Linux+
C+
C+++
还有更多 •••
相关职位

logo of baidu
社招ACG

-负责百度大规模分布式系统及各类在线服务可靠、稳定、 高效运行 -参与在线系统和各类产品架构设计及自动化系统的实现,满足严格的质量与效率要求 -负责超大规模流量接入系统的优化,演进和新接入技术探索和应用 -关注业界相关技术动态,对齐混部技术方向(Docker 等),贡献与引领业界技术趋势 -设计研发服务运维解决方案,包括网站加速、持续交付、容量管理、弹性计算、故障分析、 流量分配、性能调优等

更新于 2025-02-08北京
logo of xiaohongshu
社招3年以上机器学习平台

【业务介绍】 作为公司统一的机器学习平台团队,负责调度公司所有模型训练与推理资源;基于自建的训推引擎,构建公司统一的机器学习平台,为公司所有算法同学(稀疏 & 稠密,含 LLM) 模型迭代提供端到端的一站式服务;包括 数据生产,模型训练,模型上线,特征管理,模型测试,资源管控等一系列能力。 【岗位职责】 1、负责机器学习链路,离在线数据相关的开发工作,包括样本数据、特征数据等的数据链路搭建、任务运维和调优、性能优化等 2、负责小红书大规模机器学习平台的后台系统设计和开发工作;包括样本平台,特征平台,训练平台,推理平台等AI应用后台建设等; 3、研究分析业内AI平台产品,优化技术方案,改进产品功能,完善产品体验。

上海
logo of didi
社招技术

1. 负责万亿级别QPS的分布式缓存/存储集群,支撑公司所有产品线的业务需求; 2. 设计、研发高可用、高性能的缓存/存储架构和中间件,应对弹性扩缩容,秒级故障自动切换,异地多活,分布式事务等极具挑战性的工作内容和方向; 3. 优化系统性能,深入内核,提升基础服务相关资源的使用率,增加系统稳定性,保障业务运行; 4. 设计并研发自动化运维平台,提升运维质量和效率,探索运维自动化和智能化技术和方向。

更新于 2025-04-01北京
logo of kuaishou
社招3年以上D2867

1、负责快手搜推广服务的云原生管控方向,建设云上的平台化服务管控、服务调度能力; 2、结合服务场景设计相关调度策略、智能弹性伸缩能力、潮汐混部能力,提高集群硬件利用率。

更新于 2025-04-03北京