logo of dewu

得物【技术保障】算法SRE工程师/专家(偏开发方向)

社招全职技术类地点:上海状态:招聘

任职要求


1.计算机相关本科及以上,5+ 年 Dev/Ops 经验;具备重大生产事故应急处置记录者优先;
2.精通 Java/C++/Go 任一语言,能进行系统复杂度与架构设计权衡;熟悉 JVM 底层与编译优化,具备算法缓存、并发设计经验优先;
3.深入掌握 Kafka/MQ 等消息中间件ETL 数据处理;精通 MySQL/PostgreSQLRedisHBase 等数据库及一致性原理;
4.熟悉 Zookeeper 集群部署与调优,熟悉 Nginx 高性能配置与流量治理,具备分布式协调与大规模流量管理经验;
5.熟悉 Kubernetes、Operator、容器运行时,理解容器网络与 Serverless 架构;
6.具备千节点级容量规划、混沌工程、多活容灾经验;熟悉网络协议、存储与内核调优;可进行端到端性能剖析(含 P99/P999);
7.具备优秀的沟通与跨团队影响力,能在高压下进行风险评估与快速决策;坚持安全与合规,推动可靠性文化落地。

工作职责


1.主导搜索/推荐核心链路的端到端稳定性建设,基于 SLO/SLI 与错误预算管理变更节奏,确保高可用与快速交付;
2.设计并演进全链路监控、告警、自愈、降级体系,构建自动化响应与回溯机制,加速问题定位与恢复;
3.深度优化计算、存储、调度、编译链路性能,引入并落地 JIT/AOT 等前沿技术,支撑高吞吐、低延迟算法场景;
4.运营与优化 Zookeeper、Nginx、消息队列等核心组件,保障超大规模分布式环境的稳定性与性能;
5.推进非标服务标准化、容器化与云原生化,利用 Kubernetes 构建规模化、自动化、可灰度的交付与运维体系。
包括英文材料
Java+
C+++
Go+
系统设计+
JVM+
算法+
缓存+
Kafka+
消息队列+
中间件+
ETL+
MySQL+
PostgreSQL+
Redis+
HBase+
ZooKeeper+
Nginx+
Kubernetes+
内核+
相关职位

logo of dewu
社招5年以上技术类

1、负责核心搜推工程业务的稳定性,通过指标建设、制度建设、降级容灾、预案设计、容量管理、监控/告警优化等一系列手段提升业务稳定性; 2、高效满足研发团队的运维服务需求,整合技术保障平台能力、服务能力等资源,提供研发团队高质量的支撑保障,并深度参与业务重大架构方案的设计与评审; 3、通过效率指标识别,新技术引进在业务域落地等手段,配合成本运营部门持续优化技术成本投入; 4、负责核心基础服务标准化建设、维护和管理,建立SOP,自动化运维工具,规范团队人员变更操作,确保系统的持续集成与交付。

更新于 2025-08-04
logo of eleme
社招3年以上技术类-运维

1、负责阿里本地生活行业产品技术方案、售前接入集成、售后保障咨询等工作 2、针对外卖、零售等各行业特点深入用户、商户、骑手、ISV等多角色业务场景,提供针对性技术保障服务。 3、深入故障应急、风险识别、监控发现、体验治理等一个或多个技术领域,并将相关能力平台化扩展与多场景复制,解决实际场景中面临的问题,提升全域用户体验 4、基于以上技术领域能力和现有技术保障体系,结合行业特性及挑战设计开发技术保障平台,制定稳定性保障策略与整体方案,并持续挖掘需求、痛点和创新点。

更新于 2025-08-22
logo of dewu
社招技术类

1.负责大数据平台、算法平台相关业务链路运维工作; 2.负责处理大数据生态稳定性等问题,保障集群高效、稳定、经济运行; 3.与开源社区保持交流,发现对业务场景有帮助的特性并引入生产环境,或将经内部验证的特性贡献到社区。

更新于 2023-12-26
logo of hypergryph
校招程序技术类

1.负责游戏和平台业务的技术保障工作,包括但不限于日常变更、容量规划、故障处理、重大活动保障; 2.推动提升业务的可靠性、可扩展性以及性能优化,保障业务SLA; 3.积累SRE最佳实践,为业务架构设计与组件选型提供指导,输出标准技术文档; 4.负责管理和维护基础设施,能够通过自动化提高运维效率。