logo of jd

京东GOC技术支持岗

社招全职3年以上测试开发岗地点:北京状态:招聘

任职要求


1. 具有 3 年以上互联网行业中大型系统运维或质量保障经验,拥有流程优化、过程改进、系统高可用架构设计经验者优先;
2. 具备出色的沟通协调以及结构化表达能力,能够迅速理解业务模式,在紧急…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 落实并完善业务运维保障体系,涵盖线上问题管理、全维度全链路监控管理、生产变更管控、故障容灾演练、稳定性文化建设等;
2. Oncall应急响应,实时关注生产系统的健康状况,追踪线上异常事件,推动跨业务跨部门高效协作,缩短故障恢复时间;
3. 辨识核心业务风险场景,构建并维护风险监控大盘,借助监控迅速发现问题,并辅助进行原因预判与定位;
4. 通过故障复盘输出有效改进措施,跟踪改进措施的落实情况,防止重复故障出现,同时不断优化运维平台产品。
包括英文材料
高可用+
系统设计+
相关职位

logo of tencent
社招3年以上CSIG技术

1.负责腾讯云基础设施运营平台系统的架构设计和开发,包括监控告警、自动化平台、运营分析和大数据处理集群等系统的开发与维护; 2.通过运维自动化、智能化的建设,提升腾讯云运维效率与质量; 3.通过机器学习、海量数据处理等相关技术,支持腾讯云智能化运维及精细化运营。

更新于 2025-06-13深圳
logo of shein
社招5年以上信息技术类

职位简介 负责在 大规模 Kubernetes 集群 中设计、优化云网络架构与 GPU 虚拟化调度体系,支持 AI、大数据、电商等业务场景。您将深入 Linux 内核、虚拟化与容器网络技术栈,运用 eBPF 等工具提升系统性能与稳定性,并推动跨云平台的资源优化与整合 核心职责 1.设计与优化 Kubernetes 云网络架构(CNI、VPC),确保高性能、低延迟和稳定性。 2.基于 Cilium/Calico 等网络插件进行二次开发,支持跨集群通信和多租户隔离。 3.研究与落地 GPU 虚拟化技术(vGPU、MIG、GPU Passthrough),实现多租户隔离与动态资源调度。 4.应用 eBPF、perf、sysdig 等工具监控和分析网络与 GPU 虚拟化性能瓶颈。 5.在 混合云/多云环境 中实现跨平台网络与 GPU 兼容性优化。 6.开发定制 Kubernetes 设备插件和 Operator,优化容器网络与 GPU 资源管理。

更新于 2025-12-03南京
logo of bytedance
社招1-2年A22500A

1、项目管理能力优秀,能够主导并管理多个代码类大语言模型(LLM)训练项目,确保按时交付、符合质量标准并达成目标;跟踪项目进展,识别风险,并采取必要的纠正措施以保证项目按计划推进;与产品经理、研究员、数据标注员及其他跨职能团队成员建立并维护良好的合作关系,同步项目进展,解决问题并协调各方期望,确保项目成功交付; 2、流程设计及优化,设计、管理并优化代码类LLM训练项目的工作流程,包括训练设计、质量保证(QA)流程及效果追踪,以满足项目需求;与产品经理、项目负责人及跨职能团队紧密协作,确保质量标准与项目目标保持一致; 3、运营优化,开展质量与效率优化实验,提升代码类训练数据的运营流程;主导并支持跨数据领域的通用标注运营优化计划;制定并维护技术指南及案例手册,确保数据生产的高质量与一致性; 4、数据监控及分析,设计并实施稳健的数据分析策略,系统评估训练集与验证集质量通过统计建模、可视化分析及编程方法,全面监测标注质量、模型表现及数据集覆盖度采用分片评估、提示词敏感性测试及聚类错误分析,精准识别数据缺口、边界案例与失效模式,运用Python(Pandas/NumPy/Matplotlib)及SQL工具链,生成可落地的改进建议,保障数据管道健康度,与模型训练标注员及研发紧密协作,基于数据洞察指导训练策略调整,推动以数据为核心的项目迭代。

更新于 2025-05-26北京
logo of sensetime
社招1-3年后端开发

开发并维护高可用,易扩展的后端服务 优化后端服务的性能和可扩展性,分析并解决系统中的性能瓶颈。 设计和实现高效的 API 以及微服务架构,支持复杂的业务逻辑需求。 与前端、算法、DevOps 以及其他后端团队密切合作,共同推动技术解决方案的落地。

更新于 2025-05-28北京|深圳