logo of bytedance

字节跳动大数据交付运维专家

社招全职3年以上A139438A地点:西安状态:招聘

任职要求


1、本科及以上学历,计算机,软件工程或其他相关专业,具有三年以上IT系统实施和运维相关经验;
2、熟悉Hadoop生态、不限于HadoopHiveSparkHbaseFlinkImpalaClickhouseRedisKafka等组件;
3、熟悉Linux/Unix系统、网络、硬件等相关知识,具有很强的Troubleshooting能力;
4、至少熟悉一种脚本语言:ShellPython等;
5、至少使用过一种自动化部署工具:Ansible、Saltstack、Chef、Puppet、Terraform等;
6、熟悉DockerK8S/Istio等容器技术和工具者优先。

工作职责


1、负责数据平台的交付实施,包括安装部署等工作;
2、负责处理私有化项目的告警、故障响应;
3、负责对客户进行相关培训、协助项目经理完成项目验收工作;
4、负责数据平台/数据仓库的维护工作、解决平台使用过程中客户碰到的问题。
包括英文材料
学历+
Hadoop+
Hive+
Spark+
HBase+
Impala+
ClickHouse+
Redis+
Kafka+
Linux+
Unix+
脚本+
Bash+
Python+
Ansible+
Terraform+
Docker+
Kubernetes+
Istio+
相关职位

logo of bytedance
社招3年以上A70902A

1、负责字节跳动数据平台稳定性保障、从发现、止血与恢复链路运维体系建设,保障业务连续性; 2、负责字节跳动自研大数据产品以及开源产品的自动化运维,提升交付、运维与技术支持的效能; 3、负责沉淀大数据运维经验向文档化、工具化以及标准化推进,促进字节跳动大数据平台运维效能与安全生产。

更新于 2024-06-20
logo of bytedance
社招3年以上A49722B

1、负责字节跳动数据平台稳定性保障、从发现、止血与恢复链路运维体系建设,保障业务连续性; 2、负责字节跳动自研大数据产品以及开源产品的自动化运维,提升交付、运维与技术支持的效能; 3、负责沉淀大数据运维经验向文档化、工具化以及标准化推进,促进字节跳动大数据平台运维效能与安全生产。

更新于 2024-03-27
logo of aliyun
社招3年以上云智能集团

1)负责阿里云AI人工智能平台(PAI)运维工作,建设超大规模GPU集群稳定性体系,包括可观测性链路、监控报警,故障应急及处置、SLA可用率度量提升等 2)研发AI运维管控平台,通过自动化提升运维效率,包括交付&变更CICD、GPU节点交付&自愈、智能诊断定界等 3)落地AIOps智能运维,通过AI算法提升稳定性,包括异常检测、根因定位及基于大模型&智能体Agent运维落地等 4)负责稳定性架构设计及项目组织推动落地,包括基础架构云原生化、跨AZ高可用架构、产品可运维性架构演进等

更新于 2025-10-17
logo of tuhu
社招5年以上技术

1、负责运维自动化、可观测性、GPU算力等平台能力的建设; 2、运用大数据、算法、智能AI等技术,实现运维故障定位、根因分析、自愈恢复和事后跟踪评估等能力; 3、完善现有运维管理自动化工作流程和方法,不断迭代实现运维交付工具的集成,提升运维及研发效率;

更新于 2025-05-06