小红书大数据SRE平台化建设专家
社招全职数据引擎地点:上海 | 北京状态:招聘
任职要求
1、计算机相关专业,本科211以上学历 2、熟练掌握java,有一定规模的PaaS平台,或大数据相关领域的管控类平台建设经验 3、完善的SRE和技术风险领域的基本功;有跨机房、多云的经验,擅长troubleshooting,对线上问题能深入追查;对大规模体量下的…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、主导大数据PaaS平台建设,以平台产品化和体系化的方式,支撑上述引擎和数据业务方的稳定性、成本和效率的需求。 2、负责大数据实时、离线计算存储引擎的稳定性、成本和效率方向工作,包括风险管理、变更管控、成本治理、性能优化、运维运营效率提升等方向。 3、深入理解上述平台的架构及其支撑的业务(搜推、广告、风控、AI等),帮助业务在稳定性、成本、效率等方向上做更好的架构设计,对生产问题进行诊断和优化,帮助不断提升数据+AI业务的价值。
包括英文材料
学历+
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
PaaS+
https://www.ibm.com/cn-zh/think/topics/paas
平台即服务 (PaaS) 是一种云计算模型,提供完整的按需云平台(硬件、软件和基础设施),用于开发、运行和管理应用程序。
https://www.ibm.com/think/topics/paas
https://www.youtube.com/watch?v=QAbqJzd0PEE
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Flink+
https://nightlies.apache.org/flink/flink-docs-release-2.0/docs/learn-flink/overview/
This training presents an introduction to Apache Flink that includes just enough to get you started writing scalable streaming ETL, analytics, and event-driven applications, while leaving out a lot of (ultimately important) details.
https://www.youtube.com/watch?v=WajYe9iA2Uk&list=PLa7VYi0yPIH2GTo3vRtX8w9tgNTTyYSux
Today’s businesses are increasingly software-defined, and their business processes are being automated. Whether it’s orders and shipments, or downloads and clicks, business events can always be streamed. Flink can be used to manipulate, process, and react to these streaming events as they occur.
还有更多 •••
相关职位
社招3年以上A70916
1、负责字节跳动数据平台Clickhouse/Doris等OLAP产品的SLA体系,容灾体系的建设,故障的自愈等,保障业务的持续可用; 2、为字节跳动集团的所有使用Clickhouse/Doris的业务持续提升服务质量,提升用户体验; 3、优化oncall的服务效率, 和产研团队直接合作,推进客户问题的解决,以及产品的持续优化; 4、负责字节跳动大数据产品的SRE平台的研发、自动化建设与持续迭代,引导产品的运维模式向数字化,智能化方向发展演进。
更新于 2023-12-25北京
社招3年以上A205846
1、保障全公司包括抖音、国际化短视频、广告等业务的数据稳定性,提升数据平台服务产品质量,保障业务的持续可用; 2、基于运维经验、工具、平台对线上事故快速响应提升处理效率,同时优化运维体系,推动提升服务可靠性、可扩展性,保障系统SLA,同时推进运维自动化提效; 3、通过持续的全方位运营,包括运维规范及最佳实践、监控及可用性指标、历史事故等,为数据高可用架构设计和选型提供指导,同时能够系统性排查架构风险隐患,推进改进项落地; 4、参与大数据运维平台的研发、自动化建设与持续迭代,引导产品的运维模式向数字化,智能化方向发展演进。
更新于 2025-02-21北京
社招3年以上A70902A
1、负责字节跳动数据平台稳定性保障、从发现、止血与恢复链路运维体系建设,保障业务连续性; 2、负责字节跳动自研大数据产品以及开源产品的自动化运维,提升交付、运维与技术支持的效能; 3、负责沉淀大数据运维经验向文档化、工具化以及标准化推进,促进字节跳动大数据平台运维效能与安全生产。
更新于 2024-06-20上海