鹰角网络SRE工程师(平台方向)
社招全职3年以上地点:上海状态:招聘
任职要求
计算机相关专业,本科学历,3年以上SRE相关经验; 熟悉一种或多种编程语言,例如Python/Go/Java等; 有良好的计算、网络、存储、安全等计算机体系结构的知识; 熟悉游戏或互联网技术架构,对TCP/IP、服务化架构、中间件等技术有较深入的理解; 熟悉国内外常见云服务商(如阿里云、腾讯云、AWS 等)的产品体系,有实践经验; 熟悉K8s…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
负责平台、社区、信息化等业务的技术保障工作,包括但不限于日常变更、容量规划、故障处理、活动保障; 推动提升业务的稳定性性、可扩展性以及性能优化,保障业务SLA; 积累SRE最佳实践,为业务架构设计与组件选型提供指导,输出标准技术文档;
包括英文材料
学历+
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
系统设计+
https://roadmap.sh/system-design
Everything you need to know about designing large scale systems.
https://www.youtube.com/watch?v=F2FmTdLtb_4
This complete system design tutorial covers scalability, reliability, data handling, and high-level architecture with clear explanations, real-world examples, and practical strategies.
TCP/IP+
[英文] What is TCP/IP?
https://www.techtarget.com/searchnetworking/definition/TCP-IP
TCP/IP stands for Transmission Control Protocol/Internet Protocol and is a suite of communication protocols used to interconnect network devices on the internet.
中间件+
https://www.youtube.com/watch?v=1oWPUpMheGk
AWS+
https://aws.amazon.com/
Amazon Web Services offers reliable, scalable, and inexpensive cloud computing services. Free to join, pay only for what you use.
还有更多 •••
相关职位
社招3年以上QAPV
1、面向国际电商业务,基于跨团队/时区/地域的合作机制,提供符合实际业务场景的组件稳定性解决方案; 2、持续进行组件的元数据建设,可观测建设,完善多维度的可观测方案; 3、开发平台化、数据可视化和自动化监控流程,以促进国际电商平台组件运维提效的工作; 4、深入了解电商业务,进行组件的风险感知和治理; 5、持续跟进国际电商组件的管理和优化。
更新于 2021-12-01北京
社招3年以上
负责鹰角云平台的设计和研发,如应用管理、流程引擎、监控中心等 负责制定前端研发规范,构建统一、高效的前端研发流程; 参与SRE工作的自动化实践,为公司内部提供拥有极致体验的SRE产品;
更新于 2025-07-25上海
社招智能与信息技术
1. 负责理想汽车AI平台RDMA网络下大规模GPU集群和并行高速存储的运维工作,为业务平台的可用性负责 2. 调查解决大规模GPU集群管理和大规模AI训练情况下遇到的各种系统/稳定性问题,打造自动化,稳定,易于运维的高速网络和超算集群 3. 深入理解业务,推动AI平台在K8S多集群架构、监控平台、日志等方向的云原生架构演进并落地解决方案 4. 持续建设AI平台运维体系、在稳定性建设、故障定位、资源运营等方向,推动运维工作自动化、工程化
北京