腾讯腾讯云AI代码助手-高级SRE工程师
社招全职3年以上CSIG技术地点:西安状态:招聘
任职要求
1.本科及以上学历,计算机科学、软件工程、信息系统等相关专业优先;具有 3 年以上 SRE 或相关运维工作经验,有大型互联网公司运维经验者优先; 2.熟练掌握 Linux 操作系统,精通 Python 或 Shell 等脚本语言,能编写自动化运维脚本;熟悉网络基础知识,掌握 TCP/IP 协议、网络拓扑结构及故障排查方法;熟悉 Prometheus、Loki、Grafana 等,能定制指标和告警规则; 3.具备丰富的容器化技术(Docker、Kubernetes)使用…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.负责 AI 代码助手平台线上业务系统的日常运维,保障系统 7×24 小时稳定运行; 2.设计并完善 AI 代码助手的监控体系,实时监控系统性能、资源利用率、用户并发连接数等关键指标,通过数据分析提前发现潜在风险并制定解决方案; 3.制定并实施系统可靠性提升方案,优化 AI 代码助手的系统架构与部署,增强系统在高并发场景下的可用性和容错能力; 4.开发和维护自动化运维工具与脚本,实现服务器部署、配置管理、故障处理等运维任务的自动化,提升运维效率; 5.建立并完善应急响应机制,制定应急预案并定期演练,在系统故障时快速响应恢复;深入分析故障,制定改进措施避免复发; 6.结合业务发展和用户增长预测,对 AI 代码助手系统进行容量规划和性能评估,提前调整服务器资源,优化系统性能; 7.负责研发效能提升工作,搭建高效的流水线,实现代码自动化构建、测试与部署,减少人工干预,提升交付速度。
包括英文材料
学历+
Linux+
https://ryanstutorials.net/linuxtutorial/
Ok, so you want to learn how to use the Bash command line interface (terminal) on Unix/Linux.
https://ubuntu.com/tutorials/command-line-for-beginners
The Linux command line is a text interface to your computer.
https://www.youtube.com/watch?v=6WatcfENsOU
In this Linux crash course, you will learn the fundamental skills and tools you need to become a proficient Linux system administrator.
https://www.youtube.com/watch?v=v392lEyM29A
Never fear the command line again, make it fear you.
https://www.youtube.com/watch?v=ZtqBQ68cfJc
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Bash+
[英文] The Bash Guide
https://guide.bash.academy/
A quality-driven guide through the shell's many features.
https://www.youtube.com/watch?v=tK9Oc6AEnR4
Understanding how to use bash scripting will enhance your productivity by automating tasks, streamlining processes, and making your workflow more efficient.
脚本+
[英文] Scripting language
https://en.wikipedia.org/wiki/Scripting_language
https://zhuanlan.zhihu.com/p/571097954
一个脚本通常是解释执行而非编译。脚本语言通常都有简单、易学、易用的特性,目的就是希望能让程序员快速完成程序的编写工作。
TCP/IP+
[英文] What is TCP/IP?
https://www.techtarget.com/searchnetworking/definition/TCP-IP
TCP/IP stands for Transmission Control Protocol/Internet Protocol and is a suite of communication protocols used to interconnect network devices on the internet.
Prometheus+
https://grafana.com/docs/grafana/latest/getting-started/get-started-grafana-prometheus/
Prometheus is an open source monitoring system for which Grafana provides out-of-the-box support.
https://prometheus.io/docs/tutorials/getting_started/
Prometheus is a system monitoring and alerting system.
Grafana+
还有更多 •••
相关职位
社招其他
1、负责支撑网易集团旗下云音乐、Loft、支付等互联网产品的运维工作(涵盖操作系统运维、系统运维、容器运维等多个层面的工作),帮助业务持续提升产品稳定性; 2、负责相关运维工具和平台研发,通过工具和平台将运维能力赋能给外部其他团队,帮助其他团队提升效率; 3、关注业界前沿技术动态,通过新的运维技术和方法解决线上问题,提升团队运维质量; 4、持续优化运维操作和流程,保障海量用户的互联网产品稳定运行。
更新于 2025-04-14杭州
社招3年以上A91599A
1、负责Sdwan网络的日常运维、监控和故障排除,及时响应并解决网络故障和性能问题; 2、构建和维护Sdwan网络的监控和告警系统,实现对网络状态的全面监控和预警; 3、开发和维护自动化运维工具和脚本,提高运维效率,减少人为错误,并负责编写和维护Sdwan网络相关的文档和知识库; 4、参与容量规划和性能测试,确保Sd-wan网络能够满足业务需求。
更新于 2025-01-08北京
社招3年以上技术类-开发
1、负责核心业务系统的Java开发工作,确保系统的稳定性和高性能。 2、参与需求分析,设计并实现高效、可扩展的代码结构,优化系统性能。 3、与团队协作,解决复杂的技术问题,推动项目进度。 4、对现有系统进行维护和优化,提升系统质量和用户体验。 5、参与技术分享,提升团队技术水平,推动技术栈的持续升级。
更新于 2025-04-18杭州