百度云计算运维研发Devops工程师(J84514)
社招全职1-5年ACG地点:北京状态:招聘
任职要求
-专业倾向于计算机、通信、数学等理工学科,1-5年运维/SRE工作经验者优先,不限于稳定性、成本、效率等相关工作 -深入理解Linux操作系统;具备较好的计算机网络和体系结构基础 -熟练掌握Python/Go/Shell等至少一种主流编程…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
-Site Reliability Engineer,负责百度公司大规模分布式系统及各类云服务可靠、稳定、高效运行 -参与百度智能云系统和各类产品架构设计,主导服务可用性相关平台/自动化系统的实现 -设计研发智能云规模化运维的技术解决方案,包括大模型训练、服务器生命周期管理、高性能存储、交付、故障预测、成本管理等 -关注业界前沿技术动态,熟悉大模型框架、高性能通信、os/kernel、openstack、kvm、分布式存储、虚拟化网络等相关技术,贡献与引领业界技术趋势
包括英文材料
Linux+
https://ryanstutorials.net/linuxtutorial/
Ok, so you want to learn how to use the Bash command line interface (terminal) on Unix/Linux.
https://ubuntu.com/tutorials/command-line-for-beginners
The Linux command line is a text interface to your computer.
https://www.youtube.com/watch?v=6WatcfENsOU
In this Linux crash course, you will learn the fundamental skills and tools you need to become a proficient Linux system administrator.
https://www.youtube.com/watch?v=v392lEyM29A
Never fear the command line again, make it fear you.
https://www.youtube.com/watch?v=ZtqBQ68cfJc
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
还有更多 •••
相关职位
社招1年以上CSIG技术
1.负责腾讯云效能提升专项工作,提升整体研发效率和交付质量;包括但不限于环境治理、工具开发、流程和方法的优化与改进,提升研发和工程生产力和效率; 2.赋能产研团队,帮助业务识别和分析研发测试环境中的痛点和问题,并提出解决方案,提供技术支持和工程赋能,推进各产品的测试、运维、发布等自动化和智能化落地; 3.协调各个团队,对研发测试环境治理进行持续改进,提炼、总结、发掘优秀实践并在组织内传播,推动落地; 4.备注:此岗位为腾讯集团旗下子公司编制。
更新于 2025-04-03西安
社招3年以上诚云科技
1、稳定性保障与体系建设:负责大模型相关核心业务系统的稳定性建设工作,提升业务可用性与可靠性。 2、高并发流量治理:高并发场景下的流量治理方案设计与实施,包括熔断、限流、降级等容灾策略,确保业务弹性与鲁棒性。 3、运维流程优化和自动化:推动运维自动化与平台化建设,提升研发效率。 4、架构高可用建设:业务系统稳定性架构方案的设计与实施,推动高可用架构落地,规避系统性风险。 5、应急响应:负责快速定位并解决生产环境故障,建立故障快速恢复机制,推动长效改进措施落地。
更新于 2025-11-24北京|杭州
社招2年以上云智能集团
1. 负责云通信与全球运营商之间的链接,完成短信、语音(含5G视频)、流量的系统规划、设计、实施和运维 2. 负责相关系统的云原生技术升级; 3. 参与构建面向全球服务的分布式高可用的融合通信网; 4. 具备项目管理或模块owner能力,能独立负责一块业务规划,架构,落地,优化; 5. 新人指导、培训及Code Review,主导技术难题攻关,提升团队整体技术水平。
更新于 2025-09-03北京|杭州