小红书SRE业务运维开发实习生
任职要求
学历专业背景:本科及以上学历的在校学生,计算机科学、软件工程、信息管理等相关专业优先考虑,具备扎实的专业知识基础。 技术知识储备:熟悉高可用架构、性能分析、AIOPS、高可用治理、混沌演练、CI/CD等领域有浓厚兴趣,具备一定的理论基础,有相关项目经验或实习经验者优先; 核心能力素养:具备优秀的沟通协作能力;具备高度责任心及抗压能力;具备强烈的学习意愿和快速学习能力。 系统开发技能:至少掌握一门编程语言(Python/Java/Go),能独立完成简单脚本开发; 时间投入保障:实习周期不少于6个月,可接受大小周,实习地点上海,确保能够全身心投入实习工作,积累丰富实践经验。
工作职责
1、参与保障小红书电商业务的稳定、可靠、高效运行; 2、参与在线系统及各类服务架构规范制定&设计,提供专业的稳定性和架构改善方案; 3、参与分析和深入发掘现有系统的不足,定位系统瓶颈,提高系统性能和稳定性;
1、协助完成业务的部署、配置、监控等日常运维工作,保障系统稳定运行; 2、参与线上业务版本发布、故障响应与基础问题排查; 3、在指导下参与运维流程的优化与自动化脚本/工具的初步开发; 4、协助维护持续集成、监控、日志等基础设施; 5、参与游戏服务架构的辅助性工作和文档整理,学习提升服务可靠性及安全性; 6、与开发团队协作,参与持续集成和持续部署(CI/CD)流程的实践与优化; 7、在团队指导下编写和维护部分运维文档与流程说明。
参与美团无人车业务的稳定性保障工作,设计并交付涵盖软硬件、自动驾驶行为及配送运营全场景的基础运维解决方案,确保系统高效稳定运行。 负责无人车的故障发现与处置的设计与规划提升故障的主动监测与召回能力,设计并开发故障处置工具提升故障和事故的处理效率,建设系统的快速恢复能力。 参与无人车的可靠性和系统安全的数据分析、问题诊断及架构剖析,跟踪问题和缺陷的修复闭环,不断提升自动驾驶系统的可靠性与安全性。 与产品、研发、运营等团队紧密对接,提高自动车配送系统的研发迭代效率,推动规模化运营能力建设,持续优化系统性能与运营效率,支持业务的快速发展。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:团队负责公司多个跨产品业务方向,提供可复用的平台能力及技术解决方案。我们为公司多业务提供如地理位置、行业数据、舆情、众包标注、中间件等多类型的中台能力与技术解决方案,积极利用AI等技术做中台能力提效与升级。 加入我们,你将有机会从中台的多视角参与业务建设,感受不同类型/阶段的业务特点;通过投身亿级用户场景的开发&架构工作,学习和解决极富挑战的技术问题;你也可以从数据出发,积极利用策略和模型,为业务提供有价值的助力。 1、面向海量用户业务,保障抖音搜索、抖音生活服务、今日头条等业务日常稳定性保障,构建并优化可观测性大盘,积极参与响应和应急,持续提升MTTR和SLA,参与容灾演练工作; 2、参与SRE技术平台研发,提升运维效率,推动风险治理,不限于监控告警、变更管控、风险巡检、预案演练、资源管理、成本优化等方向,强化通用化SRE技术能力; 3、参与热点流量、春节活动、营销活动稳定性保障,引导SRE运维工作朝着自动化、平台化、智能化方向演进,提升基础架构各组件体系整体运维管理效率; 4、参与AI Ops项目,将AI赋能到SRE工作的各个领域内,逐步实现无人化运维的阶段。