logo of tencent

腾讯腾讯广告-SRE架构师(北京)

社招全职5年以上CDG技术地点:深圳状态:招聘

任职要求


1.计算机、通信或相关专业本科及以上学历。
2.有大型互联网业务 系统、高并发、高可用系统的运维/开发经验
3.有互联网运维平台能力建设经验
4.具备5年以上广告系统或类似系统的运维和架构设计经验。
5.有过互联网广告系统的业…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


一、广告系统架构设计与优化:
1.参与广告系统的整体架构设计和优化:提升系统的性能、稳定性和可扩展性。以满足业务需求和技术挑战。
2.对广告系统进行性能分析和调优:提高系统的处理能力和响应速度。
3.对系统设计中不合理的点:推动进行整体架构升级优化
4.制定系统架构的规范和标准:确保系统的可持续性和可扩展性。
5.管理广告系统的架构技术文档:确保团队成员能够理解和使用相关技术和架构。
6.推动广告系统,在模型及策略维度上,运维能力的持续提升
二、运维AIops的平台设计与优化:
1.规划及设计广告系统的AIops平台,持续提升日常运维效率及故障定位及恢复效率
三、技术能力支持:
1.为开发团队提供复杂问题的技术支持,协助解决在开发过程中遇到的运维难题。
2.参与系统的技术选型和技术方案评估,确保技术的先进性和适用性。
四、推进团队合作:
1.与产品、开发、测试等团队紧密合作,确保广告系统的高质量运行。
2.参与团队的技术分享和讨论,提升团队的技术能力。
包括英文材料
学历+
高并发+
还有更多 •••
相关职位

logo of jd
社招5年以上软件开发岗

1.系统稳定性保障:负责线上系统、应用与服务的高可用性、可靠性与性能保障;设计并维护监控体系,及时发现并解决潜在风险。 2.故障响应与恢复:快速响应生产环境故障,制定并执行有效的应急方案,确保系统持续稳定运行。 3.自动化运维:开发与维护自动化运维工具,提升系统部署、配置与监控效率;推行基础设施即代码(Infrastructure as Code)实践。 4.容量规划与性能优化:分析系统资源使用情况,进行合理容量规划;优化系统性能,提升响应能力与资源利用率。 5.安全协同:与安全团队合作,确保系统和服务的安全性,及时修复潜在的安全漏洞;制定和执行紧急响应计划,应对可能的安全事件。 6.跨团队协作:与开发、测试等团队紧密配合,推动DevOps文化落地,提供技术支持与培训,助力团队成员的技术成长。

更新于 2025-12-09北京
logo of aliyun
社招8年以上云智能集团

部门介绍:云智能集团承载着阿里巴巴集团在高科技领域的核心技术和业务创新,致力于构建数字经济时代的企业级云计算服务平台,并且在全球范围内提供领先的技术解决方案和服务,具备超大业务规模以及最复杂的企业级云计算服务。 云智能集团SRE团队的使命是保障云智能集团生产环境的稳定性以及企业级云计算数据可靠性,服务连续性。如何保障云上客户的业务连续运行以及不止于99.99%的可用性,是我们面临的巨大挑战。 云智能集团SRE团队的目标是建立技术和管理结合的体系化稳定性保障体系,包括但不局限于: 1.制定稳定性规范和度量,如涵盖健壮性架构、研发质量、发布变更、生产环境运行管理等方面,把稳定性贯彻到阿里云技术研发体系 2.推动开展稳定性架构治理重大战役,如全栈容灾,变更灰度,应急1-5-10,资损防控等战役,将稳定性风险快速持续收敛 3.构建稳定性技术中台,无人值守变更,红蓝攻防,应急协同,风险隐患巡检,监控发现等方面建设平台化能力,让稳定性工程更简单 4.应急处置生产环境故障,应急响应,处置协同,故障定位,故障恢复,故障复盘改进 5.通过技术和服务全方位保障客户业务的大型活动稳定性保障,如淘天集团双11,亚运会、奥运会以及客户业务关键期保障 6.该职位涉及值班响应的职责,在服务级别协议(SLA)时间内做出对客响应,推动客户问题的解决,改善客户体验 岗位职责: 1、技术洞察和问题定义 •洞察领域发展方向,熟悉技术标准和前沿进展,跟踪关键竞对的技术和方法。 •结合产品现状提出待解决的问题,理解业务目标并分解到技术产品待解决问题中。 2、架构规划 •对所在领域业务进行架构抽象,建立整体业务领域模型。 •制定系统整体架构规划和技术路线图,确定系统目标和方向,综合考虑应用架构、数据架构、关键技术选型、部署架构等多方面因素,确保系统整体质量。 3、架构设计 •设计架构方案,包括系统组件、模块间的关系、接口、数据流和数据结构、基础设施等,保障系统的安全性、稳定性、易扩展、易维护和性能。 •把握业务全链路技术方案设计,确保技术可实现性、易用性,无重大风险。 •拆解工作,把复杂目标拆成一系列可以落到具体团队或个人的工作。 4、架构落地 •识别优先级、明确目标步骤和应急方案,保障架构实施落地和用户体验。 •梳理关键技术难点,指导开发团队进行突破和攻关,对开发过程进行监督和管理。 •负责部分核心代码编写,虚实结合,做好架构管理。 5、架构治理和演进 •制定架构的原则、规范与治理机制,并且落实到具体的项目研发中。 •负责架构管控,参与领域的重大架构决策,管控架构变更。 •识别不合理业务和架构设计,定期评估架构成熟度。 •基于业务需求和技术演进目标,指导开发团队对系统进行优化和扩展、解决技术债务,推动架构持续演进。 6、技术沉淀和赋能 •团队技术架构分享、技术文档和架构规范沉淀、学习引入新技术,赋能开发团队的技术成长,做好知识传承。

更新于 2025-07-08北京|杭州
logo of aligenie
社招5年以上

1. 作为产品与客户的桥梁,深入理解云电脑所采用技术原理、产品架构和应用场景,结合阿里云整体产品能力,针对不同场景需求提供专业解决方案建议,助力客户端侧算力需求上云; 2. 洞察行业应用和技术趋势以及结合客户日常使用反馈,以场景竞争力需求,推动产品改进及用户体验提升,持续挖掘新的市场机会; 3. 与前线BTE/SA协作,深耕行业头部客户,对客户需求分析、技术方案设计、POC验证和成功交付全流程负责,实现产品商业化目标; 4. 结合客户场景,对云电脑、端侧AI以及Agent infra需求,结合产品能力以及案例实践进行解决方案开发和验收,完善解决方案竞争力和可交付性,与PD、研发、运营合作,推动产品GTM活动。

更新于 2026-04-07北京|深圳|杭州
logo of tencent
社招3年以上AI技术

1.负责大模型服务的稳定性和高可用性,确保平台在高并发和大流量下的稳定运行,设计和实施监控、报警和自动化运维平台建设等,及时发现和解决问题; 2.负责故障的快速定位和修复,制定并执行应急预案,确保业务连续性,参与故障复盘,分析根本原因,提出改进措施,防止类似问题再次发生; 3.开发和维护自动化运维平台与工具,提高运维效率,减少人为操作失误。进行资源使用优化,提高资源利用率,提升系统性能; 4.分析和深入发掘现有系统的不足,数据驱动找到薄弱点,推动系统优化落地改进; 5.负责资源规划和管理,确保资源的合理分配和高效利用,进行资源成本分析,监控和评估资源使用情况,提出成本优化方案,同时能结合业界硬件演进roadmap与技术平台需求不断推动最优配置选型与迭代。

更新于 2025-09-08深圳