腾讯微服务稳定性研发工程师
任职要求
1.熟练掌握 java/go/c++ 至少一门开发语言,熟悉高并发,操作系统,分布式通信,数据库等相关技术; 2.本科以上学历,5 年以上相关工作经验; 3.熟悉高可用性设计、容错机制、限流、熔断、重试等微服务的核心稳定性技术; 4.良好的团队协作和沟通能力,能够在高压环境下快速定位问题并提供解决方案; 5.熟悉开源的中间件软件;至少熟悉 1~2 个相关开源产品(包括但不限…
工作职责
1.负责腾讯云微服务产品(包括不限于微服务平台、注册配置中心、微服务框架、服务网格、云原生网关、Serverless等)的设计,核心代码开发,系统稳定性开发和性能优化等工作; 2.深入理解不同行业的系统架构和微服务应用场景,输出可复制、可扩展的产品技术方案,帮助腾讯云微服务产品在更多企业客户中产生价值; 3.稳定性架构设计与优化,构建和优化资源管理、服务发现、负载均衡、流量管理、容错机制等关键组件,确保系统的可扩展性和健壮性; 4.持续监控和改进微服务系统的可观测性,分析并解决微服务运行中的性能瓶颈和不稳定因素,并利用数据驱动方法解决系统故障、性能问题; 5.具备大规模微服务架构实践经验,尤其是在高并发、大流量系统下的微服务稳定性建设。
【业务介绍】 我们是小红书内稠密类模型(LLM/MLLM/SD/CV/NLP)统一的AI平台QuickSilver,负责调度公司内所有稠密类模型训练与推理资源,基于自建的训推引擎,为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务;包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力。 工作职责: 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程,包括模型fine-tuning、推理服务化等 3、构建云原生架构,设计高可用、高性能的微服务体系 4、优化平台性能,提升系统稳定性和可扩展性
1、负责贝壳C端的后端服务设计与开发,保障高并发场景下的系统稳定性; 2、能够理解和分析产品需求,给出合理的技术方案和开发计划; 3、关注性能、微服务、设计模式,提升用户体验
1、负责Agent系统的稳定性建设,设计高可用架构与容灾降级方案,保障系统在极端场景下稳定运行; 2、优化系统性能,解决分布式场景下的任务调度、数据一致性、故障自愈等挑战,提升服务SLA; 3、建立系统监控、告警及应急响应机制,负责重大故障的排查与恢复; 4、持续优化系统架构,通过代码重构、性能调优等手段提升系统扩展性与可维护性; 5、探索分布式计算、任务调度、流式数据处理等领域的前沿技术(如分布式事务、弹性扩缩容、异构计算等),推动技术成果转化。
团队介绍:商业产品与技术部门(广告业务)成立于2014年,负责字节跳动商业变现端到端大型广告系统建设,覆盖抖音、今日头条、西瓜视频、番茄小说、穿山甲等产品矩阵,致力于让营销更省心、更高效、更美好,推动商业可持续增长,让不分体量、地域的企业及个体,都能通过数字化技术激发创造、驱动生意。 商业平台负责整个广告投放系统的客户业务平台建设,我们为客户提供广告创编、商业认证、市场推广等一站式投广覆盖和商业化能力输出。同时在围绕大模型建设中台化Copilot框架,探索面向广告营销场景的Copilot Agent能力方面有深入实践和充满热情。 1、参与广告系统Copilot方向的核心研发工作,结合产品团队一起提升投广体验和系统效率; 2、设计并维护广告平台,进行架构设计和性能调优,提升服务性能、稳定性; 3、负责平台方向技术规划,优化工程效率研发,数据一致性的保障等; 4、深入广告系统了解复杂系统的架构设计和业务模式,微服务架构等,同时会参与团队建设最高效的投放平台; 5、有足够的发展空间,希望你能快速跟随业务发展,不断学习,对技术有好奇心。