小红书可观测技术研发-国际化
任职要求
1、全日制统招本科及以上学历,3 年及以上计算机相关工作经验; 2、精通 Java 或 Go 语言,熟悉并发编程、分布式系统、性能优化等,有扎实的编程基础; 3、熟悉云原生可观测性体系的相关产品及组件,包括不仅限于:OpenTelemetry、CAT、SkyWalking、Prometheus、VictoriaMetrics、ELK、ClickHouse、eBPF 等,了解 Kubernetes 基本原理并能运用; 4、熟悉基础技术开源组件,如 Linux、网络、存储、MQ 等,深入了解细节,掌握实现原理优先; 5、加分项:熟悉和使用 AI 场景相关技术,包括不仅限于:PyTorch、Spring AI、Langfuse、OpenClaw 等。 6、善于发现、解决问题,善于总结、思考、跨团队协作;关注业界新技术,好奇求知,有强烈的责任心及抗压能力; 7、中英文流利,能够在国际化团队环境中进行技术沟通与协作; 1、Bachelor's degree or above in a relevant field; 3+ years of relevant work experience in computer science. 2、Proficient in Java or Go; solid foundation in concurrent programming, distributed systems, and performance optimization. 3、Familiar with cloud-native observabili…
工作职责
1、负责可观测体系研发工作,围绕 Metrics、Logging、Tracing、Profiling 四大支柱,从全栈领域展开可观测基础能力建设; 2、负责监控平台、全链路追踪、日志服务、计算引擎(流式分析、实时告警、时序检测等)、告警、eBPF 等可观测相关技术架构及产品设计; 3、保障可观测相关基础服务,在高并发环境下的高性能、高可用,推动技术、产品持续优化迭代,支撑国内和海外可观测架构设计、数据合规、基建稳定性保障等工作; 4、落地 AI Infra 可观测、AI 应用可观测、可观测 AI+ 等相关技术,提高 AI 场景稳定性以及传统可观测产品使用体验和效率。 1、Participate in the end-to-end R&D of the observability platform across all four pillars — Metrics, Logging, Tracing, and Profiling — building full-stack observability infrastructure capabilities. 2、Drive the technical architecture and product design of monitoring platforms, distributed tracing, log services, compute engines (streaming analysis, real-time alerting, time-series anomaly detection, etc.), alerting systems, and eBPF-based observability technologies. 3、Ensure high performance and high availability of observability infrastructure under high-concurrency conditions. Drive continuous technical and product iteration to support observability architecture design, data compliance, and infrastructure stability for the multi-region environments. 4、Develop and implement AI Infra observability, AI application observability, and AI-powered observability capabilities to improve stability in AI scenarios and enhance the usability and efficiency of traditional observability products.
基础软件团队立足于字节跳动公司中的架构底座,向上层业务提供一系列高性能、高可用的组件与基础服务。我们是一只国际化团队,正在寻找有技术热忱并且具备大规模分布式系统研发经验的软件工程师/架构师。 1、负责高性能 RPC 框架的设计、研发和维护,提供轻量级、高并发、高吞吐、低时延的网络通信能力; 2、负责搭建完备的可观测性及可调试性工具; 3、负责基础架构中计算、存储、数据库等团队的网络通信需求,提供持续的性能优化支持; 4、负责探索网络方向的前沿技术,建设字节跳动下一代高速网络,最终在视频、AI、云服务等业务场景落地。
团队介绍:国际化内容安全平台团队致力于为字节跳动国际化产品的用户维护安全可信赖环境,通过开发、迭代机器学习模型和信息系统以更早、更快发掘风险、监控风险、响应紧急事件,以人工智能技术支持业务发展,力求更高效、更敏捷、更全能地维护站内生态安全。 1、建设全球化产品的内容审核管理域能力,负责国际化业务的机器审核管理域全栈服务的设计、研发和上线运维,服务国际化产品的多地域审核需要; 2、持续完善模型消费,策略管理发布,审核运营等机器审核管理能力,与业务、产品、运行域共同决策产品及技术架构,保障管理过程高效、安全、易用; 3、建设稳定、高性能、易扩展的审核管理平台架构,持续优化前端Framework可扩展性,完善工程一致性,提升平台体验、性能和稳定性; 4、持续提升管理域服务的可用性、稳定性和鲁棒性,持续优化服务架构分层和调用链,保障数据一致性,提升可观测性、完善容灾降级等兜底方案; 5、保障产品研发顺畅合作,优化合作流程,提升研发效率和质量,为管理域需求交付结果和过程负责。
基础软件团队立足于字节跳动公司中的架构底座,向上层业务提供一系列高性能、高可用的组件与基础服务。我们是一只国际化团队,正在寻找有技术热忱并且具备大规模分布式系统研发经验的软件工程师/架构师。 1、负责高性能 RPC 框架的设计、研发和维护,提供轻量级、高并发、高吞吐、低时延的网络通信能力; 2、负责搭建完备的可观测性及可调试性工具; 3、负责基础架构中计算、存储、数据库等团队的网络通信需求,提供持续的性能优化支持; 4、负责探索网络方向的前沿技术,建设字节跳动下一代高速网络,最终在视频、AI、云服务等业务场景落地。
团队介绍:国际化内容安全平台团队致力于为字节跳动国际化产品的用户维护安全可信赖环境,通过开发、迭代机器学习模型和信息系统以更早、更快发掘风险、监控风险、响应紧急事件,以人工智能技术支持业务发展,力求更高效、更敏捷、更全能地维护站内生态安全。 1、建设全球化产品的内容审核管理域能力,负责国际化业务的机器审核管理域全栈服务的设计、研发和上线运维,服务国际化产品的多地域审核需要; 2、持续完善模型消费,策略管理发布,审核运营等机器审核管理能力,与业务、产品、运行域共同决策产品及技术架构,保障管理过程高效、安全、易用; 3、建设稳定、高性能、易扩展的审核管理平台架构,持续优化前端Framework可扩展性,完善工程一致性,提升平台体验、性能和稳定性; 4、持续提升管理域服务的可用性、稳定性和鲁棒性,持续优化服务架构分层和调用链,保障数据一致性,提升可观测性、完善容灾降级等兜底方案; 5、保障产品研发顺畅合作,优化合作流程,提升研发效率和质量,为管理域需求交付结果和过程负责。