小红书【REDstar】可观测研发工程师
校招全职基础后端地点:上海 | 北京 | 杭州状态:招聘
任职要求
1、本科及以上学历,计算机、软件工程等相关专业优先; 2、精通 Java 或 Go 语言,熟悉并发编程、分布式系统、性能优化等,有扎实的编程基础; 3、熟悉云原生可观测性体系的相关产品及组件,包括不仅限于:OpenTelemetry、CAT、SkyWalking、Prometheus、VictoriaMetrics、ELK、ClickHouse、eBPF 等,了解 Kubernetes 基本原…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责可观测体系研发工作,围绕 Metrics、Logging、Tracing、Profiling 四大支柱,从全栈领域展开可观测基础能力建设; 2、负责监控平台、全链路追踪、日志服务、计算引擎(流式分析、实时告警、时序检测等)、告警、eBPF 等可观测相关技术架构及产品设计; 3、保障可观测相关基础服务,在高并发环境下的高性能、高可用,推动技术、产品持续优化迭代; 4、落地 AI Infra 可观测、AI 应用可观测、可观测 AI+ 等相关技术,提高 AI 场景稳定性以及传统可观测产品使用体验和效率。
包括英文材料
学历+
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
分布式系统+
https://www.distributedsystemscourse.com/
The home page of a free online class in distributed systems.
https://www.youtube.com/watch?v=7VbL89mKK3M&list=PLOE1GTZ5ouRPbpTnrZ3Wqjamfwn_Q5Y9A
OpenTelemetry+
https://logz.io/learn/opentelemetry-guide/#overview
Every journey in Observability begins with instrumenting an application to emit telemetry data – primarily logs, metrics and traces – from each service as it executes.
[英文] Getting Started
https://opentelemetry.io/docs/languages/go/getting-started/
This page will show you how to get started with OpenTelemetry in Go.
https://www.youtube.com/watch?v=hLvwoow3XTk
OpenTelemetry can help, with its powerful capabilities for monitoring and analyzing hybrid applications, including collecting and analyzing telemetry data, metrics, and traces.
https://www.youtube.com/watch?v=Txe4ji4EDUA
In the observability space, the project making this possible is OpenTelemetry.
Prometheus+
https://grafana.com/docs/grafana/latest/getting-started/get-started-grafana-prometheus/
Prometheus is an open source monitoring system for which Grafana provides out-of-the-box support.
https://prometheus.io/docs/tutorials/getting_started/
Prometheus is a system monitoring and alerting system.
ClickHouse+
[英文] Advanced Tutorial
https://clickhouse.com/docs/tutorial
Learn how to ingest and query data in ClickHouse using the New York City taxi example dataset.
https://www.youtube.com/watch?v=FtoWGT7kS-c
ClickHouse is an open-source column-oriented DBMS for online analytical processing that allows users to generate analytical reports using SQL queries in real-time.
https://www.youtube.com/watch?v=Rhe-kUyrFUE&list=PL0Z2YDlm0b3gcY5R_MUo4fT5bPqUQ66ep
还有更多 •••
相关职位
校招大模型
大模型AI Infrastructure团队专注于大语言模型领域的前沿技术研究和落地,提供高性能、高可靠、可扩展的机器学习系统、丰富的异构计算资源和极致的端到端的机器学习服务体验,为公司提供核心技术能力和服务。 1、负责机器学习框架的研究与开发,服务于公司各个产品; 2、高效部署,优化NLP/多模态大模型核心业务模型。
更新于 2025-09-06北京|上海
校招策略算法
1、用户兴趣建模:基于小红书社区用户海量的行为数据,利用迁移学习、多场景多目标、序列建模等方式构建统一用户表征、人群圈层和可解释用户兴趣; 2、核心场景落地:推动用户理解能力在多场域的召回、排序、人群定向等场景落地,优化用户推荐、搜索、广告、电商等核心场景的体验; 3、技术前瞻探索:推动LLM、Agent 等前沿技术在小红书落地,共同构建覆盖全站用户&人群兴趣变迁和消费意图的知识基座。
更新于 2025-11-10北京|上海
校招大模型
1、参与语言及多模态大模型的对齐技术研究与优化,聚焦于解决模型在复杂指令遵循、推理、幻觉、工具使用等问题中的表现瓶颈,提升模型的实用性与可靠性; 2、研究并理解模型能力与对齐之间的关系,探索更有效的对齐技术,包括可扩展的人类监督方法等,设计并执行复杂的理解性实验,分析大模型在不同数据分布和任务场景下的表现,发现并解决影响模型性能的关键问题; 3、开发和完善大模型的评测系统,对模型能力和对齐水平进行评测,识别并解决模型可能存在稳定性、安全和幻觉问题,利用多种方法分析、理解模型行为,并指导模型进行迭代; 4、与产品、工程、安全团队紧密合作,将研究成果有效落地,确保模型应用符合实际需求,并在关键技术上做到行业顶尖水平。
北京|上海|广州