logo of xiaohongshu

小红书产品实习生-可观测&平台工程方向

实习兼职产品经理地点:上海状态:招聘

任职要求


学历专业背景:本科及以上学历的在校学生,计算机科学、软件工程、信息管理等相关专业优先考虑,具备扎实的专业知识基础。
技术知识储备:熟悉监控日志报警、性能分析、AIOPS、高可用治理、混沌演练、CI/CD等领域有浓厚兴趣,具备一定的理论基础;有相关项目经验或实习经验者优先
核心能力素养:具备优秀的沟通协作能力,能够与不同背景的团队成员高效沟通、协同工作;具备强烈的学习意愿和快速学习能力,对新技术、新领域充满探索热情。
工具应用技能:熟练掌握 Axure、figmaExcel 等产品设计和数据分析工具,能够运用工具高效完成工作任务。
时间投入保障:实习周期不少于6个月,可接受大小周,实习地点上海,确保能够全身心投入实习工作,积累丰富实践经验。

工作职责


辅助产品经理开展云可观测性、高可用架构、平台工程相关的产品管理工作,包括需求调研、行业分析、产品规划、产品设计等工作;
参与学习和研究最新的可观测性、高可用、平台工程产品方案,为产品改进提供建议;
参与需求调研工作,与平台用户的需求沟通,理解和分解平台的需求,落实到产品规划和设计中;
参与产品研发落地工作,与研发团队保持紧密合作,协调组织设计、开发、测试资源推动产品发布和项目落地;
参与产品关键数据指标运营,产品用户反馈,持续优化产品;
包括英文材料
学历+
高可用+
CI+
CD+
Figma+
Excel+
数据分析+
相关职位

logo of bytedance
实习A212058

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Stone-Dev Platform团队负责AI应用开发工具平台的产品研发及相关能力建设。具体包括为字节跳动内外的LLM应用开发者提供开发框架、DevOps、可观测、LLMOps等效率工具,以满足其生产活动需求;支持开发者进行数据处理、Prompt工程、模型训练评测及推理部署等端到端的模型迭代流程,不断提升AI应用的效果。团队整体致力于构建LLM应用开发者生态,并推动产品的商业化建设。 1、参与LLM应用平台的DevOps方向产品的调研及用户需求分析; 2、通过用户调研、行业调研、数据分析等方式了解和挖掘客户需求; 3、跟踪产品的上线效果、用户反馈,为产品功能的优化打磨提供合理建议; 4、通过培训、教学文档,运营活动等方式为用户提供支持,确保用户能高效使用Devops相关应用产品。

更新于 2024-06-28
logo of bytedance
实习A193839

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Stone-Dev Platform团队负责AI应用开发工具平台的产品研发及相关能力建设。具体包括为字节跳动内外的LLM应用开发者提供开发框架、DevOps、可观测、LLMOps等效率工具,以满足其生产活动需求;支持开发者进行数据处理、Prompt工程、模型训练评测及推理部署等端到端的模型迭代流程,不断提升AI应用的效果。团队整体致力于构建LLM应用开发者生态,并推动产品的商业化建设。 1、负责技术工具产品的影响力、增长及开发者运营工作; 2、负责技术工具产品的用户体验研究、分析与治理工作; 3、负责业务及运营活动的数据监控及分析,能通过数据指导业务开展; 4、策划并举办运营活动,通过活动方案促进用户增长、留存及活跃; 5、与产品、设计、开发团队紧密合作,推进项目方案落地执行。

更新于 2025-04-03
logo of xiaohongshu
实习后端开发

1、负责可观测体系研发工作,围绕Metric、Log、Trace三大支柱,从全栈领域展开可观测基础能力建设; 2、负责监控平台、全链路追踪、日志平台、计算引擎(流式分析、实时告警、时序检测等)、云原生可观测等相关技术架构及产品设计; 3、保障可观测相关基础服务,在高并发环境下的高性能、高可用,推动技术、产品持续优化迭代。

更新于 2025-06-11
logo of bytedance
实习A206956A

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:团队负责公司多个跨产品业务方向,提供可复用的平台能力及技术解决方案。我们为公司多业务提供如地理位置、行业数据、舆情、众包标注、中间件等多类型的中台能力与技术解决方案,积极利用AI等技术做中台能力提效与升级。 加入我们,你将有机会从中台的多视角参与业务建设,感受不同类型/阶段的业务特点;通过投身亿级用户场景的开发&架构工作,学习和解决极富挑战的技术问题;你也可以从数据出发,积极利用策略和模型,为业务提供有价值的助力。 1、面向海量用户业务,保障抖音搜索、抖音生活服务、今日头条等业务日常稳定性保障,构建并优化可观测性大盘,积极参与响应和应急,持续提升MTTR和SLA,参与容灾演练工作; 2、参与SRE技术平台研发,提升运维效率,推动风险治理,不限于监控告警、变更管控、风险巡检、预案演练、资源管理、成本优化等方向,强化通用化SRE技术能力; 3、参与热点流量、春节活动、营销活动稳定性保障,引导SRE运维工作朝着自动化、平台化、智能化方向演进,提升基础架构各组件体系整体运维管理效率; 4、参与AI Ops项目,将AI赋能到SRE工作的各个领域内,逐步实现无人化运维的阶段。

更新于 2025-06-25