字节跳动AIOps应用算法工程师-APM
社招全职A176612A地点:北京状态:招聘
任职要求
1、本科及以上学历,计算机、统计学等相关专业毕业; 2、扎实的统计分析、机器学习等领域经验,熟悉AIOps核心技术; 3、优秀的编程思维,精通Python/Golang等至少一门编程语言,掌握单机/分布式算法实现; 4、具备快速学习与创造性思维,能融合前沿技术与业务场景创新; 5、在国际顶级会议/期刊发表相关论文,或在相关竞赛获奖,以及有云计算领域算法落地经验者优先。
工作职责
团队介绍:字节跳动APM(Application Performance Management)团队负责全栈产品(服务端、移动端、前端、跨端)的稳定性与性能质量监控,构建业界领先的可观测性基础设施。团队提供一站式观测平台,满足公司各业务线故障排查、监控及各类稳定性需求。 1、AIOps技术深化:AIOps智能运维方向通过融合统计、机器学习和LLM各类算法,实现智能报警、根因定位等;负责主导时序分析、故障诊断、根因关联推断及日志聚类等算法设计; 2、前沿技术创新应用:负责探索LLM Agent在可观测性、自动化运维中落地应用; 3、算法平台与解决方案落地:负责算法解决方案及平台全流程设计,支持算法应用。
包括英文材料
学历+
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
相关职位
社招A142310
1、面向应用发布和线上变更,进行风险防控相关的流程规范,服务化和能力化建设,支撑业务变更过程有效风险发现与高危熔断; 2、面向大型业务运营活动提供稳定性保障能力,包含而不限于服务压测,容量评估,混沌验证,红蓝攻防开展等,支撑业务高可用水位持续提升; 3、采用统计分析、机器学习和人工智能算法,解决场景目标中的各类预测评估问题, 围绕评估,预测,归因,自愈四大维度,推进AIOps体系持续完善。
更新于 2024-06-21
社招A162743
1、面向应用发布和线上变更,进行风险防控相关的流程规范,服务化和能力化建设,支撑业务变更过程有效风险发现与高危熔断; 2、面向大型业务运营活动提供稳定性保障能力,包含而不限于服务压测,容量评估,混沌验证,红蓝攻防开展等,支撑业务高可用水位持续提升; 3、采用统计分析、机器学习和人工智能算法,解决场景目标中的各类预测评估问题, 围绕评估,预测,归因,自愈四大维度,推进AIOps体系持续完善。
更新于 2024-06-21
社招10年以上
1、以提升IT基础设施智能化为目标,利用算法与AI技术,面向日志、监控、告警等数据,结合专家经验,构建资源与容量规划&预测&调度、异常检测、根因分析等关键技术竞争力; 2、主导并负责面向算力资源高效利用、异常检测和根因分析等场景,进行模型应用场景抽象,能够将业务逻辑转化为算法描述语言,并进行相关算法选型和应用效果论证; 3、可独立完成算法方案设计与落地,能对模型方案投产、未来运维、迭代进行设计思考。 4、针对细化的算法应用场景,建立综合评价指标体系,能够运用算法选型、算法设计、训练调优和后处理进行迭代,持续提升模型服务的应用效果; 5、敏锐洞察学术界/业界最新技术动态,分析新技术在业务场景与平台上的应用可行性,并应用。
更新于 2025-05-28