logo of bytedance

字节跳动AIOps应用算法工程师-APM

社招全职A176612A地点:北京状态:招聘

任职要求


1、本科及以上学历,计算机、统计学等相关专业毕业;
2、扎实的统计分析、机器学习等领域经验,熟悉AIOps核心技术;
3、优秀的编程思维,精通Python/Golang等至少一门编程语言,掌握单机/分布式算法实现;
4、具备快速学习与创造性思维,能融合前沿技术与业务场景创新;
5、在国际顶级会议/期刊发表相关论文,或在相关竞赛获奖,以及有云计算领域算法落地经验者优先。

工作职责


团队介绍:字节跳动APM(Application Performance Management)团队负责全栈产品(服务端、移动端、前端、跨端)的稳定性与性能质量监控,构建业界领先的可观测性基础设施。团队提供一站式观测平台,满足公司各业务线故障排查、监控及各类稳定性需求。

1、AIOps技术深化:AIOps智能运维方向通过融合统计、机器学习和LLM各类算法,实现智能报警、根因定位等;负责主导时序分析、故障诊断、根因关联推断及日志聚类等算法设计;
2、前沿技术创新应用:负责探索LLM Agent在可观测性、自动化运维中落地应用;
3、算法平台与解决方案落地:负责算法解决方案及平台全流程设计,支持算法应用。
包括英文材料
学历+
机器学习+
Python+
Go+
算法+
相关职位

logo of bytedance
社招A142310

1、面向应用发布和线上变更,进行风险防控相关的流程规范,服务化和能力化建设,支撑业务变更过程有效风险发现与高危熔断; 2、面向大型业务运营活动提供稳定性保障能力,包含而不限于服务压测,容量评估,混沌验证,红蓝攻防开展等,支撑业务高可用水位持续提升; 3、采用统计分析、机器学习和人工智能算法,解决场景目标中的各类预测评估问题, 围绕评估,预测,归因,自愈四大维度,推进AIOps体系持续完善。

更新于 2024-06-21
logo of bytedance
社招A162743

1、面向应用发布和线上变更,进行风险防控相关的流程规范,服务化和能力化建设,支撑业务变更过程有效风险发现与高危熔断; 2、面向大型业务运营活动提供稳定性保障能力,包含而不限于服务压测,容量评估,混沌验证,红蓝攻防开展等,支撑业务高可用水位持续提升; 3、采用统计分析、机器学习和人工智能算法,解决场景目标中的各类预测评估问题, 围绕评估,预测,归因,自愈四大维度,推进AIOps体系持续完善。

更新于 2024-06-21
logo of sf
社招10年以上

1、以提升IT基础设施智能化为目标,利用算法与AI技术,面向日志、监控、告警等数据,结合专家经验,构建资源与容量规划&预测&调度、异常检测、根因分析等关键技术竞争力; 2、主导并负责面向算力资源高效利用、异常检测和根因分析等场景,进行模型应用场景抽象,能够将业务逻辑转化为算法描述语言,并进行相关算法选型和应用效果论证; 3、可独立完成算法方案设计与落地,能对模型方案投产、未来运维、迭代进行设计思考。 4、针对细化的算法应用场景,建立综合评价指标体系,能够运用算法选型、算法设计、训练调优和后处理进行迭代,持续提升模型服务的应用效果; 5、敏锐洞察学术界/业界最新技术动态,分析新技术在业务场景与平台上的应用可行性,并应用。

更新于 2025-05-28
logo of bytedance
社招A82032

1、负责AIOps领域算法和解决方案设计实现,包括时序分析、日志挖掘、故障预测、根因关联推断和智能决策等; 2、探索LLM x AIOps的落地应用,包括但不限于异常检测、根因定位、止损容灾等场景; 3、持续跟进LLM前沿技术、开源方案及其在AIOps领域的应用。

更新于 2024-05-17