小红书数据引擎Agent / AIOps 专家

社招全职3-5年数据引擎2026-02-12地点：北京 | 上海 | 杭州状态：招聘

扫码手机上打开

任职要求

1.计算机相关专业，研究生学历，本科211以上
2.有大数据和技术风险领域的经验，深入原理并有相关场景的大规模实践
3.熟悉机器学习/深度学习算法（如 LSTM、GNN、异常检测算法等），熟练掌握数据ETL流程、PyTorch / TensorFlow 及 MLOps 生产工具链
4.熟悉并落地如下1个或多个领域的经验：
a). 大规模云平台的资源分配、调度优化和中长期资源规划：运用需求预测、运筹优…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.探索和落地大数据领域Agent和AIOps技术风险领域的前沿技术和应用场景，包括智能问答、推理分析、容量规划、数据治理、业务诊断、风险预测等，并将研究结果应用到数据平台和数据业务领域，不断推动服务能力升级。
2.整合多源异构数据来源，构建数据基座，结合传统AI算法和LLM，设计和实现Agent或传统AIOps架构。
3.解决算法工程化的问题，包括端到端应用算法解决方案、模型优化和在线模型更新、场景仿真实验和调优等。不断提升各应用场景的召回率和准确率。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

机器学习+

深度学习+

算法+

LSTM+

GNN+

ETL+

还有更多 •••

登录查看完整学习资料

相关职位

阿里云智能-运维专家-云平台运维

社招3年以上云智能集团

1）负责阿里云AI人工智能平台（PAI）运维工作，建设超大规模GPU集群稳定性体系，包括可观测性链路、监控报警，故障应急及处置、SLA可用率度量提升等 2）研发AI运维管控平台，通过自动化提升运维效率，包括交付&变更CICD、GPU节点交付&自愈、智能诊断定界等 3）落地AIOps智能运维，通过AI算法提升稳定性，包括异常检测、根因定位及基于大模型&智能体Agent运维落地等 4）负责稳定性架构设计及项目组织推动落地，包括基础架构云原生化、跨AZ高可用架构、产品可运维性架构演进等

更新于 2025-10-17北京|杭州

阿里云智能-分布式可观测与AI工程师/技术专家-上海 / 杭州 / 北京

社招5年以上云智能集团

我们的愿景：【数据驱动智能，观测重构治理】在专有云（Apsara Stack）这一数字化转型的技术深水区，我们正在打造 AI 驱动的可观测性中枢。通过高性能引擎与 LLM（大语言模型）的协同，我们致力于在海量、异构的专有云环境中，为政企客户提供秒级故障定位体验。在这里，你处理的是关乎国计民生的核心基础设施，你定义的每一行代码都在构建一个**“可预测、自修复”**的数字底座。

更新于 2026-03-24北京|杭州|上海

诚云科技-高级应用运维工程师-开源大数据平台

社招2年以上诚云科技

1、负责阿里云开源大数据平台（Flink/EMR/Spark/StarRocks/ES/Hadoop/K8S）运维工作，包括可观测性链路、监控报警，故障应急及处置、SLA可用率度量提升等 2、研发大数据运维管控平台，通过自动化提升运维效率，包括交付&变更CICD、智能诊断定界等 3、落地AIOps智能运维，通过AI算法提升稳定性，包括异常检测、根因定位及基于大模型&智能体Agent运维落地等 4、负责稳定性架构设计及项目组织推动落地，包括基础架构云原生化、跨AZ高可用架构、产品可运维性架构演进等

更新于 2025-09-28北京|杭州

诚云科技-资深应用运维工程师-开源大数据平台

社招3年以上诚云科技

更新于 2025-09-25北京|杭州