logo of xiaohongshu

小红书数据引擎Agent / AIOps 专家

社招全职3-5年数据引擎地点:北京 | 上海 | 杭州状态:招聘

任职要求


1.计算机相关专业,研究生学历,本科211以上
2.有大数据和技术风险领域的经验,深入原理并有相关场景的大规模实践
3.熟悉机器学习/深度学习算法(如 LSTMGNN、异常检测算法等),熟练掌握数据ETL流程、PyTorch / TensorFlow 及 MLOps 生产工具链
4.熟悉并落地如下1个或多个领域的经验:
a). 大规模云平台的资源分配、调度优化和中长期资源规划:运用需求预测、运筹优…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.探索和落地大数据领域Agent和AIOps技术风险领域的前沿技术和应用场景,包括智能问答、推理分析、容量规划、数据治理、业务诊断、风险预测等,并将研究结果应用到数据平台和数据业务领域,不断推动服务能力升级。
2.整合多源异构数据来源,构建数据基座,结合传统AI算法和LLM,设计和实现Agent或传统AIOps架构。
3.解决算法工程化的问题,包括端到端应用算法解决方案、模型优化和在线模型更新、场景仿真实验和调优等。不断提升各应用场景的召回率和准确率。
包括英文材料
学历+
机器学习+
深度学习+
算法+
LSTM+
GNN+
ETL+
还有更多 •••
相关职位

logo of aliyun
社招3年以上云智能集团

1)负责阿里云AI人工智能平台(PAI)运维工作,建设超大规模GPU集群稳定性体系,包括可观测性链路、监控报警,故障应急及处置、SLA可用率度量提升等 2)研发AI运维管控平台,通过自动化提升运维效率,包括交付&变更CICD、GPU节点交付&自愈、智能诊断定界等 3)落地AIOps智能运维,通过AI算法提升稳定性,包括异常检测、根因定位及基于大模型&智能体Agent运维落地等 4)负责稳定性架构设计及项目组织推动落地,包括基础架构云原生化、跨AZ高可用架构、产品可运维性架构演进等

更新于 2025-10-17北京|杭州
logo of aliyun
社招2年以上诚云科技

1、负责阿里云开源大数据平台(Flink/EMR/Spark/StarRocks/ES/Hadoop/K8S)运维工作,包括可观测性链路、监控报警,故障应急及处置、SLA可用率度量提升等 2、研发大数据运维管控平台,通过自动化提升运维效率,包括交付&变更CICD、智能诊断定界等 3、落地AIOps智能运维,通过AI算法提升稳定性,包括异常检测、根因定位及基于大模型&智能体Agent运维落地等 4、负责稳定性架构设计及项目组织推动落地,包括基础架构云原生化、跨AZ高可用架构、产品可运维性架构演进等

更新于 2025-09-28北京|杭州
logo of aliyun
社招3年以上诚云科技

1、负责阿里云开源大数据平台(Flink/EMR/Spark/StarRocks/ES/Hadoop/K8S)运维工作,包括可观测性链路、监控报警,故障应急及处置、SLA可用率度量提升等 2、研发大数据运维管控平台,通过自动化提升运维效率,包括交付&变更CICD、智能诊断定界等 3、落地AIOps智能运维,通过AI算法提升稳定性,包括异常检测、根因定位及基于大模型&智能体Agent运维落地等 4、负责稳定性架构设计及项目组织推动落地,包括基础架构云原生化、跨AZ高可用架构、产品可运维性架构演进等

更新于 2025-09-25北京|杭州
logo of aliyun
社招3年以上诚云科技

1、负责阿里云AI人工智能平台(PAI)运维工作,建设超大规模GPU集群稳定性体系,包括可观测性链路、监控报警,故障应急及处置、SLA可用率度量提升等 2、研发AI运维管控平台,通过自动化提升运维效率,包括交付&变更CICD、GPU节点交付&自愈、智能诊断定界等 3、落地AIOps智能运维,通过AI算法提升稳定性,包括异常检测、根因定位及基于大模型&智能体Agent运维落地等 4、负责稳定性架构设计及项目组织推动落地,包括基础架构云原生化、跨AZ高可用架构、产品可运维性架构演进等

更新于 2025-10-12北京|杭州