logo of xiaohongshu

小红书AI Agent研发工程师(大数据运维治理方向)

社招全职3-5年后端开发地点:北京 | 上海 | 杭州状态:招聘

任职要求


1、计算机科学、人工智能、数学或相关专业,有复杂智能系统、Agent大模型项目研发经验优先;
2、精通Java开发,熟悉分布式、缓存消息队列微服务等架构机制,熟悉Spark、Flink、Hive、Starrocks等大数据生态,了解引擎运维;
3、熟悉检索增强生成(RAG)、Single/Multi-A…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责大数据运维及治理场景下AI Agent的设计与实现,覆盖元数据增强、任务智能诊断、数据质量归因、成本治理、稳定性运维等核心场景,落地自动化运维和治理工具;
2、参与数据管治和运维领域知识库及知识图谱研发,优化LLM在异常检测、根因定位、故障自愈、性能调优、成本治理等场景的生成准确性与实用性;
3、深入场景理解需求,基于大模型与AI前沿工程实践,推动数据开发治理平台产品能力迭代与功能演进;
包括英文材料
AI agent+
大模型+
Java+
缓存+
消息队列+
微服务+
还有更多 •••
相关职位

logo of bytedance
社招A97671

1、深入理解数据生产核心链路,与产品和业务团队紧密协作,识别并解决业务需求沟通、代码开发、上线运维等各环节中的关键问题,快速设计和实现AI驱动的解决方案,抽象和沉淀通用的Agent基建能力; 2、聚焦产品功能与用户体验,联合大模型算法、评估、数据等团队,持续优化产品性能与准确率,提升系统智能化水平; 3、支持产品在字节跳动各条业务线的落地,推动智能化方案的规模化应用; 4、跟踪AI技术前沿发展,推动新技术的引入与工程化落地,持续增强平台智能化能力。

更新于 2025-04-07北京
logo of alibaba
社招2年以上

立足 AI Agent 业务的研发运维全链路视角,从稳定、体验、效率和成本这四个方面持续优化模型推理服务,支持好 AI Agent 业务。 ● 异构算力调度与算力池化(核心):负责 GPU / CPU / 其他异构算力的统一调度与算力池化。设计并实现弹性伸缩、资源混布、潮汐资源盘活、Quota 管理等能力,提升整体资源利用率。 ● 推理调度策略与性能优化:构建并优化推理调度与运行策略(如 KV Cache 管理、并发与队列控制、资源隔离),保障高峰流量下的低延迟与稳定性。 ● 资源编排与多云治理:构建多机房、多地域、多云环境下的统一调度策略,实现跨地域容灾与就近访问。 ● 推理框架与系统优化:协同底层网络 / 存储团队,优化 RDMA、高速网络、缓存 / 存储路径,充分释放大规模集群算力。 ● 平台稳定性与问题治理: ○ 负责推理平台的稳定性建设:治理推理服务常见稳定性问题,建设推理平台的 可观测与稳定性体系、压测与容量规划、问题定位与根因分析等能力,并持续降低 MTTR。 ○ 在多异构资源(GPU、CPU、NPU 等)、多云环境、复杂网络场景下,实现快速问题诊断、隔离与恢复。

更新于 2025-12-29杭州
logo of alibaba
社招2年以上

1、参与淘天物流全域数据体系的规划与建设,构建高一致性、高复用的实时与离线融合数据资产底座,打造统一、可靠、可产品化的数据服务能力; 2、面向AI原生时代,设计并落地面向大模型与智能Agent消费的数据资产与知识库体系,重构数据的组织、语义表达与服务方式,支撑AI系统的高效理解、推理与决策; 3、深度洞察物流业务场景,探索大数据与AI融合的创新路径,通过数据Agent、RAG、任务编排等技术手段,推动数据从“被动响应”向“主动建议”演进,实现智能化运营闭环; 4、主导或参与湖仓一体的数据架构演进,推动数据采集、治理、质量保障、智能加工与自动化运维体系的持续优化,夯实物流业务高效运转的数据基石。

更新于 2026-01-05杭州
logo of kuaishou
社招5-10年D11431

1、主导(参与)规划和设计快手新一代 Data + AI 生产管治平台的后端技术体系以及软件架构,包括 离线/实时开发平台、数据安全、数据地图、大模型数据同步/任务调度等系统; 2、充分利用模型微调、提示词工程、RAG等大模型技术构建智能开发 / 运维 / 治理等生产智能化能力; 3、充分利用微服务、容器化等技术构建高可用、高扩展和低耦合高内聚的数据中台服务; 4、了解业界相关技术体系,为快手数据产品研发引入创造性的技术方案,解决面临的各种复杂问题和挑战。

更新于 2025-08-25北京