阿里云诚云科技-高级运维工程师（大模型方向）-政企技术服务

社招全职2年以上诚云科技2025-11-05地点：北京状态：招聘

扫码手机上打开

任职要求

• 在中型企业或云服务提供商从事SRE、运维工具开发、客户技术服务相关工作，具备2年及以上工作经验
• 熟悉云集群各运维平台和云产品及监控平台使用方法，能够快速专业定位客户问题
• 具备一定集群调优和trouble shooting能力
• 或者掌握分布式系统原理，对存储、计算、流式计算中的一项或多项有深…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、客户现场专项技术负责人，如网络专项、数据库专项；
2、平台稳定性重大变更方案制定与实施，如性能/存储优化、底座改造等；
3、现场故障应急执行，协助原厂尽快恢复平台运行；
4、关键时刻现场保障，如客户平台隐患深度排查与治理；
5、复杂问题原因定位及解决；

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

分布式系统+

相关职位

高级运维工程师

社招网易云音乐

1、负责网易云音乐、Loft、支付等核心业务的系统与平台运维，涵盖操作系统、容器、分布式存储（Ceph）等方向，保障大规模业务的稳定运行； 2、**运维智能化**：设计并实现运维场景下的 AI Agent 系统，包括故障自愈 Agent、智能告警分析 Agent、变更风险评估 Agent 等，提升运维自动化与智能化水平； 3、参与线上业务运维，对线上业务的稳定性负责，利用 LLM 技术辅助故障诊断、根因分析与复盘报告生成，缩短 MTTR； 4、**SDD（Spec-Driven Development）实践**：运用 AI 辅助编写技术规范、运维手册与应急预案，构建可执行的运维知识库，推动文档即代码（Doc-as-Code）的智能化升级； 5、研发和优化运维工具/平台，将 AI 能力与自动化能力赋能给业务和其他团队，建设智能运维（AIOps）平台，提升整体效率； 6、**Prompt 工程与 LLM 应用**：针对运维场景优化大模型应用效果，构建领域专属的 Prompt 模板与知识库 RAG 系统； 7、跟进业界前沿运维技术与云原生体系，探索 AI 在可观测性、容量管理、故障预测等场景的创新应用，不断提升系统可靠性与运维质量。

更新于 2026-03-30杭州

蚂蚁集团-推荐平台高级开发工程师-杭州

社招3年以上技术-开发

1. 负责蚂蚁推荐平台专项领域的深入优化。例如：在线服务性能提升、系统稳定性增强、特征查询效率优化等，持续提升用户体验和平台效率。 2. 负责大模型应用平台相关产品的架构和研发，解决大模型场景下推荐类平台的产品化落地与在线架构优化问题。推动大模型能力在实际业务中高效应用。 3. 负责大模型应用资源管理、稳定性保障、监控运维等基建能力，保障大模型应用可以高效迭代。 4. 参与到新技术和新业务方向的应用与落地，拓展个性化算法业务的边界。

更新于 2025-09-08杭州

高级AI Agent开发工程师-智能运维方向

社招5年以上腾讯云技术

1.Agent核心框架研发：负责排障AI Agent的核心框架设计与开发，包括任务规划（Planning）、工具调用（Tool-use）、记忆（Memory）等关键模块，持续提升Agent的自主决策与执行能力； 2.Agent效果评测与迭代：主导设计并落地Agent自动化评测体系，并基于线上失效案例（如规划错误、幻觉）的深入分析，驱动模型、Prompt及工具链的持续优化； 3.大模型后训练与优化：负责大模型的后训练流程，包括构建高质量SFT数据集、实施Fine-tuning与RLHF/DPO等优化策略，并建立评测-训练-部署的闭环，持续提升模型在排障领域的专业能力。

更新于 2025-11-14深圳

高级AI Agent开发工程师-智能运维方向

社招5年以上腾讯云技术

更新于 2025-08-06深圳|北京