logo of baidu

百度智能运维方向大模型应用开发工程师(J97699)

实习兼职ACG地点:北京状态:招聘

任职要求


- 计算机/人工智能相关专业或有实际的AI相关实践与理论经验,硕士以上学历
- 熟练掌握python/c++等编程语言,对于AI相关的Python库比较了解(比如Pandas等),能够开发api/web接口
- 能使用文心智能体/appbuilder/扣子、Dify/FastGPT 等Agent开发工具进行应用开发,有实际的落地案例
- 熟悉向量检索、RAG、任务规划等AI agent关键技术
- 掌握Llama-factory、deeepspeed等大模型训练框架,有实际的训练经验
- 了解传统机器学习的概念,熟悉机器学习各种任务的定义、目标、解决的问题、及衡量指标
- 对前沿 AI 技术有极强兴趣和学习、实践的动力
- 了解深度学习框架,如TensorFlow、Py…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


- 协助组内成员进行大语言模型驱动的智能体架构设计与研发,构建多Agent协同框架,实现复杂运维场景下的推理与决策能力
- 探索RAG在运维垂直领域的应用,结合业务需求设计交互逻辑并实践
- 设计高质量Prompt模板,通过结构化输入、上下文引导等技术优化模型输出质量,提升任务完成率与准确性
- 基于运维业务需求,协助组内成员对大模型进行轻量化微调(如LoRA、PEFT等高效调参技术),提升模型在专业领域的适配性
- 处理基于k8s/docker部署的大模型产品的故障和问题,并指导用户使用产品
- 跟踪最新的AI技术发展动态,探索和跟进前沿技术/算法,团队内部分享、赋能,并推动应用落地
包括英文材料
学历+
Python+
C+++
Pandas+
Web+
智能体+
AI agent+
RAG+
LLaMA-Factory+
大模型+
机器学习+
深度学习+
TensorFlow+
还有更多 •••
相关职位

logo of xd
社招3年以上技术大类

1、负责运维自动化平台的设计与开发,参与运维体系建设; 2、负责 AI 能力的探索与落地,包括 LLM 应用集成、RAG 知识库构建、智能运维等; 3、构建 AIOps 能力,包括智能告警、异常检测、根因分析; 4、开发 AI Agent,落地运维场景的自动化与智能化; 5、负责把日常运维操作实现为自动化工具,挖掘并发现工具需求; 6、将工作过程中的经验积累、研究成果、技术要点等以文档形式保存及传承,建立知识库体系。

更新于 2026-02-04上海
logo of tencent
社招5年以上腾讯云技术

1.Agent核心框架研发: 负责排障AI Agent的核心框架设计与开发,包括任务规划(Planning)、工具调用(Tool-use)、记忆(Memory)等关键模块,持续提升Agent的自主决策与执行能力; 2.Agent效果评测与迭代: 主导设计并落地Agent自动化评测体系,并基于线上失效案例(如规划错误、幻觉)的深入分析,驱动模型、Prompt及工具链的持续优化; 3.大模型后训练与优化: 负责大模型的后训练流程,包括构建高质量SFT数据集、实施Fine-tuning与RLHF/DPO等优化策略,并建立评测-训练-部署的闭环,持续提升模型在排障领域的专业能力。

更新于 2025-11-14深圳
logo of tencent
社招5年以上腾讯云技术

1.Agent核心框架研发: 负责排障AI Agent的核心框架设计与开发,包括任务规划(Planning)、工具调用(Tool-use)、记忆(Memory)等关键模块,持续提升Agent的自主决策与执行能力; 2.Agent效果评测与迭代: 主导设计并落地Agent自动化评测体系,并基于线上失效案例(如规划错误、幻觉)的深入分析,驱动模型、Prompt及工具链的持续优化; 3.大模型后训练与优化: 负责大模型的后训练流程,包括构建高质量SFT数据集、实施Fine-tuning与RLHF/DPO等优化策略,并建立评测-训练-部署的闭环,持续提升模型在排障领域的专业能力。

更新于 2025-08-06深圳|北京
logo of netease
社招网易云音乐

1、负责网易云音乐、Loft、支付等核心业务的系统与平台运维,涵盖操作系统、容器、分布式存储(Ceph)等方向,保障大规模业务的稳定运行; 2、**运维智能化**:设计并实现运维场景下的 AI Agent 系统,包括故障自愈 Agent、智能告警分析 Agent、变更风险评估 Agent 等,提升运维自动化与智能化水平; 3、参与线上业务运维,对线上业务的稳定性负责,利用 LLM 技术辅助故障诊断、根因分析与复盘报告生成,缩短 MTTR; 4、**SDD(Spec-Driven Development)实践**:运用 AI 辅助编写技术规范、运维手册与应急预案,构建可执行的运维知识库,推动文档即代码(Doc-as-Code)的智能化升级; 5、研发和优化运维工具/平台,将 AI 能力与自动化能力赋能给业务和其他团队,建设智能运维(AIOps)平台,提升整体效率; 6、**Prompt 工程与 LLM 应用**:针对运维场景优化大模型应用效果,构建领域专属的 Prompt 模板与知识库 RAG 系统; 7、跟进业界前沿运维技术与云原生体系,探索 AI 在可观测性、容量管理、故障预测等场景的创新应用,不断提升系统可靠性与运维质量。

更新于 2026-03-30杭州