logo of tencent

腾讯高级AI Agent开发工程师-智能运维方向

社招全职5年以上腾讯云技术地点:深圳 | 北京状态:招聘

任职要求


1.核心经验: 5年以上后端开发算法工程经验,具备LLM应用或AI Agent的实际开发和评测经验,有主导相关项目经验者优先;
2.AI技术栈: 深入理解大模型原理,熟悉主流Agent架构(如ReAct)、RAG及Fine-tuning技术,精通Prompt Engineering。熟悉模型后训练技术栈,包括SFT(指令微调)、RLHF/DPO(偏好对齐),以及LoRA等参数高效微调(PEFT)方法;
3.工程能力: 精通Go/Python,具备优秀的软件架构设计和复杂系统问题定位能力;熟悉KubernetesDocker等云原生技术;
4.软性素质: 具备出色的技术钻研和问题解决能力,对AI前沿技术有浓厚兴趣,强烈的Owner意识,以及优秀的跨团队沟通和项目推动能力。

加分项
1.有AIOps、智能运维或复杂系统排障相关领域经验者;
2.有开源大模型(如Llama)微调和部署经验者;
3.在同等条件下,通过腾讯云认证或取得同等资格认证的候选人,我们会优先考虑。

工作职责


1.Agent核心框架研发: 负责排障AI Agent的核心框架设计与开发,包括任务规划(Planning)、工具调用(Tool-use)、记忆(Memory)等关键模块,持续提升Agent的自主决策与执行能力;
2.Agent效果评测与迭代: 主导设计并落地Agent自动化评测体系,并基于线上失效案例(如规划错误、幻觉)的深入分析,驱动模型、Prompt及工具链的持续优化;
3.大模型后训练与优化: 负责大模型的后训练流程,包括构建高质量SFT数据集、实施Fine-tuning与RLHF/DPO等优化策略,并建立评测-训练-部署的闭环,持续提升模型在排障领域的专业能力。
包括英文材料
Nginx+
Kafka+
MySQL+
Kubernetes+
ElasticSearch+
Prometheus+
Go+
Rust+
Python+
Bash+
系统设计+
稳定性治理+
AI agent+
DevOps+
后端开发+
算法+
大模型+
React+
RAG+
Prompt+
SFT+
Docker+
Llama+
相关职位

logo of bytedance
社招A171311A

1、设计和实现基于LLM的智能体架构,包括任务规划、对话管理、意图识别、流程工程等; 2、设计和实现多模态Agent,支持文本、语音、图像等多种输入/输出形式的处理; 3、推动AI Agent在架构和性能上的持续优化,提升Agent对用户理解能力和响应的准确性; 4、开发和维护智能体的后端服务,确保系统的稳定性和可扩展性; 5、跟踪并研究行业前沿AI算法,持续提升AI Agent的技术水平; 6、编写必要的技术文档,包括API接口说明、核心算法设计与代码开发。

更新于 2025-01-08
logo of aliyun
社招3年以上云智能集团

阿里云持续推进AI与云计算深度融合的战略布局,聚焦AI基础设施、大模型平台及企业级AI应用等核心场景。为加速专有云网络产品的技术演进,现诚邀优秀人才加入: ● 负责专有云云计算网络产品的设计与研发,围绕虚拟化、负载均衡(四层/七层)、容器网络、服务网格及软硬件协同等云网络与云原生关键技术,开展技术分析、方案选型与功能设计工作。 ● 承担云网络核心模块的编码实现,包括网元、网关等产品的功能开发、单元测试(UT)、端到端测试(E2E)用例编写、代码调试与评审,以及版本发布等全流程研发任务。 ● 参与专有云网络运维体系建设,负责线上问题的定位、分析与解决,为一线技术支持团队提供技术支撑,保障产品稳定高效运行。 ● 具备大模型应用开发能力,结合实际运维场景,推动运维系统的智能化升级,提升运维体系的可靠性、自动化水平与用户体验。

更新于 2025-09-05
logo of alibaba
社招3年以上

1、负责淘天基础平台相关技术产品架构设计,核心产品模块的研发、迭代优化及技术方案落地 2、参与制定技术产品的架构发展规划,评审应用架构方案,负责核心功能模块的架构代码 3、聚焦研发效能,推动智能化运维体系升级,改善开发体验 4、应用AI技术深度融合到基础服务中,打造智能化的技术基础设施,提升研发效率,降低业务风险

更新于 2025-09-18
logo of iqiyi
社招5年以上研发

- 参与公司 Agent 平台 / AI 工作流系统 /智能体引擎 /中台的架构设计与技术落地; - 设计与实现 Agent 节点、策略模块、工具调用、执行引擎、任务调度、状态管理、日志追踪等核心能力; - 负责系统的性能优化、模块重构、技术栈升级、遗留系统改造; - 构建和完善高可用、低延迟、高并发的服务治理、容错、熔断、降级、流控、限流、服务发现等机制; - 构建良好开发流程:CI/CD、自动化部署、监控与告警、日志/Trace/链路跟踪、灰度/回滚机制; - 与产品、前端、运维、数据、安全团队密切协作,推动需求从设计到上线的落地。

更新于 2025-09-28