logo of thead

平头哥平头哥-AI Agent 应用开发工程师-上海

社招全职3年以上技术类-开发地点:上海状态:招聘

任职要求


1. 计算机相关专业背景,3 年以上软件开发经验,具备 1 个及以上 LLM/Agent 项目落地经验
2. 编程能力强,熟练 Python(优先)或 TypeScript,掌握工程化实践(模块化、单元测试、CI/CD、容器化)
3. 熟悉 PyTorch 训练/微调与推理基本流程;能基于 vLLM 部署与调优(PagedAttention、KV Cache、并行与批处理)
4. 理解 CUDA 基础与 GPU 性能调优思路(显存/带宽/并发),会用 Nsight/Profiler 定位瓶颈,能与框架协同优化
5. 熟悉 openWebUI 的部署与模型接入,能做定制化改造;熟悉 Cursor/Code 类 AI 辅助工具,并能在研发团队内部形成高效开发工作流
6. 掌握 Agent/RAG 常用框架与模式:LangChain/LangGraph、LlamaIndex、Function/Tool Callin…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 设计与开发面向业务的 Agent 应用与多智能体流程:任务规划、工具调用、记忆、RAG 检索、反思与自我修复
2. 搭建与优化 LLM 推理与服务:基于 vLLM/TensorRT-LLM/Triton 部署模型,提供 OpenAI 兼容 API,优化吞吐、时延与成本
3. 集成与定制 openWebUI 等前端/运维界面,结合企业需求进行二次开发;熟练使用 Cursor 等 AI 编程工具提升研发效率
4. 构建知识与数据通道:Embedding、向量库(Milvus/FAISS/Weaviate 等)、检索重排、权限与更新策略
5. 建立评测与观测:任务成功率、一次通过率、P95 时延、成本监控、A/B 测试、内容安全与越狱防护;沉淀最佳实践与文档
6. 跨团队协作与敏捷交付:从 PRD/需求澄清到 MVP 上线,度量指标驱动迭代,确保按期交付与质量
包括英文材料
大模型+
AI agent+
Python+
TypeScript+
CI+
CD+
PyTorch+
vLLM+
缓存+
CUDA+
性能调优+
Nsight+
RAG+
LangChain+
还有更多 •••
相关职位

logo of aliyun
实习阿里云2026届

阿里云持续推进AI 技术深化战略布局, 围绕AI 和云计算的基础设施建设、AI基础模型平台、企业级AI应用方向构建核心场景。为此,我们正积极招募优秀人才: 1.AI Agent应用开发全流程工作,包括但不限于prompt工程、RAG优化、multi-Agent构建、流程编排等; 2.参与AI Agent产品的需求分析、技术选型、方案设计、用户体验提升等; 3.关注AI与大模型领域技术发展趋势,并灵活应用于项目中。

更新于 2025-06-17上海
logo of sensetime
社招系统开发

负责基于大模型构建可落地、可复用的 AI Agent 应用与服务,让模型从“能对话”进化为“能完成任务”。 1. 基于主流大模型(如 Qwen、DeepSeek、SenseNova 等)设计并开发 AI Agent,解决真实业务问题。 2. 负责 Agent 核心能力开发,包括 任务规划、工具/API 调用、记忆机制(RAG)与结果校验。 3. 使用 LangChain / LangGraph / AutoGen 等框架,构建 单 Agent 或多 Agent 协作流程。 4. 编写和优化 Prompt,持续提升 Agent 输出的 稳定性、准确性和可控性。 5. 将 Agent 能力封装为 API 或服务,集成到现有业务系统中,并关注 效果、成本与延迟。

更新于 2025-12-23北京|上海
logo of ctrip
社招3年以上国际业务开发

1. 负责服务端系统架构设计与开发、数据库设计 2. 负责功能模块的代码编写,独立完成单元测试与集成测试 3. 负责服务端接口开发及前后端联调 4. 负责编写软件开发过程所涉及的技术文档 5. 系统的部署、维护、优化及日常数据库管理 6. 参与AI Agent相关应用的服务端开发与集成

更新于 2025-12-01上海
logo of antgroup
社招2年以上技术类-开发

您将负责设计、构建和优化能够自主驱动支付能力的AI智能体,并参与建设AI时代的支付基建,核心职责包括: 1. 智能体系统设计与开发:主导或参与企业级AI Agent平台及支付智能体模块的架构设计、研发与持续迭代。负责智能体工作流、任务规划、意图识别等核心功能模块的开发与优化。 2. 支付生态集成与创新:重点攻关AI Agent与支付系统的深度融合。研究并实现通过自然语言指令或智能体自主决策,无缝、安全地调用支付接口,完成下单、支付、分佣等商业闭环。 3. 多智能体协同与平台构建:设计和开发支持多AI Agent协同交互的框架,实现内外部开发的Agent通过标准协议接入,并确保支付等敏感信息的安全隔离。构建高并发、高可用的智能体应用服务平台。 4. 核心技术攻坚:深入应用大语言模型(LLM)技术,聚焦于智能交互、RAG(检索增强生成)、意图识别、多轮对话等领域,持续提升智能体在支付场景下的决策准确性与用户体验。 我们提供 ● 参与行业前沿的AI Agent与支付生态融合项目的机会,您的工作将直接赋能下一代智能商业应用。 ● 丰富的技术培训和学习资源,支持个人在AI领域的持续成长。

更新于 2025-12-31杭州|上海