logo of thead

平头哥平头哥-AI Agent 应用开发工程师-上海

社招全职3年以上技术类-开发地点:上海状态:招聘

任职要求


1. 计算机相关专业背景,3 年以上软件开发经验,具备 1 个及以上 LLM/Agent 项目落地经验
2. 编程能力强,熟练 Python(优先)或 TypeScript,掌握工程化实践(模块化、单元测试、CI/CD、容器化)
3. 熟悉 PyTorch 训练/微调与推理基本流程;能基于 vLLM 部署与调优(PagedAttention、KV Cache、并行与批处理)
4. 理解 CUDA 基础与 GPU 性能调优思路(显存/带宽/并发),会用 Nsight/Profiler 定位瓶颈,能与框架协同优化
5. 熟悉 openWebUI 的部署与模型接入,能做定制化改造;熟悉 Cursor/Code 类 AI 辅助工具,并能在研发团队内部形成高效开发工作流
6. 掌握 Agent/RAG 常用框架与模式:LangChain/LangGraph、LlamaIndex、Function/Tool Calling、检索增强、评测(RAGAS/DeepEval)
7. 数据与服务基础:FastAPI/NestJS 其一、PostgreSQL/Redis、向量库其一,了解消息队列缓存;良好的接口与错误处理设计
8. 具备产品与交付意识:需求澄清、MVP 验证、指标定义(成功率/成本/时延)、灰度与回滚、用户反馈闭环

加分项:
1. TensorRT-LLM、Triton Inference Server、Ray Serve/KServe 有实践;模型并行/多卡部署(NCCL)经验
2. 模型量化/蒸馏/LoRA 微调经验;国内外主流模型服务接入(OpenAI/Anthropic/通义/智谱/百川等)
3. CUDA 更深入能力(Kernel/CUTLASS/WGMMA/TMA)或图形/视频处理(CV-CUDA/DALI)经验
4. 前端与可视化能力(React/Next.js/AntD),能独立完成端到端 Demo

工作职责


1. 设计与开发面向业务的 Agent 应用与多智能体流程:任务规划、工具调用、记忆、RAG 检索、反思与自我修复
2. 搭建与优化 LLM 推理与服务:基于 vLLM/TensorRT-LLM/Triton 部署模型,提供 OpenAI 兼容 API,优化吞吐、时延与成本
3. 集成与定制 openWebUI 等前端/运维界面,结合企业需求进行二次开发;熟练使用 Cursor 等 AI 编程工具提升研发效率
4. 构建知识与数据通道:Embedding、向量库(Milvus/FAISS/Weaviate 等)、检索重排、权限与更新策略
5. 建立评测与观测:任务成功率、一次通过率、P95 时延、成本监控、A/B 测试、内容安全与越狱防护;沉淀最佳实践与文档
6. 跨团队协作与敏捷交付:从 PRD/需求澄清到 MVP 上线,度量指标驱动迭代,确保按期交付与质量
包括英文材料
大模型+
AI agent+
Python+
TypeScript+
CI+
CD+
PyTorch+
vLLM+
缓存+
CUDA+
性能调优+
Nsight+
RAG+
LangChain+
LlamaIndex+
FastAPI+
NestJS+
PostgreSQL+
Redis+
消息队列+
TensorRT+
Ray+
内核+
React+
JavaScript+
Next.js+
Ant Design+
相关职位

logo of aliyun
实习阿里云2026届

阿里云持续推进AI 技术深化战略布局, 围绕AI 和云计算的基础设施建设、AI基础模型平台、企业级AI应用方向构建核心场景。为此,我们正积极招募优秀人才: 1.AI Agent应用开发全流程工作,包括但不限于prompt工程、RAG优化、multi-Agent构建、流程编排等; 2.参与AI Agent产品的需求分析、技术选型、方案设计、用户体验提升等; 3.关注AI与大模型领域技术发展趋势,并灵活应用于项目中。

更新于 2025-06-17
logo of nio
校招软件研发

Android 端 AI Agent 功能开发:负责 Android 平台下 AI Agent 核心功能的设计与实现,包括智能对话交互、任务自动化执行(如日程管理、信息查询)、场景化服务适配(如出行规划、生活助手)等模块,确保 AI Agent 在 Android 设备上具备流畅的交互体验与稳定的服务能力。 Agent 交互逻辑优化:针对 Android 端用户使用习惯,优化 AI Agent 的交互逻辑与界面呈现,提升语音 / 文字交互的响应速度与准确性,包括但不限于列表、弹窗、动画交互等 AI 能力集成与调试:参与 AI 能力(如自然语言理解 NLU、意图识别、多轮对话管理)在 Android 端的集成工作,对接 AI 模型接口与 SDK,完成功能调试与性能优化,确保 AI 能力在移动端高效落地。 技术探索与沉淀:关注 AI Agent 领域前沿技术(如端侧 AI 模型轻量化、个性化 Agent 定制)与 Android 开发新特性,探索新技术在项目中的应用场景。编写技术文档,沉淀开发经验,参与内部技术分享,助力团队技术成长。

更新于 2025-09-19
logo of bytedance
社招A192192A

1、参与面向AI场景的框架的建设、参与前端框架、运行时、工程框架、开发者工具、平台的建设; 2、参与前端解决方案的设计,以满足AI应用框架智能化场景的需求; 3、参与设计架构清晰的Framework与API,打造具备良好开发体验的开发者工具; 4、参与技术选型和调研,提出专业合理的方案建议,并推动技术驱动产生更多业务价值; 5、帮助AI应用开发者提升效率和质量,持续引进最佳实践、探索和引入更佳的技术方案。

更新于 2024-08-26
logo of sensetime
社招3年以上系统开发

1.负责开发车载座舱智能Agent框架的设计、开发与优化; 2.基于AI框架,设计并开发标准化协议,优化生态接入,提升兼容性与扩展性; 3.负责 FunctionCall大模型识别精度优化工作,促进在业务场景中的落地与应用; 4.负责在Agent框架上开发agent场景应用; 5.跟踪前沿技术发展趋势,探索新技术的应用可能性,持续提升团队的创新力;

更新于 2025-03-19