平头哥平头哥-AI Agent 应用开发工程师-上海
任职要求
1. 计算机相关专业背景,3 年以上软件开发经验,具备 1 个及以上 LLM/Agent 项目落地经验 2. 编程能力强,熟练 Python(优先)或 TypeScript,掌握工程化实践(模块化、单元测试、CI/CD、容器化) 3. 熟悉 PyTorch 训练/微调与推理基本流程;能基于 vLLM 部署与调优(PagedAttention、KV Cache、并行与批处理) 4. 理解 CUDA 基础与 GPU 性能调优思路(显存/带宽/并发),会用 Nsight/Profiler 定位瓶颈,能与框架协同优化 5. 熟悉 openWebUI 的部署与模型接入,能做定制化改造;熟悉 Cursor/Code 类 AI 辅助工具,并能在研发团队内部形成高效开发工作流 6. 掌握 Agent/RAG 常用框架与模式:LangChain/LangGraph、LlamaIndex、Function/Tool Calling、检索增强、评测(RAGAS/DeepEval) 7. 数据与服务基础:FastAPI/NestJS 其一、PostgreSQL/Redis、向量库其一,了解消息队列与缓存;良好的接口与错误处理设计 8. 具备产品与交付意识:需求澄清、MVP 验证、指标定义(成功率/成本/时延)、灰度与回滚、用户反馈闭环 加分项: 1. TensorRT-LLM、Triton Inference Server、Ray Serve/KServe 有实践;模型并行/多卡部署(NCCL)经验 2. 模型量化/蒸馏/LoRA 微调经验;国内外主流模型服务接入(OpenAI/Anthropic/通义/智谱/百川等) 3. CUDA 更深入能力(Kernel/CUTLASS/WGMMA/TMA)或图形/视频处理(CV-CUDA/DALI)经验 4. 前端与可视化能力(React/Next.js/AntD),能独立完成端到端 Demo
工作职责
1. 设计与开发面向业务的 Agent 应用与多智能体流程:任务规划、工具调用、记忆、RAG 检索、反思与自我修复 2. 搭建与优化 LLM 推理与服务:基于 vLLM/TensorRT-LLM/Triton 部署模型,提供 OpenAI 兼容 API,优化吞吐、时延与成本 3. 集成与定制 openWebUI 等前端/运维界面,结合企业需求进行二次开发;熟练使用 Cursor 等 AI 编程工具提升研发效率 4. 构建知识与数据通道:Embedding、向量库(Milvus/FAISS/Weaviate 等)、检索重排、权限与更新策略 5. 建立评测与观测:任务成功率、一次通过率、P95 时延、成本监控、A/B 测试、内容安全与越狱防护;沉淀最佳实践与文档 6. 跨团队协作与敏捷交付:从 PRD/需求澄清到 MVP 上线,度量指标驱动迭代,确保按期交付与质量
阿里云持续推进AI 技术深化战略布局, 围绕AI 和云计算的基础设施建设、AI基础模型平台、企业级AI应用方向构建核心场景。为此,我们正积极招募优秀人才: 1.AI Agent应用开发全流程工作,包括但不限于prompt工程、RAG优化、multi-Agent构建、流程编排等; 2.参与AI Agent产品的需求分析、技术选型、方案设计、用户体验提升等; 3.关注AI与大模型领域技术发展趋势,并灵活应用于项目中。
Android 端 AI Agent 功能开发:负责 Android 平台下 AI Agent 核心功能的设计与实现,包括智能对话交互、任务自动化执行(如日程管理、信息查询)、场景化服务适配(如出行规划、生活助手)等模块,确保 AI Agent 在 Android 设备上具备流畅的交互体验与稳定的服务能力。 Agent 交互逻辑优化:针对 Android 端用户使用习惯,优化 AI Agent 的交互逻辑与界面呈现,提升语音 / 文字交互的响应速度与准确性,包括但不限于列表、弹窗、动画交互等 AI 能力集成与调试:参与 AI 能力(如自然语言理解 NLU、意图识别、多轮对话管理)在 Android 端的集成工作,对接 AI 模型接口与 SDK,完成功能调试与性能优化,确保 AI 能力在移动端高效落地。 技术探索与沉淀:关注 AI Agent 领域前沿技术(如端侧 AI 模型轻量化、个性化 Agent 定制)与 Android 开发新特性,探索新技术在项目中的应用场景。编写技术文档,沉淀开发经验,参与内部技术分享,助力团队技术成长。
1、参与面向AI场景的框架的建设、参与前端框架、运行时、工程框架、开发者工具、平台的建设; 2、参与前端解决方案的设计,以满足AI应用框架智能化场景的需求; 3、参与设计架构清晰的Framework与API,打造具备良好开发体验的开发者工具; 4、参与技术选型和调研,提出专业合理的方案建议,并推动技术驱动产生更多业务价值; 5、帮助AI应用开发者提升效率和质量,持续引进最佳实践、探索和引入更佳的技术方案。