小红书AI Agent 全栈工程师-点点

社招全职3-5年后端开发2026-04-08地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

1、全栈开发基础与意愿： 具备全栈开发意愿或者具备实操经验，精通至少一门后端语言（Java / Go 等），或熟悉 React / Vue 任一现代前端框架，或具备深厚的移动端（iOS / Android）架构调优经验。
2、Agent 架构经验及认知： 深入理解 LLM 的工作原理与能力边界，具备构建复杂 Agent 系统或长程任务流的实战经验；熟悉任务拆解、上下文增强与中间态管理。
3、高可用与高并发架构建设： 具备高并发长连接系统、微服务架构的开发经验；对分布式系统稳定性治理、Trace 链路追踪、容灾降级架构有清晰的解法与落地经验，能独立解决复杂系统的工程瓶颈。
4、资深 AI 产品用户： 对 AI 产品抱有浓厚兴趣，深度且高频地使用过 ChatGPT、Claude、Gemini、Kimi 等主流大模型，以…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、端到端功能建设及交付：参与点点（Dots）AI 对话应用的全栈功能研发，熟练借助 AI 编程工具（如 Claude Code、Cursor、Codex 等）实现人机协同编程，独立完成完整功能模块的端到端（Client-Server-AI）架构设计与高质量交付。
2、Agent 系统与工作流建设：参与构建连接大模型与业务场景的 Agent 系统，设计并落地多步推理（Multi-step Reasoning）、动态 Workflow 编排、多模型路由、多样 Tool Calling 、 DeepResearch 等核心机制。
3、服务端与高并发对话系统研发：参与 AI 对话产品服务端核心架构设计，构建支撑千万级并发的流式消息分发与路由系统（基于 SSE / WebSocket / gRPC 等协议）；推进微服务系统容量规划、全链路追踪（Trace）与性能瓶颈调优。
4、大前端与跨端交互体验攻坚：具备跨端视野，深度参与大前端（iOS / Android / Web / RN）核心模块开发，攻坚富文本与复杂卡片渲染、多模态交互（音视频 / 图像）、复杂动画及极致的客户端性能治理（启动、内存、卡顿与流畅度）。
5、全链路高可用保障：针对复杂 AI 任务的不确定性与不可靠性，设计并实现健壮的工程兜底机制，构建高可用的服务架构，涵盖中间状态存储与恢复（Memory/State Management）、长链路容错、智能重试与降级，支撑核心场景的工业级稳定性。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

Go+

Java+

Rust+

Python+

分布式系统+

高并发+

微服务+

服务治理+

缓存+

消息队列+

稳定性治理+

系统设计+

Prometheus+

还有更多 •••

登录查看完整学习资料

相关职位

AI Agent 全栈工程师-点点/ Full-Stack AI Engineer · Dots

社招3-5年后端开发

1、端到端功能建设及交付：参与点点（Dots）AI 对话应用的全栈功能研发，熟练借助 AI 编程工具（如 Claude Code、Cursor、Codex 等）实现人机协同编程，独立完成完整功能模块的端到端（Client-Server-AI）架构设计与高质量交付。 2、Agent 系统与工作流建设：参与构建连接大模型与业务场景的 Agent 系统，设计并落地多步推理（Multi-step Reasoning）、动态 Workflow 编排、多模型路由、多样 Tool Calling 、 DeepResearch 等核心机制。 3、服务端与高并发对话系统研发：参与 AI 对话产品服务端核心架构设计，构建支撑千万级并发的流式消息分发与路由系统（基于 SSE / WebSocket / gRPC 等协议）；推进微服务系统容量规划、全链路追踪（Trace）与性能瓶颈调优。 4、大前端与跨端交互体验攻坚：具备跨端视野，深度参与大前端（iOS / Android / Web / RN）核心模块开发，攻坚富文本与复杂卡片渲染、多模态交互（音视频 / 图像）、复杂动画及极致的客户端性能治理（启动、内存、卡顿与流畅度）。 5、全链路高可用保障：针对复杂 AI 任务的不确定性与不可靠性，设计并实现健壮的工程兜底机制，构建高可用的服务架构，涵盖中间状态存储与恢复（Memory/State Management）、长链路容错、智能重试与降级，支撑核心场景的工业级稳定性。

更新于 2026-06-23北京|上海

AI Agent 全栈工程师（音视频方向）

社招1-3年J0011

岗位概述：负责设计和开发面向音视频业务的 Agent 矩阵，覆盖智能排障、成本管控、体验优化、研发提效等核心场景。你将把复杂的音视频处理 SOP 转化为 Agent 可自主执行的工作流，构建从"能问"到"能干"的完整 Agent 能力闭环。工作职责： 1、Agent 系统设计与开发：独立设计、开发和迭代 AI Agent，完成架构选型、任务编排、Prompt 设计、工具调用与端到端交付； 2、工具链封装与集成：将部门核心平台能力（排障、转码、调度、监控等）封装为 Agent 可调用的标准化 Tool / MCP / Skill等，实现 Agent 从"只能查"到"可以干"的跃迁； 3、RAG 知识库建设：搭建和优化音视频领域知识库（向量检索 + 混合检索 + 重排序），持续提升检索准确率与响应质量； 4、效果评估与迭代：设计评估体系，建立评测集，量化 Agent 准确率/召回率/延迟/成本，数据驱动持续优化； 5、成本与稳定性治理：制定 Agent 降本标准（上下文压缩、模型分流、Token 限流），设计异常兜底与熔断策略，保障生产级可靠性； 6、前沿探索与团队赋能：持续追踪 AI Agent 生态最新进展，探索 AI 在音视频工作流自动化中的创新应用，推动部门 AI 研发范式升级。

更新于 2026-06-18北京|上海|深圳

ATH-MaaS-AI Agent全栈工程师-视频智能评测-广州

社招3年以上云智能集团

岗位定位你将作为AI视频生产产品智能评测体系的核心建造者。我们既评测视频生成、图片生成等多模态模型的能力边界，也评测产品在真实业务场景下的端到端产出质量——从模型选型到生产链路放行，每一环都需要可量化、可解释、可复现的评判依据。你要建造的智能评测体系，能自主理解评测目标、调度多模态模型诊断、给出可解释判分、驱动生产链路的重试与放行；同时与生成大模型形成双向飞轮——评测产出反哺大模型微调与偏好对齐，大模型跃迁驱动视频生成产品及评测能力演进。核心职责 1. 评测Agent架构设计 ● 主导设计"视频评测Agent"的能力边界、工具集与决策协议，使其具备任务规划、模型选型、自动重试、异常归因、人工介入点设计等自主能力。 ● 与视频生产链路上下游的Agent打通，将评测Agent作为生产链路中的智能质检与自纠错节点，形成"生成→质检→修复→放行"的闭环。 ● 设计评测Agent的可观测体系，让每一次决策都可追溯、可复盘、可改进。 2. 跨模型Benchmark体系建设 ● 构建覆盖视频生成、图片生成等多模态生成模型的Benchmark评测基准，定义能力地图与质量基线。 ● 建立模型选型、版本对比、回归验证的数据化决策链路，让模型选型从经验驱动走向证据驱动。 ● 攻关"跨模型可比性"工程难题：评测样本设计、风格归一化、置信区间标注、人工抽样补评机制。 3. 评测Prompt工程与VLM调优 ● 系统性构建面向视频评测各环节的Prompt工程体系：分层结构化、多模态对齐、领域知识注入、置信度自评等精细化设计。 ● 建立Prompt版本管理、A/B评测、自动优化机制，让VLM评分在跨模型对比语境下持续逼近人工裁判的一致性。 ● 探索结合人类反馈与Benchmark交叉验证的评测Prompt偏好对齐，让智能评测"打分像一个有审美的人"。 4. 评测与生成大模型的协同进化 ● 设计评测产物的结构化沉淀方案，把每一次评测都转化为可检索、可复用、可再加工的数据资产，作为视频生成大模型微调（SFT/DPO）与偏好对齐的高质量信号源。 ● 与算法侧协同建立"评测→反哺→生成→再评测"的双向闭环：评测识别出的Bad Case与Hard Case定向输入生成模型的迭代训练，生成模型每一次能力跃迁又驱动评测维度的扩展、Benchmark的扩容与评分基线的重标定。 ● 建设case库管理与质量回归机制，保障评测体系自身能跟上生成模型的迭代节奏。 5. 评测全栈工程能力 ● 端到端打通"任务提交→视频处理（抽帧/转码/格式适配）→多模态推理→评分聚合→报告生成→数据可视化"的自动化流水线。 ● 独立完成评测控制台、Benchmark对比看板、case库管理等前端功能，保障评测系统具备可用性与可维护性。 ● 保障长链路评测任务的稳定性：断点续传、局部重试、并发调度、容错降级等核心工程难题。

更新于 2026-07-13北京|杭州|广州

ATH-MaaS-AI Agent全栈工程师-Agentic PaaS-杭州/北京/广州

社招3年以上云智能集团

岗位定位我们正在构建 Agentic PaaS 能力层——让平台的 AI 视频创作能力以 CLI / SDK / WebMCP / Skills 等形态，被开发者、合作方产品和 AI Agent 广泛调用。你将负责这一能力层的多终端工程建设，把视频创作能力变成可嵌入、可编排、可实时交互的产品，让客户与开发者能够更智能、更 agentic 地完成视频生产。核心职责 1. Agentic 能力输出与 MCP 建设 ● 基于 MCP协议，在 Web 端构建可被 Agent 调用的能力服务（WebMCP），让平台的创作能力可被任意 AI Agent 发现、调用与编排。 ● 将复杂的视频生产流程封装为可编排、可复用、可分发的标准化技能（Skills），支撑 Agent 场景化视频生产。 ● 设计面向 Agent 的调用接口与上下文协议，让 Agent 能够自主规划、执行、迭代视频创作任务。 2. CLI 工具链建设 ● 设计并实现 CLI 的完整链路：鉴权体系 / 原子命令 / 场景命令 / 自升级机制 / Plugin 扩展。 ● 构建面向开发者和 Agent 的命令调用接口，支持在本地Agent/终端直接完成视频生产任务。 3. SDK 能力封装 ● 设计面向第三方集成的整体 SDK 体系，支持合作方在 Web、桌面端、移动端等多终端嵌入创作能力。 ● 构建 SDK 的音视频核心能力：播放、编辑、转码、编解码、流式渲染、实时预览等，保障跨终端场景下的性能与体验。 ● 定义清晰的 API 契约与版本管理策略，保障 SDK 稳定性与向后兼容。 4. 实时生成互动引擎 ● 建设实时生成互动引擎的核心能力，支持多协议低延迟流式传输与交互，为上层应用提供统一的实时生成互动语义。 ● 对接实时 AI 生成模型服务能力，设计引擎的对接协议，将实时生成互动能力封装为可被 SDK / CLI / WebMCP 调用的标准接口。 5. 音视频核心能力 ● 负责跨终端音视频核心链路：编解码（H.264 / H.265 / AV1）、封装格式、流媒体传输、自适应码率、音画同步等。 ● 基于 WebCodecs / MediaSource Extension / WASM 等技术，建设高性能音视频处理能力。 ● 持续优化多终端场景下的播放质量、首帧速度、弱网体验和功耗表现。

更新于 2026-07-16北京|杭州|广州