智能互联ATH事业群-AI Agent 测试开发工程师-杭州/北京

社招全职3年以上2026-04-07地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1、深度理解 AI 技术栈，熟悉 LLM、Agent、Prompt Engineering、RAG、Tool Calling 等核心概念，对 AI 系统的质量风险有认知（幻觉、偏见、安全性等）；
2、具备 AI 应用测试思维，理解流式响应、多轮对话、上下文管理等 AI 场景的测试方法，能设计针对非确定性输出的验证策略；
3、扎实的测试基本功和工程能力，精通性能测试、自动化测试、安全测试或白盒测试，熟练掌握至少一门编程语言（Python/Java/Go）；…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、负责 AI Agent 平台的测试体系建设，设计和实现用例自动生成、缺陷根因分析、测试执行编排等 Agent，打造智能化质量保障平台；
2、建立 LLM 应用的测试方法论和评估体系，应对非确定性输出的测试挑战，覆盖 Prompt、RAG、Function Calling、多轮对话等场景的专项测试；
3、深入理解复杂业务系统，设计有效的测试策略和自动化框架，参与全站架构升级中的可测性建设和稳定性保障，支撑千万级用户的业务质量；
4、探索 AI 驱动的测试新范式，沉淀 Agent 协作框架、智能测试工具、模型评估体系等技术方案，推动测试工程智能化转型。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

大模型+

AI agent+

Prompt+

RAG+

还有更多 •••

登录查看完整学习资料

相关职位

ATH事业群-AI Agent研发工程师-AI搜索-杭州/北京

社招3年以上云智能集团

1. 负责联网搜索基础设施建设，包括网页抓取、采集调度、站点适配、反爬策略、代理管理、失败重试、增量更新、数据合规与链路监控。 2. 建设网页内容理解与数据处理链路，支持 HTML、PDF、Word、表格、图片、动态网页等多源内容的解析、正文抽取、去噪、去重、质量评估与结构化处理。 3. 负责离线通用索引构建体系，建设面向大规模网页和异构数据的倒排索引、向量索引、结构化索引、混合索引、增量索引和索引质量评估能力。 4. 建设垂类搜索能力，面向企业知识、行业数据、内容、商品、业务系统等场景，设计领域数据 Schema、召回策略、排序策略、过滤规则和结果展示策略。 5. 建设搜索质量优化与数据回流链路，包括 Query 日志、点击行为、用户反馈、Badcase 归因、人工标注、训练数据构建、离线评测、在线 A/B 实验和排序迭代闭环。 6. 设计和优化搜索召回与排序体系，融合全文检索、语义召回、结构化查询、知识图谱、业务规则、Learning to Rank、 Reranking 等能力，提升相关性、时效性和可信度。 7. 构建面向 Agent 的 Deep Search / Deep Research 能力，支持多轮检索、多步推理、动态 Query 改写、结果聚合、反思校验、引用溯源和答案生成。 8. 深入优化 RAG 与 Agentic Search 架构，解决复杂任务中的意图理解、Query Rewriting、Hybrid Search、Context Compression、多跳检索、GraphRAG、幻觉控制与事实一致性问题。 9. 参与 Agent 平台核心模块建设，包括 Agent Runtime、Workflow Engine、Tool Registry、Memory Store、Prompt / Policy 管理、任务队列和执行调度框架。 10. 推动系统生产化落地，重点解决稳定性、可观测性、延迟、成本、质量评估、失败恢复和线上效果退化定位等问题。

更新于 2026-07-08北京|杭州

ATH事业群-AI Agent全栈工程师-视频智能创作-杭州/北京/广州

社招3年以上云智能集团

岗位定位我们正在把 Studio 从视频创作"工具"进化成"AI 创作平台"。这里不止一种创作方式，而是覆盖多种创作模式的完整创作体系。你将作为 Studio 创作体系的核心研发，负责把创作、编辑、智能生成、3D 可视化、多人协作等能力做成稳定、流畅、智能的产品，并能扎进不同创作模式持续做深、打磨。每一种创作模式都在走向 Agentic 化——每一次用户操作背后，都有 AI 在参与理解、生成与迭代。核心职责 1. 创作模式能力建设 ● 负责 Studio 多种创作模式的核心能力研发与工程建设，扎进各创作模式持续做深、做好，打磨极致的用户创作体验，构建产品的核心竞争力。 ● 覆盖从故事板、自由画布到 Agent创作、智能剪辑等多种创作模式的建设，能根据方向重点灵活切入，把不同创作模式都做到好用、易用。 2. 让各创作模式更 Agentic ● 推动 AI Agent 深度融入每一种创作模式，让创作从"人操作工具"走向"人与 Agent 协同创作"，把各创作模式整体带向更 Agentic 的形态。 ● 设计 Agent 参与创作的交互方式，让 AI 的理解、生成与调整过程对用户清晰可见、可控可干预，把不确定的生成过程做成顺畅、可信赖的创作体验。 3. 图形渲染、音视频与 3D 能力建设 ● 基于 Canvas / WebGL / WebGPU / OffscreenCanvas / WebAssembly / WebCodecs 等技术，建设高性能渲染与实时预览能力。 ● 负责音视频基础能力，包括播放、剪辑、转码、封装格式、字幕、音轨、流媒体协议、解码与处理链路。 ● 参与 3D 资产预览、空间编辑、镜头控制、实时渲染等方向的能力建设，探索 Mesh / 点云 / NeRF / 3D Gaussian Splatting 等新型 3D 表达在创作场景的落地。 4. 多端适配与多站点 ● 支持浏览器端、桌面端（Electron / Tauri）等多种运行环境，保障不同设备、分辨率、浏览器和网络条件下的一致体验。 ● 参与国际化、多语言等基础能力建设，支撑国内站 / 国际站 / 海外独立站等多站点的统一技术架构。 5. 性能与体验保障 ● 从用户体验出发，持续提升各终端的性能与创作流畅度，优化加载速度、交互响应、渲染稳定性与弱网体验，让复杂创作也能顺滑好用。 ● 建设产品质量与稳定性保障，覆盖监控、异常定位、自动化测试等能力，保障产品长期稳定迭代。

更新于 2026-07-21北京|杭州|广州

ATH事业群-AI Agent全栈工程师-视频智能评测-广州

社招3年以上云智能集团

岗位定位你将作为AI视频生产产品智能评测体系的核心建造者。我们既评测视频生成、图片生成等多模态模型的能力边界，也评测产品在真实业务场景下的端到端产出质量——从模型选型到生产链路放行，每一环都需要可量化、可解释、可复现的评判依据。你要建造的智能评测体系，能自主理解评测目标、调度多模态模型诊断、给出可解释判分、驱动生产链路的重试与放行；同时与生成大模型形成双向飞轮——评测产出反哺大模型微调与偏好对齐，大模型跃迁驱动视频生成产品及评测能力演进。核心职责 1. 评测Agent架构设计 ● 主导设计"视频评测Agent"的能力边界、工具集与决策协议，使其具备任务规划、模型选型、自动重试、异常归因、人工介入点设计等自主能力。 ● 与视频生产链路上下游的Agent打通，将评测Agent作为生产链路中的智能质检与自纠错节点，形成"生成→质检→修复→放行"的闭环。 ● 设计评测Agent的可观测体系，让每一次决策都可追溯、可复盘、可改进。 2. 跨模型Benchmark体系建设 ● 构建覆盖视频生成、图片生成等多模态生成模型的Benchmark评测基准，定义能力地图与质量基线。 ● 建立模型选型、版本对比、回归验证的数据化决策链路，让模型选型从经验驱动走向证据驱动。 ● 攻关"跨模型可比性"工程难题：评测样本设计、风格归一化、置信区间标注、人工抽样补评机制。 3. 评测Prompt工程与VLM调优 ● 系统性构建面向视频评测各环节的Prompt工程体系：分层结构化、多模态对齐、领域知识注入、置信度自评等精细化设计。 ● 建立Prompt版本管理、A/B评测、自动优化机制，让VLM评分在跨模型对比语境下持续逼近人工裁判的一致性。 ● 探索结合人类反馈与Benchmark交叉验证的评测Prompt偏好对齐，让智能评测"打分像一个有审美的人"。 4. 评测与生成大模型的协同进化 ● 设计评测产物的结构化沉淀方案，把每一次评测都转化为可检索、可复用、可再加工的数据资产，作为视频生成大模型微调（SFT/DPO）与偏好对齐的高质量信号源。 ● 与算法侧协同建立"评测→反哺→生成→再评测"的双向闭环：评测识别出的Bad Case与Hard Case定向输入生成模型的迭代训练，生成模型每一次能力跃迁又驱动评测维度的扩展、Benchmark的扩容与评分基线的重标定。 ● 建设case库管理与质量回归机制，保障评测体系自身能跟上生成模型的迭代节奏。 5. 评测全栈工程能力 ● 端到端打通"任务提交→视频处理（抽帧/转码/格式适配）→多模态推理→评分聚合→报告生成→数据可视化"的自动化流水线。 ● 独立完成评测控制台、Benchmark对比看板、case库管理等前端功能，保障评测系统具备可用性与可维护性。 ● 保障长链路评测任务的稳定性：断点续传、局部重试、并发调度、容错降级等核心工程难题。

更新于 2026-07-21北京|杭州|广州

ATH事业群-AI Agent研发工程师/专家-AI视频生产-北京/杭州/广州/上海

社招2年以上云智能集团

● 岗位定位：你将作为AI视频生产应用与Agent系统的核心建造者，负责打造这个时代最具创造力的“自主智能体”。我们正在用Agent重新定义视频生产的工作方式——不是让AI辅助人类操作，这个Agent将能够理解人类的创意意图，自主规划、调度并执行从创意到成片的整个视频创作流程。你将站在AI技术与视频创意的交汇点，设计并落地驱动这一切的Agent系统，让每个人都能指挥一个“AI制作团队”，让AI成为真正的"视频生产者"。 ● 核心职责 1. AI视频生产Agent架构设计 ● 主导设计面向视频全链路生产的Multi-Agent系统架构，拆解并定义不同角色Agent的能力边界与协作协议。 ● 构建支持复杂任务分解、动态规划、自主决策、异常恢复的Agent运行框架。 ● 设计Agent间的通信机制、状态管理与记忆体系，保障长链路生产任务的一致性、可追溯性与可干预性。 2. 多模态模型集成调优 ● 持续跟踪并将最新的图片生成、视频生成、音频生成、VL等多模态大模型集成进Agent生产链路，保持Agent能力的持续技术领先。 ● 对模型输出质量进行系统性调优，针对视频生产场景的语义一致性、运动合理性、视觉/音频质量、叙事逻辑性、指令遵循度、情绪传达力等关键指标进行专项优化。 ● 建立模型能力评测基准体系，定义质量基线与模型SLA，构建覆盖模型选型、版本对比、回归验证的数据化决策链路。 3. 任务规划与工作流编排 ● 设计基于LLM的动态任务规划引擎，支持自然语言输入→任务图生成→并行/串行执行→结果聚合的完整链路。 ● 在平台层统一工作流引擎之上，根据不同创作意图、内容类型、生产规格，在运行时动态构建差异化的视频生产工作流。 ● 攻关长链路任务的可靠性保障：任务断点续传、局部重试、人机协同介入点设计等核心工程难题，确保复杂任务在动态工作流下依然稳定可控。 4. 提示词工程与效果优化 ● 系统性构建面向视频生产各环节的Prompt工程体系，包括分层结构化、动态上下文、领域知识、多模态提示协同对齐等精细化设计。 ● 建立Prompt版本管理、A/B评测、自动优化机制，通过数据驱动持续提升Agent各节点输出质量。 ● 探索基于RLHF、DPO等技术的偏好对齐方法，让Agent的生产风格与用户意图高度契合，逼近"零修改直出"。 5. 视频生成流程自动化 ● 端到端打通从"创意"到"成片输出"的全自动化生产流水线，以最小化人工干预节点为终极目标。 ● 构建智能质检Agent，对生成视频进行自动化质量评估、问题定位与修复决策，形成自我纠错的生产闭环。 ● 设计支持批量生产、个性化定制、多风格并行的自动化调度体系，支撑规模化内容生产的工业级需求。

更新于 2026-06-24北京|杭州|广州