logo of mihoyo

米哈游AI Agent 评估工程师

社招全职程序&技术类地点:上海状态:招聘

任职要求


1. 有游戏行业 QA 或 AI 系统测试经验;
2. 理解游戏开发流程与跨部门协作方式;
3. 熟悉 UE 或其他主流引擎优先;
4. 理解测试方法论(边界测试、回归测试、稳定性测试);
5. 能将模糊体验问题…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


岗位定位:
负责构建 AI Agent 在游戏开发流程中的测试与评估体系,从真实制作场景出发,分析 Agent 的行为质量、稳定性与生产适用性,推动系统持续优化。

核心职责:
1. 基于真实游戏制作流程(策划 / TA / 美术 / 程序)设计测试场景;
2. 构建 Agent 行为评估维度与量化标准(成功率、稳定性、可复现性等);
3. 分析失败案例,定位策略缺陷与工作流断点;
4. 建立自动化回归与稳定性验证机制;
5. 输出结构化评估报告,支持系统迭代决策。
包括英文材料
质量保证+
Unreal+
脚本+
还有更多 •••
相关职位

logo of alibaba
社招3年以上

我们是天猫国际技术团队——经营技术团队,专注跨境电商自营业务,在定价、营销、商品管理与商业化等核心场景中持续深耕。身处AI变革浪潮,我们正加速推进AI与业务的深度融合,致力于打造电商全链路AI智能运营体系。基于多年在AIGC、营销托管等领域的技术积累,我们正在构建以大模型为底座、以智能体(Agent)为核心的新一代AI运营基础设施,诚邀您一起加入共赴这场技术浪潮。 加入我们,你将: 1.主导或参与天猫国际AI商品运营、智能营销托管、全链路自动化运营等关键项目,推动AI在跨境电商业务中的规模化落地; 2.设计并开发面向商品运营、定价策略、营销执行等场景的智能体(Agent)系统,实现从感知、决策到执行的闭环能力; 3.构建高可用、可扩展的AI工程架构,集成RAG、Tool Calling、Prompt Engineering、MCP等关键技术,支撑多智能体协同与复杂任务调度; 4.深度理解跨境电商业务逻辑,结合产品规划与运营目标,制定AI技术路线并驱动端到终结方案落地; 5.与算法、产品、业务团队紧密协作,持续迭代Agent评估体系,通过SFT、RLHF、上下文工程等手段提升智能体的任务完成率与用户体验。

更新于 2026-02-06杭州
logo of tesla
社招生产与质量

我们的软件开发团队负责构建应用以支持Tesla的快速增长,同时提供稳定的制造系统和出色的运营产品。您将与大批优秀的IT产品经理、软件开发工程师、IT质量保障工程师以及系统运维工程师协作,共同打造世界级的软件系统,并提供高可用、高伸缩性的IT服务。我们的工程师亲力亲为,也乐于分享,是特斯拉工程师文化的传承者和传播者。 岗位职责 • 参与需求澄清、架构设计、技术实现等软件开发全生命周期。 • 负责软件架构设计、开发、单元测试、集成测试,并为自动化测试提供支持。 • 与制造、质量、供应链、充电、运营、交付、服务等团队保持沟通,深入理解业务需求,并通过IT产品提供端到端的最佳解决方案。

上海
logo of xiaohongshu
社招3-5年引擎

1. 参与小红书 AI agent 框架技术研发,包括 DeepResearch Agent、PlanExecutor Agent、Multi Agent、通用 Agent 等技术开发。 2. 打造小红书 AI agent 分布式研发运维体系,包括传统应用低成本接入,agent 的调试、运维、上线等,打造 AI 分布式应用研发体系。 3. 构建并探索面向 agent 的评估体系,帮助复杂业务的 agent 形成持续迭代优化的正向循环体系。 4. 探索创新更易上手开发的 agent 构建方式,更稳定可靠的 agent 的运行方式,突破大模型能力应用上限。

更新于 2025-05-15北京|上海
logo of meituan
社招GN06

1. 负责 AI Agent 应用的创新架构设计与核心模块研发,构建和优化 Agentic 交互逻辑与智能决策引擎。 2. 推动 AI Agent 的工程化落地,设计和实现高效的 Agentic 工作流,确保大语言模型及相关能力在实际业务场景中的有效应用与闭环。 3. 与产品及算法团队紧密协作,深度探索 AI Agent 的创新应用场景,包括但不限于自主 Agent (Autonomous Agents)、多智能体系统 (Multi-Agent Systems) 等,快速验证并落地前瞻性技术原型。 4. 跟踪 LLM、Agent 及相关AI前沿技术的发展,提出创新性解决方案并应用于实践。 5. 构建和探索面向 Agent 的评估体系与方法,推动复杂业务场景下 Agent 的持续迭代与性能优化。

更新于 2025-06-06北京