logo of xiaohongshu

小红书Agent Harness 工程师

社招全职3-5年后端开发地点:北京 | 上海 | 杭州状态:招聘

任职要求


1、本科学历及以上,计算机相关专业优先;
2、熟悉 TypeScript/Python/Go/Java/Rust 等任意一种后端语言;
3、具备较强的系统工程能力,理解服务治理、任务调度、权限系统、可观测性、分布式系统等基础能力;
4、对 LLM Agent、Tool Calling、MCP、Agent Runtime、Coding Agent、Multi-Agent 等方向有深入兴趣或实践经验;
5、具备优秀的问题抽象能力,能够把复杂业务问题沉淀为平台化、框架化、基础设施化能力。
6、有较强的 ownership,愿意面对新问题、定义新边界,而不是只实现明确需求。

加分项:
1、深入研究或改造过 OpenClaw、Claude Code、Hermes、LangGraph、AutoGen、CrewAI、MCP Server 等 Agent 相关框架。
2、做过 AI Coding Agent、DevTool、IDE 插件、代码执行沙箱、任务编排系统、Workflow Engin…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、建设企业级 Agent Harness / Agent Runtime,支撑会话管理、任务执行、工具调用和状态持久化;
2、建设 Agent Serverless 基础设施,实现按需启动、弹性伸缩和生命周期管理;
3、建设 Agent 可观测体系,覆盖 Trace/ Log/ Metric/ Event 全链路,支持调试回放和故障诊断;
4、建设 Agent 身份认证与权限治理能力,解决权限穿透、最小授权和安全边界问题;
5、建设 Multi-Agent 通信与协作机制,负责任务分发、消息传递和 SuperAgent 路由编排;
6、参与 OpenClaw/Claude Code/Hermes/LangGraph/MCP 等开源 Agent 框架研究与改造,参与沉淀小红书自研 Agent Infra 技术体系。
包括英文材料
学历+
TypeScript+
Python+
Go+
Java+
Rust+
服务治理+
还有更多 •••
相关职位

logo of deepseek
实习全职

团队使命 Model + Harness = Agent 我们正在把 DeepSeek 的前沿模型能力,转化为领先的 Agent 产品。这其中除模型本身以外的所有工作,都属于 Harness 的范畴。 你将加入 Harness 团队,与工程师、研究员紧密协作,参与 DeepSeek 桌面端 Agent 产品的全过程,定义 DeepSeek 对 Harness 的理解。 规划 DeepSeek Harness 产品路线图,连接研究员、工程师、开源社区和广大用户。 理解判断用户的最真实需求,定义与衡量“Agent 是否真的在更多场景下更深入的帮助到更多的人”的指标。 与模型训练团队的研究员深度沟通与合作,实现模型与 Harness 的共同进化。 帮助 Harness 产品内部落地,以内部真实任务做为 Harness 产品和模型相关能力训练的重要反馈源,持续迭代产品能力。 维护 Harness 产品用户社群,从潜在海量用户群体中获取反馈、提取信号,指导产品迭代。 协助项目管理相关工作。

更新于 2026-05-15
logo of kuaishou
社招3-5年D13917

1、负责LLM大语言模型日常评测工作和评测体系建设,包括但不限于设计制定和完善评测方案、评测指标、评测数据收集和更新、评测执行,并输出专业评测报告,深度参与算法效果分析、挖掘问题归因; 2、以算法手段,对基座大模型、应用大模型以及AI产品进行分阶段、端到端效果评测,持续跟踪行业前沿发展,并进行竞品对比; 3、从可解释性角度探索提出更多更深入的基于模型内在机理的评测基准,包括通用能力、智能应用,如Agent; 4、探索智能、高效的模型自动化评估方案,参与自动化评测工具设计、开发及维护; 5、提出更好的Benchmark,定义模型能力,定义AGI,并在相关会议或期刊发表; 6、站在用户角度,对产品、算法提出建设性的意见,在评测参与的各个流程中以用户视角保证产品体验。

更新于 2025-07-17北京
logo of meituan
社招3年以上核心本地商业-业

负责评估和分析大模型在各种应用场景下的表现,与业务团队配合不断优化提升大模型应用效果。具体工作内容包括但不限于: 1. 负责大模型范式下的数据生产标注和应用场景评测平台建设。 2. 深入理解大模型在搜索、推荐、营销等场景的应用落地,参与业务评测方案的制定与评测数据集的建设。 3. 与各相关部门保持良好沟通,深度参与大模型业务应用落地,为各业务方提供评测及相关的模型分析支持。 4. 追踪大模型方向前沿进展,积极主动地学习和探索新的评测及分析的方法和技术。

更新于 2025-06-03北京
logo of meituan
社招2年以上核心本地商业-基

负责美团基础大模型评测框架和周边生态的开发、维护和能力拓展。 支持文本、多模态、Agent、应用等多个方向的评测框架和平台开发工作。 协同支持整个大模型平台从数据到训练到评测的基础架构标准化建设。 协同开源评测社区建设,打造业界一流的评测框架体系。

更新于 2025-05-12北京|上海