
智能互联业务技术-AI Agent 开发工程师-营销工具
任职要求
1、本科及以上学历,计算机/人工智能/软件工程等相关专业优先,具备扎实的工程与算法基础。 2、熟悉 AI 研发范式与工程化落地流程,能围绕业务场景定义指标、设计方案、交付可上线系统并持续优化。 3、深入掌握Agent架构核心组件设计原理和调优方案,包含Prompt Engineering,Functi…
工作职责
1、负责商家营销场景的大模型应用研发与落地,能够深度洞察商家营销需求,设计并交付端到端的AI解决方案(如营销策略推荐、商品价格分析等),推动技术价值转化为商家经营实效。 2、负责数据处理、样本构建、特征工程、模型选型、调优及推理优化全流程,打通训练-部署-监控闭环,支撑业务敏捷迭代与规模化应用。 3、基于商家使用反馈与行为数据,持续挖掘营销痛点,创新设计大模型赋能方案(如动态策略生成、效果归因分析),提升商家运营效率与转化效果。 4、搭建线上监控与评估机制,通过A/B测试、数据归因、系统日志分析等手段,精准定位问题并推动模型与产品迭代升级,保障服务稳定性与用户体验。
在大模型与智能体(Agent)成为核心交付形态的趋势下,我们亟需构建科学、高效、贴合业务目标的AI评测能力,驱动Agent能力持续突破上限。作为AI评测工程师,你将深度参与从需求定义到上线监控的全生命周期,打造覆盖能力、鲁棒性、安全性与业务价值的多维评测体系。 具体你将负责: 1. 设计并落地面向真实业务的 Agent 评测体系:针对多步推理、工具调用、代码生成、记忆管理、多Agent协作等核心能力,构建覆盖准确性、鲁棒性、一致性、安全性、执行效率等的多维评估标准与场景化 Benchmark; 2. 构建高质量动态评测数据集:基于真实业务轨迹、合成数据(Synthetic Data)、对抗样本与失败案例(Badcase),持续演进评测集,探索 Agent 能力边界; 3. 研发自动化、高扩展的评测框架与工具链流水线:实现数据管理、指标计算、结果分析与可视化的一站式支持,提升评测效率; 4. 深度分析评测结果:精准定位Agent在推理、规划、记忆、工具使用等环节的缺陷,输出结构化诊断报告与优化建议,推动agent开发团队持续迭代; 5. 评测流程标准化建设:参与AI项目全流程,从需求阶段提供评测支持到上线后的持续观测,保障评测环境稳定性、数据质量与结果可复现性 6. 跟踪LLM与Agent前沿技术(如ReAct、Plan-and-Execute、Self-Reflection等),研究并引入先进评测方法(参考GAIA、AgentBench等行业基准);

在大模型与智能体(Agent)成为核心交付形态的趋势下,我们亟需构建科学、高效、贴合业务目标的AI评测能力,驱动Agent能力持续突破上限。作为AI评测工程师,你将深度参与从需求定义到上线监控的全生命周期,打造覆盖能力、鲁棒性、安全性与业务价值的多维评测体系。 具体你将负责: 1. 设计并落地面向真实业务的 Agent 评测体系:针对多步推理、工具调用、代码生成、记忆管理、多Agent协作等核心能力,构建覆盖准确性、鲁棒性、一致性、安全性、执行效率等的多维评估标准与场景化 Benchmark; 2. 构建高质量动态评测数据集:基于真实业务轨迹、合成数据(Synthetic Data)、对抗样本与失败案例(Badcase),持续演进评测集,探索 Agent 能力边界; 3. 研发自动化、高扩展的评测框架与工具链流水线:实现数据管理、指标计算、结果分析与可视化的一站式支持,提升评测效率; 4. 深度分析评测结果:精准定位Agent在推理、规划、记忆、工具使用等环节的缺陷,输出结构化诊断报告与优化建议,推动agent开发团队持续迭代; 5. 评测流程标准化建设:参与AI项目全流程,从需求阶段提供评测支持到上线后的持续观测,保障评测环境稳定性、数据质量与结果可复现性 6. 跟踪LLM与Agent前沿技术(如ReAct、Plan-and-Execute、Self-Reflection等),研究并引入先进评测方法(参考GAIA、AgentBench等行业基准);
-负责营销SaaS产品数字员工智能体应用的需求调研、设计及研发落地工作,结合已有的外呼、客服等应用产品,推动AI Agent在营销、客户服务等To B垂直领域落地并取得业务价值 -负责营销场景售前线索收集、售中对话分析、售后客服等场景化Agent技术预研、架构设计、业务模型抽象及功能开发保持对业务场景的敏锐洞察,快速熟悉业务流程并理解业务痛点,沟通并分析产品需求,制定技术方案,设计与研发核心系统及模块,推动产品快速迭代 -负责AI Agent框架设计与实现,构建高可用、低延迟的AI Agent生产环境。探索大模型与Agent技术的结合,解决复杂场景下的推理能力 -优化Agent与工具调用的协同机制,提升任务规划、自主决策和交互体验,构建各场景化Agent的自动化评估系统