logo of didi

滴滴专家工程师 - 智能 Agent 评测方向(J250612010)

社招全职技术地点:北京状态:招聘

任职要求


1、大学本科及以上学历,计算机科学与技术、软件工程、大数据技术、人工智能、智能科学与技术等专业;
2、精通Java程序开发,有良好的编码风格及创新优化意识,具备较强的程序开发能力;
3、有Agent(或大模型)评测经验,熟悉Agent(或大模型)评测方法;
4、对前沿新兴科技有高度好奇心与洞察力,学习能力强,能够…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与下一代客户服务 Agent的构建,负责Agent的效果和质量评测工作,与产品、工程、算法、运营团队紧密沟通协作,深入理解评测需求,制定评测标准,搭建评测体系;
2、探索智能、高效的Agent自动化评测方案,主导评测系统的架构设计和开发工作;
3、关注行业前沿,持续吸收学习业界最佳评测实践,优化完善Agent评测工作;
包括英文材料
学历+
大数据+
还有更多 •••
相关职位

logo of didi
社招技术

主导构建下一代客服 Agent,驱动服务体验与效率提升。需要具备扎实的工程功底、大模型应用功底,结合业务场景设计并推进系统架构落地。 【岗位职责】 1、主导设计下一代客户服务 Agent、Agent Saas,与产品、算法团队合作,设计工程架构和技术路线,增强 Agent(文本、语音)的语义理解能力、灵活对话能力、拟人的服务感受,技术驱动服务体验和效率的提升; 2、主导 Agent 核心链路的技术升级和性能优化,保障7*24小时的稳定运行,提升 Agent 的可观测性和稳定性,提升异常应对能力; 3、深入理解业务,参与面向对话过程的对话策略和服务设计,结合先进的智能技术能力,持续打磨服务水平; 4、关注行业前沿,推进有价值的技术与业务场景的结合,探索创新方法,推动技术创新。

更新于 2025-07-15北京
logo of didi
社招技术

负责滴滴智能客服的对话算法,需要具备扎实的算法功底,结合业务场景,构建下一代客服 Agent,驱动服务体验与效率提升。 工作内容: 1、主导设计下一代客户服务 Agent、Agent Saas,与产品、工程团队合作,设计算法架构和技术路线,技术驱动服务体验和效率的提升; 2、负责领域大模型的后训练和研究,如大规模数据建设、Post-Training、偏好对齐等技术; 3、应用 Post-Training 方向前沿算法和框架,持续提升现有算法的效率与效果; 4、关注行业前沿,推进有价值的技术与业务场景的结合,探索创新方法,推动技术创新。

更新于 2025-07-28北京
logo of didi
社招技术

1、参与下一代客户服务 Agent的构建,负责Agent生命周期的数据飞轮建设,搭建一站式的数据处理和应用平台,高效满足策略分析、模型训练、效果评测等agent构建环节的数据应用诉求; 2、与产品、工程、算法、运营团队紧密沟通协作,深入了解agent生命周期各个环节的工作,充分挖掘数据应用痛点和诉求,抽象沉淀建设平台能力,持续推动平台的整体架构演进; 3、关注行业前沿,持续探索数据飞轮在Agent场景下的最佳实践。

更新于 2025-07-22北京
logo of alibaba
社招2年以上

关于我们 我们在淘天内部打造面向 AI Agent 的工程基础设施:让不同业务团队可以在统一平台上完成 Agent构建→ 数据采集 → 训练/对齐 → 评测 → 发布 → 线上监控与迭代 的全生命周期闭环,真正做到“平台即生产力”。我们希望把 Agent 的研发从“手工作坊”升级为“工业化流水线”,让创新更快发生、让落地更稳定可控。 你将获得什么 ● 做业内稀缺的 Agent 工程化底座:从上下文管理、工具编排、数据闭环、训练评测一体化到线上治理,搭建可规模化复用的平台能力。 ● 多团队、多方向的真实落地:平台会被内部多个团队复用,你做的每个能力都能在不同业务里验证价值,影响面广、成长快。 ● 工程技术的纵深挑战:既要懂模型与 Agent 范式,也要懂系统工程(稳定性、成本、效率、可观测性、安全治理),是“硬核工程”的最佳战场。 ● 清晰的发展路径:成长为 Agent 平台架构师 / 技术负责人 / AI 工程化专家,推动团队方法论与关键能力组件化在公司内部平台化沉淀与规模化复用,提升多业务线研发效率与交付质量。 岗位职责 1、构建 AI Agent 工程基础设施,设计并实现覆盖Agent构建、数据采集、模型训练、评测、发布、优化迭代的全生命周期工程体系; 2、推动 Agent 基建智能化场景的工程落地,提升大模型在自主规划、RAG 增强生成、智能数据标注与采集、训练自动化等方面的能力; 3、跟踪 LLM与Agent 领域的国际前沿技术动态,推动工程技术创新落地,支持复杂任务规划、多模态交互等能力的工程实现; 4、构建端到端的 Agent 评测与自动化工具链,提升 Agent 系统性能与效率,打造业内领先的 AI Agent 技术方案,并支持内部多业务团队在平台上自主开发与落地。

更新于 2026-01-29杭州