logo of deepseek

深度求索Agent 数据策略工程师

社招全职DeepSeek地点:杭州 | 北京状态:招聘

任职要求


1.具备 Claude Code、Cursor、OpenClaw 等 AI 编程工具的重度使用经验,对 LLM 辅助开发有自己的理解与思考;
2.熟练掌握 Python,能够独立编写数据处理、评测脚本等工具;
3.对大语言模型有基础认知且对探索大模型能力边界具有较高的热情;
4.具备良好的自主能动性,…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.整体目标:提升模型在 Agent 方向的专业能力。围绕代码生成、通用agent等场景,设计高质量的 Agent 训练语料;构建端到端的测试用例,从可用性、代码规范、工程质量、任务完成度等多维度评估模型表现;
2.设计并构造高质量的 Agent 评测数据集,能够精准区分不同模型的能力边界;针对 Agent 的规划、工具调用、多轮交互、指令跟随等核心能力,构建多样化的测试场景与用例;持续迭代评测标准,确保评测体系能够跟进业界前沿并反映真实用户需求;
3.探索不同数据标注策略对模型 Agent 能力的影响路径;参与数据与强化学习(RL)结合过程中的实验设计,研究模型能力的可控性检测方法,为训练策略优化提供数据侧支撑;
4.基于深度使用 Claude Code、OpenClaw 等主流 Agent 产品的实践经验,系统性分析当前模型的能力短板与失败模式;针对性地构建补齐数据与边界测试用例,推动模型在弱项上的持续迭代与突破。
包括英文材料
大模型+
Python+
脚本+
还有更多 •••
相关职位

logo of bytedance
社招3年以上A113004

1、参与部门画像体系建设,构建高价值可复用的通用画像能力; 2、参与策略模型和数据链路建设,沉淀数据资产,为用户体验优化、内容生态运营赋能; 3、参与构建数智化大模型解决方案,综合运用CT/SFT/RAG/Agent等技术解决实际业务问题; 4、跟踪大数据、知识图谱、大模型等领域的前沿技术进展。

更新于 2024-08-29深圳
logo of 10jqka
校招产品运营类

我们正在寻找具备深厚算法背景、对AI前沿技术充满热情,负责对话系统(如智能客服、多轮交互机器人)及AIGC(AI生成内容,如文本、图像、视频)领域的技术驱动型产品设计与策略规划,将作为技术与业务落地的桥梁,推动AI技术在真实场景中的创新应用与规模化落地。 核心职责: 1、技术驱动的产品规划:深入理解LLM(如GPT系列)、扩散模型(如Stable Diffusion)等生成式AI技术原理,结合业务场景设计创新产品形态与策略,主导从0到1的AI产品孵化。 2、算法策略落地:协同算法团队拆解技术方案,主导模型效果调优方向(如Prompt Engineering、多模态生成对齐),制定数据闭环策略,平衡技术可行性与用户体验。 设计A/B实验框架,通过指标分析(如生成内容质量、用户留存)驱动算法迭代与产品优化。 3、行业洞察与创新:跟踪AI领域技术动态(如Agent技术、多模态大模型),预判行业趋势并提出高潜产品方向,主导技术预研与原型验证。

杭州
logo of baidu
社招MEG

职位描述: 1、负责大模型训练、对齐相关工作,包括不限于数据迭代、模型训练、模型评估。 2、结合实际场景,提供全面的技术解决方案,参与PE、推理优化、数据飞轮建设,提升大模型在应用场景的效果。 3、协助开发和优化 Al Agent 的数据采集、分析及数据闭环相关工具,支持标注工具、研发工具、数据分析与可视化系统的设计与实现,提升产研团队的工作效率 4、探索并训练高表现力布局生成模型效果,探索前沿的建模方式、训练策路、数据策略,以达到SOTA效果;探索Al能力的极限,并赋能产品以创造价值。

更新于 2025-06-05北京
logo of tongyi
社招3年以上技术类-算法

1.拟人SFT数据构建与策略设计 (1)负责面向超拟人语音交互场景的SFT数据方案设计,涵盖角色人设一致性、多轮对话逻辑、情感表达等维度,构建高质量对话语料。 (2)针对多模态交互、A陪伴等需求,设计角色扮演数据的标注规范,包括身份背景、经典台词、行为模式等细粒度标签。 (3)基于业务场景(如儿童教育、情感陪伴、游戏NPC、模拟面试等)设计符合角色设定的对话逻辑,提升用户交互沉浸感。 (4)建立SFT数据评估体系,针对人设一致性、意图识别准确率、对话流畅度等指标进行量化分析与迭代。 2.SFT数据在语音交互模型中的优化 (1)结合语音交互链路(ASR→LLM→TTS),通过SFT技术优化大模型的对话能力,重点提升上下文理解、情感响应准确度及多轮对话连贯性。 (2)探索角色扮演数据在语音Agent中的应用,例如通过Prompt工程控制对话风格、情绪倾向,实现个性化交互体验。 (3)协同声纹识别、情感计算等技术,构建语音-文本-用户画像对齐的数据集,支持个性化交互(如儿童声线识别、成人情感分析)。 (4)推动SFT数据在低延迟语音交互场景的落地,优化端到端响应效率(如实时打断、长上下文记忆等能力)。

更新于 2025-12-12北京|杭州