深度求索Agent 数据策略工程师

实习兼职全职2026-05-22地点：杭州 | 北京状态：招聘

扫码手机上打开

任职要求

1.具备 Claude Code、Cursor、OpenClaw 等 AI 编程工具的重度使用经验，对 LLM 辅助开发有自己的理解与思考；
2.熟练掌握 Python，能够独立编写数据处理、评测脚本等工具；
3.对大语言模型有基础认知且对探索大模型能力边界具有较高的热情；
4.具备良好的自主能动性，…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.整体目标：提升模型在 Agent 方向的专业能力。围绕代码生成、通用agent等场景，设计高质量的 Agent 训练语料；构建端到端的测试用例，从可用性、代码规范、工程质量、任务完成度等多维度评估模型表现；
2.设计并构造高质量的 Agent 评测数据集，能够精准区分不同模型的能力边界；针对 Agent 的规划、工具调用、多轮交互、指令跟随等核心能力，构建多样化的测试场景与用例；持续迭代评测标准，确保评测体系能够跟进业界前沿并反映真实用户需求；
3.探索不同数据标注策略对模型 Agent 能力的影响路径；参与数据与强化学习（RL）结合过程中的实验设计，研究模型能力的可控性检测方法，为训练策略优化提供数据侧支撑；
4.基于深度使用 Claude Code、OpenClaw 等主流 Agent 产品的实践经验，系统性分析当前模型的能力短板与失败模式；针对性地构建补齐数据与边界测试用例，推动模型在弱项上的持续迭代与突破。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

大模型+

Python+

脚本+

还有更多 •••

登录查看完整学习资料

相关职位

数据策略高级工程师/专家-智能服务

社招3年以上A113004

1、参与部门画像体系建设，构建高价值可复用的通用画像能力； 2、参与策略模型和数据链路建设，沉淀数据资产，为用户体验优化、内容生态运营赋能； 3、参与构建数智化大模型解决方案，综合运用CT/SFT/RAG/Agent等技术解决实际业务问题； 4、跟踪大数据、知识图谱、大模型等领域的前沿技术进展。

更新于 2024-08-29深圳

算法策略工程师

校招产品运营类

我们正在寻找具备深厚算法背景、对AI前沿技术充满热情，负责对话系统（如智能客服、多轮交互机器人）及AIGC（AI生成内容，如文本、图像、视频）领域的技术驱动型产品设计与策略规划，将作为技术与业务落地的桥梁，推动AI技术在真实场景中的创新应用与规模化落地。核心职责： 1、技术驱动的产品规划：深入理解LLM（如GPT系列）、扩散模型（如Stable Diffusion）等生成式AI技术原理，结合业务场景设计创新产品形态与策略，主导从0到1的AI产品孵化。 2、算法策略落地：协同算法团队拆解技术方案，主导模型效果调优方向（如Prompt Engineering、多模态生成对齐），制定数据闭环策略，平衡技术可行性与用户体验。设计A/B实验框架，通过指标分析（如生成内容质量、用户留存）驱动算法迭代与产品优化。 3、行业洞察与创新：跟踪AI领域技术动态（如Agent技术、多模态大模型），预判行业趋势并提出高潜产品方向，主导技术预研与原型验证。

杭州

大模型AIGC算法工程师（J85548）

社招MEG

职位描述： 1、负责大模型训练、对齐相关工作，包括不限于数据迭代、模型训练、模型评估。 2、结合实际场景，提供全面的技术解决方案，参与PE、推理优化、数据飞轮建设，提升大模型在应用场景的效果。 3、协助开发和优化 Al Agent 的数据采集、分析及数据闭环相关工具，支持标注工具、研发工具、数据分析与可视化系统的设计与实现，提升产研团队的工作效率 4、探索并训练高表现力布局生成模型效果，探索前沿的建模方式、训练策路、数据策略，以达到SOTA效果；探索Al能力的极限，并赋能产品以创造价值。

更新于 2025-06-05北京

通义实验室-大模型SFT数据专家/高级算法工程师-超拟人语音交互与角色扮演方向

社招3年以上技术类-算法

1.拟人SFT数据构建与策略设计（1）负责面向超拟人语音交互场景的SFT数据方案设计，涵盖角色人设一致性、多轮对话逻辑、情感表达等维度，构建高质量对话语料。（2）针对多模态交互、A陪伴等需求，设计角色扮演数据的标注规范，包括身份背景、经典台词、行为模式等细粒度标签。（3）基于业务场景（如儿童教育、情感陪伴、游戏NPC、模拟面试等）设计符合角色设定的对话逻辑，提升用户交互沉浸感。（4）建立SFT数据评估体系，针对人设一致性、意图识别准确率、对话流畅度等指标进行量化分析与迭代。 2.SFT数据在语音交互模型中的优化（1）结合语音交互链路（ASR→LLM→TTS），通过SFT技术优化大模型的对话能力，重点提升上下文理解、情感响应准确度及多轮对话连贯性。（2）探索角色扮演数据在语音Agent中的应用，例如通过Prompt工程控制对话风格、情绪倾向，实现个性化交互体验。（3）协同声纹识别、情感计算等技术，构建语音-文本-用户画像对齐的数据集，支持个性化交互（如儿童声线识别、成人情感分析）。（4）推动SFT数据在低延迟语音交互场景的落地，优化端到端响应效率（如实时打断、长上下文记忆等能力）。

更新于 2025-12-12北京|杭州