字节跳动语音大模型数据运营专家(NLP方向)-DMC
任职要求
1、本科及以上学历,3年以上互联网产品或运营经验,计算机、计算语言学相关专业优先; 2、具备出色的PE能力,能够独立设计Prompt策略形成工作流,提高数据生产的质量和效率; 3、具备…
工作职责
1、搭建具有通用性和可拓展性的NLP标注框架,与算法团队对齐标准、撰写相关培训方案,根据模型迭代方向提供高质量数据; 2、负责大语言模型训练过程中各阶段数据生产,对自动化链路搭建、数据质量评估及外部资源管理负责,确保大语言模型训练数据有效; 3、能通过PE、代码完成数据预处理、分析和清洗,按照训练需求进行标注、分析和验证调优,提升模型效果; 4、与产品算法团队协同,积极探索自动化数据生产、数据合成等方法,提高数据标注效率,持续跟踪大模型技术进展,持续探索智能高效的数据生产模式。

1、搭建具有通用性和可拓展性的语音大模型数据标注和模型评测框架(NLP、TTS、ASR等方向),与算法团队对齐标准、撰写相关培训方案,根据模型迭代方向提供高质量数据,对自动化链路搭建、数据质量评估及外部资源管理负责; 2、结合行业趋势及业务应用场景,迭代更新评测标准、构建评测题库,负责语音大模型效果评测,定期反馈评估结果,产出评估报告,确保大模型评估结果置信; 3、通过PE、代码、Workflow、Agent完成数据预处理、分析和清洗,按照训练需求进行标注、分析和验证调优,提升模型效果; 4、与产品算法团队协同,积极探索自动化数据生产/模型评估、数据合成等方法,提高数据标注/评测效率,持续跟踪大模型技术进展,持续探索智能高效的数据生产模式。
字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、与不同职能协作,为音乐技术开发提供完整数据方案与策略,并为整体数据质量负责; 2、负责音乐技术的模型效果评估体系设计并产出结论,根据结论进行系统分析,提出有价值可落地的改进方案,协算法提升模型效果; 3、合理评估和处理数据获取方案及质量; 4、协调数据处理资源,对数据生产的成本、质量、效率等进行整体把控。
团队介绍: 我们团队为用户提供满足各种出行场景的好路线,提供极致的出行体验,同时服务C端、B端,涵盖自驾、打车、物流等多种业务场景,我们的每一次技术升级或业务的改进都能影响全国用户,有非常复杂的高并发分布式服务系统架构,有业界最先进的路线规划算法(cbr,cch,rch,raptor等)。如果你想发挥你的想象力创造更多社会价值,如果你享受克服困难和挑战自我的喜悦,如果你热爱技术并喜欢追求极致性能和效果,如果你渴望挖掘出源源不断的新应用场景,那就加入我们团队吧! 岗位职责: 你将加入高德在线导航服务团队,从0到1参与打造手车一体的「出行域 Agent」。目标体验对标特斯拉车机中的 Grok:让用户可以用自然语言完成从出行规划、实时导航到行程中各类决策的全流程交互,实现“能听懂、会思考、帮决策、可执行”的智能出行助手。 工作职责: 1.子Agent架构设计与服务实现 a)参与设计出行域子Agent的整体技术架构,包括调用链路、状态管理、容错与降级方案。 b)实现与高德主Agent的协议对接和能力编排,支持多轮对话、工具调用、跨场景任务协同。 c)在手机端与车机端统一能力出口下,处理不同终端、不同地区/国家的差异化需求(如地图/POI/法规差异)。 大模型微调与蒸馏落地 2.针对出行/导航/车机场景,设计与构建高质量训练数据(提示词工程、对话数据、工具调用日志等)。 a)参与或主导对基础大模型的大规模微调(Supervised Fine-tuning / Preference Optimization 等),提升在出行域的理解和决策能力。 b)负责模型压缩、蒸馏与推理优化,使模型在服务端/边缘侧兼顾效果与时延。 3.Agent能力调优与决策优化 a)设计和优化子Agent的工具使用策略(Tool / Function Calling),包括路况查询、路线规划、POI 检索、多目的地规划、国际场景信息调用等。 b)在弱网、高并发、复杂上下文下优化Agent的鲁棒性和决策稳定性。 c)针对复杂出行任务(如跨城自驾、多目的地行程、充电/加油规划、实时绕行、国际出行规则差异)进行专项调优。 4.效果评测与质量体系构建 a)搭建出行Agent的自动化评测框架,包括:指令理解准确率、工具调用正确率、任务成功率、响应时延、用户反馈闭环等。 b)构建离线评测集和真实流量回放机制,持续追踪模型与系统升级带来的收益和风险。 c)联合产品与运营,通过灰度发布、A/B 实验驱动持续优化。 5.性能与稳定性保障 a)在9亿+月活与车机大规模接入背景下,对服务进行高可用、高性能设计(限流、降级、缓存、异步架构、观测性体系)。 b)处理线上复杂问题(流量波动、模型异常、工具依赖故障等),建立监控、告警和自愈机制。 6.前沿技术探索与工程化落地 a)跟踪 LLM、Agent、RAG、多Agent协作、规划与推理(Planning & Reasoning)、多模态等方向的最新进展,并筛选适合出行场景的技术方案。 b)探索将地图/导航结构化数据与大模型结合的最佳实践,让Agent真正“看得懂地图、懂路况”。

团队介绍: 我们团队为用户提供满足各种出行场景的好路线,提供极致的出行体验,同时服务C端、B端,涵盖自驾、打车、物流等多种业务场景,我们的每一次技术升级或业务的改进都能影响全国用户,有非常复杂的高并发分布式服务系统架构,有业界最先进的路线规划算法(cbr,cch,rch,raptor等)。如果你想发挥你的想象力创造更多社会价值,如果你享受克服困难和挑战自我的喜悦,如果你热爱技术并喜欢追求极致性能和效果,如果你渴望挖掘出源源不断的新应用场景,那就加入我们团队吧! 岗位职责: 你将加入高德在线导航服务团队,从0到1参与打造手车一体的「出行域 Agent」。目标体验对标特斯拉车机中的 Grok:让用户可以用自然语言完成从出行规划、实时导航到行程中各类决策的全流程交互,实现“能听懂、会思考、帮决策、可执行”的智能出行助手。 工作职责: 1.子Agent架构设计与服务实现 a)参与设计出行域子Agent的整体技术架构,包括调用链路、状态管理、容错与降级方案。 b)实现与高德主Agent的协议对接和能力编排,支持多轮对话、工具调用、跨场景任务协同。 c)在手机端与车机端统一能力出口下,处理不同终端、不同地区/国家的差异化需求(如地图/POI/法规差异)。 大模型微调与蒸馏落地 2.针对出行/导航/车机场景,设计与构建高质量训练数据(提示词工程、对话数据、工具调用日志等)。 a)参与或主导对基础大模型的大规模微调(Supervised Fine-tuning / Preference Optimization 等),提升在出行域的理解和决策能力。 b)负责模型压缩、蒸馏与推理优化,使模型在服务端/边缘侧兼顾效果与时延。 3.Agent能力调优与决策优化 a)设计和优化子Agent的工具使用策略(Tool / Function Calling),包括路况查询、路线规划、POI 检索、多目的地规划、国际场景信息调用等。 b)在弱网、高并发、复杂上下文下优化Agent的鲁棒性和决策稳定性。 c)针对复杂出行任务(如跨城自驾、多目的地行程、充电/加油规划、实时绕行、国际出行规则差异)进行专项调优。 4.效果评测与质量体系构建 a)搭建出行Agent的自动化评测框架,包括:指令理解准确率、工具调用正确率、任务成功率、响应时延、用户反馈闭环等。 b)构建离线评测集和真实流量回放机制,持续追踪模型与系统升级带来的收益和风险。 c)联合产品与运营,通过灰度发布、A/B 实验驱动持续优化。 5.性能与稳定性保障 a)在9亿+月活与车机大规模接入背景下,对服务进行高可用、高性能设计(限流、降级、缓存、异步架构、观测性体系)。 b)处理线上复杂问题(流量波动、模型异常、工具依赖故障等),建立监控、告警和自愈机制。 6.前沿技术探索与工程化落地 a)跟踪 LLM、Agent、RAG、多Agent协作、规划与推理(Planning & Reasoning)、多模态等方向的最新进展,并筛选适合出行场景的技术方案。 b)探索将地图/导航结构化数据与大模型结合的最佳实践,让Agent真正“看得懂地图、懂路况”。