字节跳动Code Agent训练产品经理-Seed
任职要求
1、具备5年以上的算法策略产品经理经验,能够独立负责产品方向的探索工作,发掘新的产品场景与机会,对LLM对齐及相关方法(如SFT和RLHF)有深入的理解; 2、英语能够作为工作语言; 3、对LLM和人类行为有浓厚的兴趣;充满了好奇心,愿意花费时间阅读最新的论文和技术报告; 4、具有协作精神的团队成员,擅长在关注细节的同时,专注于优先目标和大局。
工作职责
1、与技术团队合作,定位在海外市场中LLM对齐训练所需的数据; 2、开发对齐数据采集和生产的方法,确保数据质量保持在高标准,并根据定量和定性反馈不断改进流程; 3、评估数据生产工具对数据生产的有效性和质量的影响;不断提高人工和合成数据的效率和效果上限; 4、与业务团队合作,将字节跳动自研的LLM整合到新的和现有的代码产品及服务中;通过对用户行为和反馈的研究,确定自研代码产品的改进空间。
1、参与最前沿技术研发和探索,能够针对超规模集群、海量数据、高复杂业务场景,打造Agent训推系统; 2、全面负责Agent相关技术方向的架构设计与工程实现,主导核心系统的技术选型和研发工作; 2、组件并带领团队,推动Agent平台/产品的技术落地与持续优化; 3、关注前沿AI技术发展,持续进行技术创新,提升技术核心竞争力; 4、优化AI Agent的性能、监控AI Agent的开发、打造L3级模型的训练环境,确保其在各种环境和任务中表现出色
随着AI下半场的到来,传统的评测范式已经无法适配持续提升的模型能力,针对ChatBot模型的Arena评测的有效性也遭到质疑,如何面向现阶段以及未来的模型能力进行科学有效的评估本身也是个极具挑战和价值的研究方向。OpenAI研究者也表示,AI接下来比拼的不是训练,而是“如何定义并评估真正有用的任务”。 在这样的背景下,美团大模型评测团队以指引通往AGI的道路为目标,深耕模型评测研究,系统性的理解大模型当前能力水平及未来技术发展方向,并以此为基础完善模型评测能力矩阵。团队工作方向包括但不限于:①构建科学有效的评测方案,为现阶段大模型提供有效的评测和分析手段,并面向未来模型储备评测技术,包括人机协同评测、产品化隐式评测方案、全模态交互式评测方案等;②结合训练和评测,对模型的能力进行建模及深入的理解和研究,包括能力体系构建、训练阶段分析、模型能力/问题溯源等;③探索模型能力边界,发现当前模型训练范式的局限性,寻求模型能力突破。 本岗位涉及的方向包括: 1. Agent评测构建与方案探索,包括但不限于:通用模型的Agent能力评测与探索,Computer Use、Code Agent、通用搜索等产品级Agent的评测方案和分析。 2. 长周期人机协作与Agent能力边界探索,包括但不限于:Agent的异步交互、适时思考、记忆管理、自主学习等能力的评测方案及实践探索。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Codebase 部门专注于代码领域的核心工作,包括字节跳动的代码托管、代码分析的基础架构搭建,以及相关前沿技术的深度探索。随着大语言模型(LLM)技术的迅速发展,我们积极布局,开展了一系列与 Code Agent 相关的技术研究和应用孵化工作。通过这些努力,我们致力于打造更加智能、高效、安全的新一代基础设施,为公司的技术发展和业务创新提供坚实支撑。 1、参与字节跳动智能编程产品的模型优化、评测以及线上问题分析,提升产品用户体验; 2、提升代码补全、生成、理解、问题修复各个关键任务的性能以及在产品上的表现; 3、调研新技术,并推动Agent、RAG、多模态等大模型相关技术应用于编码、开发流程、效率工具与质量保障; 4、将NLP技术与静态代码分析方法结合,解决代码生成、代码理解以及安全故障检测等问题。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Codebase 部门专注于代码领域的核心工作,包括字节跳动的代码托管、代码分析的基础架构搭建,以及相关前沿技术的深度探索。随着大语言模型(LLM)技术的迅速发展,我们积极布局,开展了一系列与 Code Agent 相关的技术研究和应用孵化工作。通过这些努力,我们致力于打造更加智能、高效、安全的新一代基础设施,为公司的技术发展和业务创新提供坚实支撑。 1、参与字节跳动智能编程产品的模型优化、评测以及线上问题分析,提升产品用户体验; 2、提升代码补全、生成、理解、问题修复各个关键任务的性能以及在产品上的表现; 3、调研新技术,并推动Agent、RAG、多模态等大模型相关技术应用于编码、开发流程、效率工具与质量保障; 4、将NLP技术与静态代码分析方法结合,解决代码生成、代码理解以及安全故障检测等问题。