字节跳动代码质量大模型算法实习生-质量技术
任职要求
1、2027届硕士及以上学位在读,计算机、软件工程、人工智能等相关专业; 2、熟悉NLP、CV、ML等相关的技术,深入理解大模型相关技术栈(如Reward Model、GRPO/PPO/DPO、SFT/RFT、CT、P…
工作职责
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动质量技术团队,我们聚焦质量领域前沿创新,打造稳定、高效、领先的质量技术,深度赋能抖音、今日头条、豆包、电商等亿级用户产品。 当前,我们通过AI来检测代码、架构、产品的缺陷、风险和效果,用AI重构质量保障模式,提升研发效能。聚焦智能缺陷检测、GUI agent、AI评测等前沿方向,希望通过质量技术的突破,用AI改变测试行业。欢迎加入,与我们一起,定义和构建下一代质量技术,推动行业前进。 1、负责大模型技术在软件智能交付领域的相关应用技术研发,业务场景包括但不限于知识图谱、代码生成、智能交互、风险预测挖掘、智能归因、缺陷修复、故障自愈; 2、洞察AIGC等前沿技术领域的最新研究成果,探索工业领域落地可行性,并持续提升算法应用效果; 3、探索大模型技术在研发效能领域中的落地应用,为研发效率提升提供智能服务; 4、深度参与项目研发,与产品和业务团队同学保持密切配合,不断优化项目整体效益,提升用户体验。
参与前沿大模型算法的研发与落地应用,方向包括但不限于:智能 Agent、Deep Research、多模态大模型、检索增强生成 (RAG) 等; 紧跟领域最新技术动态,探索创新算法方法,并积极推动科研成果的产出; 参与技术方案讨论、算法设计与实现、模型训练与优化等研发工作,保证项目进度和研发质量; 持续学习和掌握最新的大模型相关技术,并应用于实际产品和项目中,解决实际问题。
传统审核大模型通常采用SFT的方式逼近人审对审核规则的识别精度,此时人工执行质量和规则合理性则成为机审体系性能上限。 本课题通过RLVR和Multi-Agent的方式,构造机审判别Agent与规则生成Agent的博弈学习,以对抗上升的方式不断提升审核规则的完备性以及相应机审识别的准召,使得机审可以突破人工上限,实现大模型智能在审核象限的涌现和“Aha moment”。
大模型如 GPT 系列等,凭借其强大的语言理解和生成能力,为编程带来了新的变革。在大模型编程的实际应用里,涌现出诸多极具价值的落地场景,像代码问题的精准发现与高质量修复、代码的智能补全与生成等,这些场景切实提高了编程工作的效率与质量。 当前也普遍面临一系列亟待解决的问题与挑战: 1、怎样精准识别代码中潜藏的高质量问题,并迅速且有效地完成修复; 2、如何借助 RAG 技术等手段,精准召回相似的代码问题; 3、怎样构建更完善的评测体系,对整个编程系统以及各个应用场景进行全面且高质量的评估。 这些问题在行业内具有广泛的共性,极具研究价值。通过合作研究探寻解决方案,有望推动大模型编程领域迈向新的高度。
-基础算法方向 1. 围绕商业化广告,应用NLP/CV/多模态算法能力进行内容理解,完成相关技术问题解决; 2. 负责NLP/CV/多模态相关算法研发,面向但不限于:query理解、类目体系、属性体系、多模态检索、图像标签、大模型等等(以上方向擅长一个即可),时刻follow与探索前沿技术; -创意生成方向 1. 结合业界先进的 AIGC生成式技术,对广告素材和创意进行生产和优化,熟悉文本基础大模型、GPT/T5等常见用于生成的模型框架,在生成算法上结合业务场景不断进行技术创新,提高广告素材(标题、图片等)的多样性及质量; 2. 结合线上广告素材的业务指标对算法模型进行定向的模型迭代,线上链路完善,实现面向广告投放效果及收入增长目标的闭环优化;