logo of bytedance

字节跳动质量智能大模型算法工程师-质量技术-筋斗云人才计划

校招全职A84490地点:杭州状态:招聘

任职要求


1、获得博士学位,人工智能、计算机、数学相关专业优先;
2、优秀的代码能力、数据结构和基础算法功底,熟练Python(CV/NLP领域);
3、CV/NLP领域有扎实的理论基础,在ICCV/TPAMI/ACL/SIGIR等顶刊顶会上发表论文者优先;
4、出色的问题分析及拆解能力,具有自主探索解决方案 & 解决问题能力;
5、良好的沟通联动能力,与团队持续探索&学习新技术,实现先进技术的不断落地;
6、面对困难有较好的韧劲及攻克问题的信心及勇气,敢于拥抱变化并快速做出应对。

工作职责


团队介绍:字节跳动质量技术团队,聚焦质量领域,提供一系列的稳定的、有效的、技术领先的质量产品和工具,支撑电商、抖音、头条、飞书等业务。当前,我们在积极的探索质量基建与大模型的结合,构建更高效、更智能的质量技术,非常期望有更多的人才加入,在质量内建、测试效能、自动化测试等领域取得前沿的技术突破。

课题介绍:
课题背景:随着大模型技术能力的不断发展,质量测试领域也迎来了新的机遇与挑战。传统测试基本采用手工+部分CR+编写部分核心自动化/单测用例的测试方法,主要受限于自动化/单测用例的生成维护成本、以及人员CR/测试水平的参差,在频繁变化的业务场景下很难实现高质量、全面提效的正向收益,想要全面提质提效,需要彻底改变原有测试技术框架。结合近2年大模型技术的快速发展,特别是近期发布的行业重量级LLM/VLM模型,使测试任务的自动生成、自动执行、效果及代码问题诊断成为可能,同时行业内陆续涌现多款智能化测试的商业产品,这一领域性探索有望彻底改变测试方式形态,实现全智能的AI质量保障新业态。
 
课题挑战:
1、智能生成:主要包括基于代码&需求文档,自动生成单元测试、功能测试用例,存在对代码、需求文档的理解、泛化推理能力弱,生成内容准确率低;
2、智能执行:主要包括自主智能遍历、测试任务智能执行,主要挑战在测试意图理解的操作路径探索、GUI理解的操作对象定位的高准确性;
3、智能检测:主要包括代码异常、功能效果异常检测,重点在基于上下游UI的异常检测、目标代码片段定位及结合调用链路及业务逻辑的缺陷挖掘的高准召。
包括英文材料
学历+
数据结构+
算法+
Python+
NLP+
ICCV+
相关职位

logo of bytedance
校招A182279

团队介绍:字节跳动质量技术团队,聚焦质量领域,提供一系列的稳定的、有效的、技术领先的质量产品和工具,支撑电商、抖音、头条、飞书等业务。当前,我们在积极的探索质量基建与大模型的结合,构建更高效、更智能的质量技术,非常期望有更多的人才加入,在质量内建、测试效能、自动化测试等领域取得前沿的技术突破。 课题介绍: 课题背景:随着大模型技术能力的不断发展,质量测试领域也迎来了新的机遇与挑战。传统测试基本采用手工+部分CR+编写部分核心自动化/单测用例的测试方法,主要受限于自动化/单测用例的生成维护成本、以及人员CR/测试水平的参差,在频繁变化的业务场景下很难实现高质量、全面提效的正向收益,想要全面提质提效,需要彻底改变原有测试技术框架。结合近2年大模型技术的快速发展,特别是近期发布的行业重量级LLM/VLM模型,使测试任务的自动生成、自动执行、效果及代码问题诊断成为可能,同时行业内陆续涌现多款智能化测试的商业产品,这一领域性探索有望彻底改变测试方式形态,实现全智能的AI质量保障新业态。 课题挑战: 1、智能生成:主要包括基于代码&需求文档,自动生成单元测试、功能测试用例,存在对代码、需求文档的理解、泛化推理能力弱,生成内容准确率低; 2、智能执行:主要包括自主智能遍历、测试任务智能执行,主要挑战在测试意图理解的操作路径探索、GUI理解的操作对象定位的高准确性; 3、智能检测:主要包括代码异常、功能效果异常检测,重点在基于上下游UI的异常检测、目标代码片段定位及结合调用链路及业务逻辑的缺陷挖掘的高准召。

更新于 2025-05-26
logo of bytedance
校招A258180

团队介绍:字节跳动质量技术团队,聚焦质量领域,提供一系列的稳定的、有效的、技术领先的质量产品和工具,支撑电商、抖音、头条、飞书等业务。当前,我们在积极的探索质量基建与大模型的结合,构建更高效、更智能的质量技术,非常期望有更多的人才加入,在质量内建、测试效能、自动化测试等领域取得前沿的技术突破。 课题介绍: 课题背景:随着大模型技术能力的不断发展,质量测试领域也迎来了新的机遇与挑战。传统测试基本采用手工+部分CR+编写部分核心自动化/单测用例的测试方法,主要受限于自动化/单测用例的生成维护成本、以及人员CR/测试水平的参差,在频繁变化的业务场景下很难实现高质量、全面提效的正向收益,想要全面提质提效,需要彻底改变原有测试技术框架。结合近2年大模型技术的快速发展,特别是近期发布的行业重量级LLM/VLM模型,使测试任务的自动生成、自动执行、效果及代码问题诊断成为可能,同时行业内陆续涌现多款智能化测试的商业产品,这一领域性探索有望彻底改变测试方式形态,实现全智能的AI质量保障新业态。 课题挑战: 1、智能生成:主要包括基于代码&需求文档,自动生成单元测试、功能测试用例,存在对代码、需求文档的理解、泛化推理能力弱,生成内容准确率低; 2、智能执行:主要包括自主智能遍历、测试任务智能执行,主要挑战在测试意图理解的操作路径探索、GUI理解的操作对象定位的高准确性; 3、智能检测:主要包括代码异常、功能效果异常检测,重点在基于上下游UI的异常检测、目标代码片段定位及结合调用链路及业务逻辑的缺陷挖掘的高准召。

更新于 2025-05-26
logo of bytedance
校招A198776A

团队介绍:字节跳动质量技术团队,聚焦质量领域,提供一系列的稳定的、有效的、技术领先的质量产品和工具,支撑电商、抖音、头条、飞书等业务。当前,我们在积极的探索质量基建与大模型的结合,构建更高效、更智能的质量技术,非常期望有更多的人才加入,在质量内建、测试效能、自动化测试等领域取得前沿的技术突破。 课题介绍: 课题背景:随着大模型技术能力的不断发展,质量测试领域也迎来了新的机遇与挑战。传统测试基本采用手工+部分CR+编写部分核心自动化/单测用例的测试方法,主要受限于自动化/单测用例的生成维护成本、以及人员CR/测试水平的参差,在频繁变化的业务场景下很难实现高质量、全面提效的正向收益,想要全面提质提效,需要彻底改变原有测试技术框架。结合近2年大模型技术的快速发展,特别是近期发布的行业重量级LLM/VLM模型,使测试任务的自动生成、自动执行、效果及代码问题诊断成为可能,同时行业内陆续涌现多款智能化测试的商业产品,这一领域性探索有望彻底改变测试方式形态,实现全智能的AI质量保障新业态。 课题挑战: 1、智能生成:主要包括基于代码&需求文档,自动生成单元测试、功能测试用例,存在对代码、需求文档的理解、泛化推理能力弱,生成内容准确率低; 2、智能执行:主要包括自主智能遍历、测试任务智能执行,主要挑战在测试意图理解的操作路径探索、GUI理解的操作对象定位的高准确性; 3、智能检测:主要包括代码异常、功能效果异常检测,重点在基于上下游UI的异常检测、目标代码片段定位及结合调用链路及业务逻辑的缺陷挖掘的高准召。

更新于 2025-05-26
logo of bytedance
校招A170950

团队介绍:广告业务原为商业产品与技术部门,为抖音集团的商业变现提供广告产品与技术,负责端到端大型广告系统建设,覆盖抖音、今日头条、西瓜视频、番茄小说、穿山甲等产品矩阵,践行“激发生意新可能”理念,致力于让营销更省心、更高效、更美好,推动商业的可持续增长,让不分体量、地域的企业及个体,都能通过数字化技术激发创造、驱动生意。连接广告主、用户及生态伙伴、成为开放共赢的全球最佳智能营销平台之一。在这里,你将投身建设面向未来的数字营销能力,接触到全球先进的商业产品架构、模型和算法,在互联网广告行业始终创新。 课题背景 在广告营销领域,智能客服系统正成为优化售前用户沟通的关键工具,商家亟需高效工具来减少人工依赖、提升转化效率。背景核心在于:广告营销的售前场景涉及复杂用户交互(如产品咨询、促销引导和留资获取),当前基于 LLM 的智能客服 Agent 系统采用 “规划 + 生成” 的架构,需完成从用户进线、诉求澄清到方案执行的全流程服务。然而,随着广告市场的动态变化和个性化需求增长,传统方法面临响应相关性不足、转化率瓶颈等问题。团队正聚焦于利用 LLM 后训练技术(如微调和强化学习),结合 RAG、CoT 蒸馏等手段,构建一套高适配性的 Agent 系统,以实现智能化用户沟通 —— 帮助商家自动促成订单或获取高质量线索,最终提升广告营销的 ROI 和用户体验。这一方向不仅是业务增长的核心驱动力,也是推动大模型在广告领域落地的关键创新。 课题挑战 本课题面临多重技术与业务挑战,需要人才在 LLM-Agent 架构下突破瓶颈,确保智能客服在广告营销场景中的高可靠性、高效性和合规性。具体挑战包括: 1)对话流程控制:售前咨询需通过多轮交互引导用户留资或促成订单,亟需优化 Agent 的决策能力。这要求强化planning的识别能力和action选择的准确性,需要引入 SOP 构建、CoT蒸馏、react与反思机制等,实现上下文一致性与业务目标达成。另外也需要构建合理的reward指标,应用DPO/RL等手段进一步提升模型决策能力; 2)回复质量与幻觉:售前咨询的回复模型需要在少量标注数据下产出高质量的训练数据,应用大模型微调SFT、CoT蒸馏提升在各个行业上的话术质量和回复满意度。应用RAG、知识图谱等能力构建高质量知识库,在线时通过精确知识点匹配解决冷启动与幻觉问题,提升用户体验; 3)个性化问题:目前传统智能客服对于不同用户的接待基本都是相同的,售前客服需要考虑不同用户的兴趣点,通过引入用户特征、构建长期memory等手段,为用户构建定制化的接待方案,提高用户满意度并促成留资或者订单等业务指标提升; 4)实时性能瓶颈:系统需处理高并发请求,但大模型的推理延迟和资源消耗可能影响用户体验。这要求研究模型压缩、量化技术、推理模型的cot加速等方向以优化部署效率。 研究方向:大语言模型。

更新于 2025-06-13