字节跳动【实习】基于预训练大模型的端到端生成式搜索技术研究-搜索（北京/上海/杭州）

实习兼职A1062282026-04-13地点：北京状态：招聘

扫码手机上打开

任职要求

1、2027届及以后毕业，博士在读，人工智能、计算机、自然语言处理、计算机视觉等相关专业优先；
2、在人工智能领域顶级会议上有发表论文或有深入研究经历者优先；
3、…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

团队介绍：字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、红果短剧、番茄小说、AI搜索等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。
我们使用前沿的机器学习\大模型技术进行端到端建模并不断创新突破，同时专注于分布式系统、机器学习系统的构建和性能优化，从内存、Disk等优化到索引压缩、召回、排序等算法的探索，致力于支撑字节跳动持续多元化的产品创新和高速的业务增长、基于大模型革新和重塑下一代搜索技术体系，充分给同学们提供成长自我的机会。
主要工作方向包括：
1、探索前沿的NLP技术：全面基于LLM的Query分析、相关性、个性化预估、满意度评估、生成式检索等，全链路应用LLM/VLM，每个细节都充满挑战；
2、跨模态匹配技术：进行多模态预训练，在超大规模的多模态表征、匹配、生成等多个技术方向上持续突破，打造世界领先的多模态搜索系统；
3、大规模流式机器学习技术：应用大规模机器学习，解决搜索中的推荐问题，让搜索更加个性化更加懂你；
4、千亿级数据规模的架构：从大规模离线计算，分布式系统的性能、调度优化，到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新；
5、推荐技术：基于超大规模机器学习、因果推断、大模型推理等技术手段，构建业界领先的搜索推荐系统，对搜索推荐技术进行探索和创新。

课题介绍：随着大模型技术的快速发展，AI搜索领域迎来了新的机遇和挑战。传统搜索技术在面对海量数据、多模态信息以及用户多轮复杂需求时，开始暴露出很多问题。因此需要基于大模型来构建下一代AI搜索系统，提升搜索系统的智能化水平，优化用户体验，具体目标包括：
1、探索大模型与排序算法的结合，提升个性化排序的精度和用户体验。
2、探索基于多模态预训练的端到端生成式搜索大模型
3、探索基于大模型Agent技术，提升复杂多义Query和多轮搜索下的用户满意度。

课题挑战：
1、个性化排序的挑战：传统排序算法难以充分利用多模态信息，且模型复杂度有限，无法满足用户对精准化和个性化搜索的需求；
2、超大规模检索排序的挑战：传统的基于判别式的级联排序系统，难以满足搜索千亿级别候选的检索排序效率需求；
3、搜索需求日益复杂的挑战：用户搜索需求的复杂度在不断增加，传统搜索框架难以在多轮对话下，准确理解长难、多义Query的语义，导致搜索结果满意度低。

课题价值：
1、技术价值：突破传统搜索技术瓶颈，构建大模型Agent驱动的下一代AI搜索架构，解决个性化排序、超大规模检索排序、复杂搜索需求理解满足等行业难题；
2、业务价值：大幅度提升搜索的用户体验和满意度，带动搜索场景LT和主动搜索心智的提升。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

NLP+

OpenCV+

机器学习+

深度学习+

还有更多 •••

登录查看完整学习资料

相关职位

【实习】基于LLM的软件缺陷检测技术的探索和研究-质量技术

实习A10246

团队介绍：字节跳动质量技术团队，我们聚焦质量领域前沿创新，打造稳定、高效、领先的质量技术，深度赋能抖音、今日头条、豆包、电商等亿级用户产品。当前，我们通过AI来检测代码、架构、产品的缺陷、风险和效果，用AI重构质量保障模式，提升研发效能。聚焦智能缺陷检测、GUI agent、AI评测等前沿方向，希望通过质量技术的突破，用AI改变测试行业。欢迎加入，与我们一起，定义和构建下一代质量技术，推动行业前进。课题介绍：随着大模型技术在软件开发领域的广泛应用，代码开发效率显著提升，AI生成代码的质量不确定性，都为软件测试带来了全新挑战。传统静态分析方法在复杂业务逻辑校验、功能一致性验证等场景存在明显局限，而动态GUI测试与API测试则面临执行开销高、测试覆盖度不足等问题。本课题旨在构建一种基于LLM的智能缺陷检测系统。通过对需求文档和技术方案的语义理解，结合跨端、跨仓的代码调用关系的刻画，产出业务逻辑与代码实现的精准对齐，在此基础上，构建具备对各类缺陷特征有充分感知的缺陷检测智能体，高效、精准的识别业务逻辑、架构性能、程序安全等复杂缺陷。课题挑战： 1、公司多样化业务场景下，对多模态需求的语义理解和功能逻辑提取； 2、跨端、跨仓、多技术栈的代码链路分析； 3、海量缺陷数据的特征分析和提取； 4、支持大规模应用的Agent系统工程；课题价值： 1、保证软件质量的要求下，构建一种以静态检测技术为主的软件测试模式，优化测试资源的配置和效率； 2、实现软件缺陷的早期发现，降低缺陷识别和修复的成本，显著提升研发效能。

更新于 2026-04-15上海

【实习】基于LLM的软件缺陷检测技术的探索和研究-质量技术

实习A107887

更新于 2026-04-15杭州

【实习】基于投放信号反馈的Agentic视频生成闭环与应用研究-GenAI（北京）

实习A231377

团队介绍：GenAI团队专注于开发跨模态生成式AI前沿技术（涵盖文本、图像、视频、落地页等），为广告主、代理商和创作者打造行业领先的创意提效及投放提效解决方案。我们致力于通过生成式AI技术实现创意工作流自动化，全面提升客户商业收益。团队立志引领广告科技与创意产业的生成式AI变革，为全球客户、创作者及整个生态体系赋能并创造价值。课题介绍：短视频是广告投放的核心，为大幅提升自动化生产水平，本项目计划基于Topads打造一套智能Agent闭环系统。该系统具备深度解析爆款多模态叙事与运镜节奏的能力，能自动调度In-house模型，将新商品自然融入以实现高效复刻。该系统还计划打破传统的开环生成模式，引入真实广告投放信号作为关键反馈。通过RL算法让投放数据直接反哺，持续优化Agent在视频理解、可控生成与低效内容汰换全链路上的决策策略，最终实现高ROI营销视频的规模化生产。课题挑战： 1、长视频生成中需保持极低错误率与高一致性； 2、需克服投放信号噪声、延迟与长周期特性以优化Agent。课题价值： 1、打通基于真实投放信号反馈的Agentic理解、生成、汰换闭环； 2、极大提升视频生成自动化程度和质量，实现爆款视频规模化复刻与高ROI转化。

更新于 2026-04-15北京

【实习】基于多模态大模型的智能审核关键技术研究-国际化商业安全（北京/上海）

实习A52251A

团队介绍：国际化商业安全团队致力于在国际化用户、企业和产品之间建立安全可靠的连接。我们通过一系列完善的系统和能力，审核广告内容、预测政策违规行为，并执行广告审核通过或拒绝的措施。作为国际商业化团队的业务合作伙伴，我们提供的业务诚信解决方案不仅确保国际化业务始终是一个安全、积极、友好的用户环境，同时也推动业务增长。课题介绍：随着数字内容的爆炸式增长，智能审核已成为互联网平台重要的技术能力，但面对日益复杂的审核场景和不断演进的对抗手段，传统审核技术正面临前所未有的挑战。当前智能审核领域存在规则动态性、内容复杂性、样本稀缺性、对抗升级和解释性缺失等诸多技术难题，特别是在涉及审核规则变更、长文本、长时序、多语言、少样本和AIGC生成对抗等问题时，现有的开源大模型表现仍有提升空间。课题挑战：重点突破多模态推理、Context Engineering、理解与生成统一等核心技术，实现智能决策、自主规划、工具调用和智能修复等能力。课题价值：打造领先审核系统，实现高质量的是否拒绝、为何拒绝、智能修复全流程能力，实现全机审，效果超人工。

更新于 2026-04-17北京