logo of bytedance

字节跳动多模态算法实习生-番茄

实习兼职A203097地点:北京状态:招聘

任职要求


1、2026届本科及以上学历在读,计算机、软件工程等相关专业优先;
2、具有扎实的机器学习基础和数理功底,NLP/CV/推荐等相关背景优先;
3、熟练使用Python/C++编程,有优秀的编码能力,ACM/NOI/IOI/TopCode获…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。
团队介绍:Data-番茄团队,负责字节跳动下番茄小说、红果短剧、番茄畅听等产品的推荐算法和AI相关工作。工作包括:搭建业界前沿的大规模推荐系统,提高产品使用体验,从小说、短剧、音频、音乐等内容方向建设完整的内容生态和AI能力,保持业务规模保持超高速增长。

1、通过对业界前沿内容理解技术的研究和改进,如多模态、LLM等,解决业务中的实际问题;
2、深度参与内容理解模型的开发,包括且不限于多模态分类、跨模态生成、语义标签、相关性、视频分析、深度聚类、数据挖掘等;
3、深度学习前沿技术的探索和研究,推动前沿技术对产品的改进。
包括英文材料
学历+
机器学习+
NLP+
Python+
还有更多 •••
相关职位

logo of bytedance
实习A164638

团队介绍:Data-番茄团队,负责字节跳动下番茄小说、红果短剧、番茄畅听等产品的推荐算法和AI相关工作。工作包括:搭建业界前沿的大规模推荐系统,提高产品使用体验,从小说、短剧、音频、音乐等内容方向建设完整的内容生态和AI能力,保持业务规模保持超高速增长。 课题介绍: 【课题背景】 番茄系产品作为全网最大的故事消费和创作平台,汇集了丰富的内容IP,涵盖网文、短剧、有声、漫画、动态漫等多种体裁,是大语言模型和多模态大模型天然的最佳实践场景。我们在内容创作、内容生产、内容推荐、IP改编等产品全链路上深度建设行业领先的各类AI能力,实现从供给到分发的全面能力升级,为数亿活跃用户和各类内容创作者带来全新的产品体验。 【研究方向】 1、利用小说和短剧的长文本和多模态优势,结合大模型理解和COT推理能力大幅度改进现有推荐系统,实现基于LLM+COT的下一代认知推理推荐引擎; 2、跨模态内容生成,探索如何将现有的IP内容在不同体裁之间进行转换和生成,实现小说、动漫、短剧等内容的AI生成和辅助创作; 3、番茄系IP价值挖掘与优化,深入挖掘IP的潜在价值,如改编、剧本创作等,优化其使用策略以及生产流程,以最大化其商业价值。

更新于 2025-03-05上海
logo of bytedance
实习A96776

团队介绍:广告业务原为商业产品与技术部门,为抖音集团的商业变现提供广告产品与技术,负责端到端大型广告系统建设,覆盖抖音、今日头条、西瓜视频、番茄小说、穿山甲等产品矩阵,践行"激发生意新可能"理念,致力于让营销更省心、更高效、更美好,推动商业的可持续增长,让不分体量、地域的企业及个体,都能通过数字化技术激发创造、驱动生意。连接广告主、用户及生态伙伴、成为开放共赢的全球最佳智能营销平台之一。在这里,你将投身建设面向未来的数字营销能力,接触到全球先进的商业产品架构、模型和算法,在互联网广告行业始终创新。 课题介绍: 1、核心技术架构: 1)下一代广告技术栈: 模型算法层:搭建基于强化学习的智能出价与流量预估系统,攻克深层转化场景下的数据稀疏、多源异构数据融合(延迟数据/埋点噪声/跨平台行为)等行业难题; 系统工程层:构建支持基于长序列特征的实时预估框架,研发支持动态创意组合的自动化投放引擎; AIGC融合层:建立文/图/视频多模态生成技术中台,实现从IP素材生成到智能投放的全链路闭环; 2)行业首创的AIGC解决方案: 正在搭建全球领先的"小说→漫剧"智能生产线,攻克三大技术堡垒: 多模态叙事引擎:研发支持角色一致性保持(Character-aware Diffusion)、分镜自动生成(Storyboard LLM)、动态运镜控制(Camera ControlNet)的复合型生成框架; 工业化工作流:构建支持分布式渲染、多版本AB测试、合规性审核的智能生产管线,实现日均千级素材产能; 投放增效系统:开发生成质量量化评估模型(QAGAN),建立素材生成-投放效果的反哺优化机制; 2、岗位挑战: 你将主导: 构建支持沿模型的混合推理框架,优化多卡并行下的生成效率; 设计跨模态对齐算法,提升文字指令到视觉元素的可控生成精度; 研发基于用户行为分析的智能素材变异系统,实现CTR提升30%+的个性化内容生成; 打造从内容生产到实时竞价的全自动化广告引擎; 3、我们期待这样的开拓者: 精通Diffusion Models技术栈,具有LoRA/ControlNet/T2I-Adapter等微调框架的实战调优经验; 熟悉多模态大模型(如VideoPoet、Sora等视频生成技术原理),具备跨模态表征学习研究背景; 拥有广告算法背景者优先,熟悉CVR预估、智能出价等核心模块与生成式AI的结合点; 出色的工程化能力,主导过至少一个完整AIGC项目的端到端落地(从模型训练到服务部署)。

更新于 2025-05-26北京
logo of bytedance
实习A36006

团队介绍:我们是支持抖音集团广告业务算法技术中台团队Ads Core,致力于研发全球领先的在线广告优化算法,营造健康、互惠的广告生态,持续提升用户和客户体验,引领并推动行业算法的变革与创新。我们承担了抖音集团产品广告变现业务的基础算法策略和机制的改进与研究,涵盖抖音、今日头条、番茄小说等场景的商业化技术的支撑。 课题介绍: 广告推荐算法是互联网商业变现的核心驱动力,我们希望借鉴生成式AI的成功思路,探索在广告推荐算法和架构上的颠覆性创新,解锁更大的算法效果提升空间。重点探索以下方向: 1)基于类Transformer结构的生成式推荐大模型技术,验证广告推荐场景的Scaling Law,探索面向大模型的特征工程以及算法建模范式; 2)算法和工程协同设计与优化,提升海量数据、超大参数背景下的训练与推理效率; 3)语言/多模态模型和推荐模型的结合; 1、负责商业化场景推荐大模型的算法优化,引入生成式AI技术,优化算法建模方法、模型结构、特征和样本等,提升广告变现效率; 2、验证推荐大模型的Scaling Law,应对大模型训练中的一切新挑战; 3、算法和工程高度融合、协同设计,极致优化推荐大模型的训练及推理效率。

更新于 2025-05-14北京
logo of bytedance
实习A219409A

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。 主要工作方向包括: 1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新; 5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。 1、参与搜索引擎(策略、模型)研发工作,支持抖音/今日头条/电商/番茄小说/红果短剧等具有数亿用户的产品,致力于为数亿用户提供数千亿精准搜索结果,打造极致的搜索体验; 2、探索前沿技术,探索大模型等创新技术在AI搜索场景的落地,参与搜索引擎、搜索大模型的改进,包括而不限于: 1)NLP、大模型:构建大规模高质量数据(数据建设、数据抓取与解析、数据合成等)、分词、NER,文本、多模态预训练、Query分析、基础相关性等,全链路结合应用机器学习/深度学习模型,探索搜索引擎与大模型、LLM、MLLM、多模态、机器学习、强化学习等前沿技术的结合,实现搜索引擎全链路革新并进行极致的系统优化,探索提升AI搜索引擎的能力,包含而不限于相关性、权威性、时效性、意图理解能力等;探索新的自然语言处理算法、信息检索技术、LLM适性索引、LLM相关性、生成式召回、排序大模型等,提高搜索引擎的准确性和智能化程度; 2)召回与排序:借助语义理解、个性化预估、机制设计等技术,解决超大规模的视频、商品、直播、POI等搜索业务下的召回、排序、重混排模型; 3)多模态、跨模态匹配技术:基于海量网页图文、抖音视频数据的大规模多模态预训练和视频分析技术,提升视觉搜索的使用体验;在搜索中结合CV+NLP深度学习技术,实现多模态、视频搜索、强大的语义理解和检索能力; 4)页面分析和摘要:从千亿视频/网页中提取最有价值的信息,进行结构化字段提取、智能摘要生成、转码等工作来优化搜索体验; 5)链接分析:从万亿链接中找出最有价值的网页,优化链接质量、索引质量、垃圾作弊识别、调度策略等。

更新于 2024-02-29北京