字节跳动AI算法实习生-番茄-筋斗云人才计划(北京/上海)
任职要求
1、2026届及以后毕业,博士在读,计算机、软件、人工智能、数学等相关专业优先; 2、扎实的机器学习基础,深入理解多模态理解及生成、推荐广告等相关技术,具备良好的数理基础和自学能力; 3、熟练掌握相关机器学习框架和工程框架,具备扎实的编码能力; 4、在多模态大模型领域有相关经验,尤其在长文本、影视剧领域有经验者优先; 5、在计算机科学高水平会议和期刊(如NIPS、ICML、CVPR、ICCV、ECCV、IJCAI、AAAI、KDD、SIGIR、WWW、ACL、PAMI、IJCV等)发表过论文或具备竞赛经验者优先。
工作职责
团队介绍:Data-番茄团队,负责字节跳动下番茄小说、红果短剧、番茄畅听等产品的推荐算法和AI相关工作。工作包括:搭建业界前沿的大规模推荐系统,提高产品使用体验,从小说、短剧、音频、音乐等内容方向建设完整的内容生态和AI能力,保持业务规模保持超高速增长。 课题介绍: 【课题背景】 番茄系产品作为全网最大的故事消费和创作平台,汇集了丰富的内容IP,涵盖网文、短剧、有声、漫画、动态漫等多种体裁,是大语言模型和多模态大模型天然的最佳实践场景。我们在内容创作、内容生产、内容推荐、IP改编等产品全链路上深度建设行业领先的各类AI能力,实现从供给到分发的全面能力升级,为数亿活跃用户和各类内容创作者带来全新的产品体验。 【研究方向】 1、利用小说和短剧的长文本和多模态优势,结合大模型理解和COT推理能力大幅度改进现有推荐系统,实现基于LLM+COT的下一代认知推理推荐引擎; 2、跨模态内容生成,探索如何将现有的IP内容在不同体裁之间进行转换和生成,实现小说、动漫、短剧等内容的AI生成和辅助创作; 3、番茄系IP价值挖掘与优化,深入挖掘IP的潜在价值,如改编、剧本创作等,优化其使用策略以及生产流程,以最大化其商业价值。
团队介绍:我们是支持抖音集团广告业务算法技术中台团队Ads Core,致力于研发全球领先的在线广告优化算法,营造健康、互惠的广告生态,持续提升用户和客户体验,引领并推动行业算法的变革与创新。我们承担了抖音集团产品广告变现业务的基础算法策略和机制的改进与研究,涵盖抖音、今日头条、番茄小说等场景的商业化技术的支撑。 课题介绍: 广告推荐算法是互联网商业变现的核心驱动力,我们希望借鉴生成式AI的成功思路,探索在广告推荐算法和架构上的颠覆性创新,解锁更大的算法效果提升空间。重点探索以下方向: 1)基于类Transformer结构的生成式推荐大模型技术,验证广告推荐场景的Scaling Law,探索面向大模型的特征工程以及算法建模范式; 2)算法和工程协同设计与优化,提升海量数据、超大参数背景下的训练与推理效率; 3)语言/多模态模型和推荐模型的结合; 1、负责商业化场景推荐大模型的算法优化,引入生成式AI技术,优化算法建模方法、模型结构、特征和样本等,提升广告变现效率; 2、验证推荐大模型的Scaling Law,应对大模型训练中的一切新挑战; 3、算法和工程高度融合、协同设计,极致优化推荐大模型的训练及推理效率。
团队介绍:广告业务原为商业产品与技术部门,为抖音集团的商业变现提供广告产品与技术,负责端到端大型广告系统建设,覆盖抖音、今日头条、西瓜视频、番茄小说、穿山甲等产品矩阵,践行"激发生意新可能"理念,致力于让营销更省心、更高效、更美好,推动商业的可持续增长,让不分体量、地域的企业及个体,都能通过数字化技术激发创造、驱动生意。连接广告主、用户及生态伙伴、成为开放共赢的全球最佳智能营销平台之一。在这里,你将投身建设面向未来的数字营销能力,接触到全球先进的商业产品架构、模型和算法,在互联网广告行业始终创新。 课题介绍: 1、核心技术架构: 1)下一代广告技术栈: 模型算法层:搭建基于强化学习的智能出价与流量预估系统,攻克深层转化场景下的数据稀疏、多源异构数据融合(延迟数据/埋点噪声/跨平台行为)等行业难题; 系统工程层:构建支持基于长序列特征的实时预估框架,研发支持动态创意组合的自动化投放引擎; AIGC融合层:建立文/图/视频多模态生成技术中台,实现从IP素材生成到智能投放的全链路闭环; 2)行业首创的AIGC解决方案: 正在搭建全球领先的"小说→漫剧"智能生产线,攻克三大技术堡垒: 多模态叙事引擎:研发支持角色一致性保持(Character-aware Diffusion)、分镜自动生成(Storyboard LLM)、动态运镜控制(Camera ControlNet)的复合型生成框架; 工业化工作流:构建支持分布式渲染、多版本AB测试、合规性审核的智能生产管线,实现日均千级素材产能; 投放增效系统:开发生成质量量化评估模型(QAGAN),建立素材生成-投放效果的反哺优化机制; 2、岗位挑战: 你将主导: 构建支持沿模型的混合推理框架,优化多卡并行下的生成效率; 设计跨模态对齐算法,提升文字指令到视觉元素的可控生成精度; 研发基于用户行为分析的智能素材变异系统,实现CTR提升30%+的个性化内容生成; 打造从内容生产到实时竞价的全自动化广告引擎; 3、我们期待这样的开拓者: 精通Diffusion Models技术栈,具有LoRA/ControlNet/T2I-Adapter等微调框架的实战调优经验; 熟悉多模态大模型(如VideoPoet、Sora等视频生成技术原理),具备跨模态表征学习研究背景; 拥有广告算法背景者优先,熟悉CVR预估、智能出价等核心模块与生成式AI的结合点; 出色的工程化能力,主导过至少一个完整AIGC项目的端到端落地(从模型训练到服务部署)。
团队介绍:字节跳动用户增长(User Growth)负责抖音、今日头条、番茄小说、剪映等多个产品的用户增长业务,建立行业领先的增长和营销技术,打造极致的用户体验。加入我们,有机会参与亿级用户场景的开发与架构工作,也有机会从数据出发,利用策略和模型为业务带来更大的助力。 课题背景: 在用户增长、激励广告和广告投放的商业场景,精准的决策至关重要。随着业务的发展,传统先预测再决策决策的方式难以适应复杂多变的环境。基于RL的在线因果推断及决策技术应运而生。在这些场景中,需要深入理解不同操作与结果之间的因果关系,从而做出最优决策。例如在用户增长中,要明确何种激励措施能最大程度推动增长;在广告投放中,要知道怎样的投放策略能带来最佳效果。然而,目前在在线场景下,因果预测模型的效果提升面临瓶颈,同时激励探索成本和决策收益的平衡也难以把握,提升基于因果推断的决策能力是推动增长的重要手段。 课题挑战: 1、平均处理效应ATE较小。线上平均处理效应(ATE)小意味着在实际线上环境中,因果关系的影响幅度微弱。这使得准确捕捉因果关系变得极为困难,模型难以从这种微弱的关系中学习到有效的因果模式,对基于RL的因果推断技术的敏感度和精度要求极高。 2、预测指标周期长,收益难以归因到一次激励决策。这导致在评估因果关系时,很难确定是哪一次激励决策产生了何种影响。长周期使得数据的关联性变得模糊,干扰了因果推断模型的构建,也不利于RL算法根据准确的因果关系进行决策优化。 3、线上观测数据波动大。线上观测数据波动较大,增加了数据的不确定性。这种波动可能掩盖真实的因果关系,使因果推断模型难以稳定地学习到有效的模式。同时,波动的观测数据也会影响运筹决策,导致决策的准确性和可靠性下降。 1、负责开发新一代的大规模因果模型,通过算法和工程优化,实现训练数据及干预决策在数量级上的提升;联合多场景的因果模型,松弛单场景约束,获取更优的决策和业务收益; 2、负责开发新一代的大规模运筹优化算法,与算法工程同学深度合作,提供灵活、鲁棒且高效的分布式运筹规划系统; 3、引入前沿的因果建模和强化学习技术,探索基于强化学习的世界模型仿真和一体化的因果决策算法,在探索和利用上获得更优的平衡,达成更好的成本效率。
团队介绍:字节跳动基础架构团队主要负责公司云基础建设,支撑着字节跳动旗下多款APP产品,如抖音、今日头条、番茄小说、西瓜视频、飞书、剪映等,同时也负责支持火山引擎公有云业务。迄今为止,我们通过云技术管理着百万量级的服务器构成的超大数据中心;我们通过字节深度优化的Kubernetes管理超过千万容器实例支持10万+微服务;我们还通过丰富的存储产品矩阵,如NewSQL、NoSQL、云存储等治理EB级的数据资产;我们积极拥抱开源和创新的软硬件架构,致力于构建业界领先的云基础设施,为整个公司的业务和客户发展保驾护航。我们热切期待对技术有追求、对大型系统有深刻见解的同学加入基础架构团队一起构建基础设施系统。 课题介绍: 课题背景: 在大语言模型蓬勃发展的当下,本课题聚焦于智能云基础设施与数据处理关键技术的多维度研究,旨在全面提升云服务在 AI 场景下的综合性能与效率。 课题挑战: 1、新一代搜索型数据库:当前产业界广泛应用的ElasticSearch面临数据与用户需求的深刻变革。需实现语义检索升级,突破关键词匹配限制,以满足学术研究等领域对语义理解和精准检索的要求;具备处理和融合多模态数据的能力,应对互联网图像、音视频多模态数据的爆发式增长;优化检索过程,更好地支持检索增强生成(RAG)技术,为语言模型提供优质信息;同时,需应对各行业海量数据存储检索压力,提升搜索实时性与跨语言能力; 2、面向LLM的下一代智能云基础架构:一方面,自动化和智能化管理基础架构各系统生命周期,深度融合人工智能与基础架构关键系统,建设大规模LLM for Infra 服务;另一方面,针对新涌现的LLM应用场景,在基础架构各个领域进行前沿技术创新,与字节工程团队合作,设计和开发高性价比且简单易用的下一代大模型基础架构,为火山引擎奠定技术与业务增长基础; 3、面向 AI 场景的serverless高性能弹性文件系统关键技术研究:大模型时代数据量爆炸式增长,当前文件系统多采用中心化元数据架构,难以水平扩展,限制文件系统规模及元数据性能。本研究将围绕元数据扩展性、与大模型深度结合提供Data Insight、设计高性能元数据单机引擎、实现任意目录快照、融合文件系统和对象存储元数据、内存加速、提供QoS(性能租户隔离和目录隔离)、故障处理(故障域隔离和故障无损)以及研发高性能客户端(用户态文件协议和DPU卸载)等关键技术展开; 4、面向大规模AI集群的高速通信和稳定性优化:随着大模型训练/推理业务规模增长,底层高速网络面临挑战。一方面,需解决GPU服务器硬件资源利用率偏低问题,包括充分利用CPU和内存空闲资源,以及研发计算通信融合的高性能集合通信库,实现通信算子与计算任务的深度融合;另一方面,在稳定性方面,提升故障快速发现和根因定位能力,解决网络吞吐不达预期等典型故障。