字节跳动【实习】大模型驱动的内容生产与分发：IP跨体裁生成与LLM推荐-番茄（北京/上海/杭州/深圳）

实习兼职A1317732026-04-13地点：北京状态：招聘

扫码手机上打开

任职要求

1、2027届及以后毕业，博士在读，计算机、软件、人工智能、数学等相关专业优先；
2、扎实的机器学习基础，深入理解多模态理解及生成、推荐广告等相关技术，具备良好的数理基础和自学能力；
3、熟练掌握相关机器学习框架和工程框架，具备扎实的编码能力；
4、在多模态…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

团队介绍：Data-番茄团队，负责字节跳动下番茄小说、红果短剧、番茄畅听、国际化短剧等产品的推荐算法和AI相关工作。我们的工作包括优化业界前沿的大规模推荐系统，探索LLM与推荐的结合，并落地生成式推荐范式，从小说、短剧、音频、音乐等内容方向建设完整的内容生态和AI能力，保持业务规模保持超高速增长。

课题介绍：番茄系聚合海量故事IP，今日头条拥有丰富内容形态，但生产与分发仍面临改编链路长、成本高，以及推荐过度依赖稀疏ID、对新内容/低活用户不友好等问题。本课题以多模态大模型为底座：在番茄通过LLM创作提效与结构化内容理解，构建IP资产并打通“小说→剧本→分镜→动态漫/短剧/音频”的生成与辅助创作；在小说、短剧、今日头条把内容理解信号融入推荐建模，提升兴趣捕捉与可解释分发，最终实现生产与分发协同提升。
1、大模型推荐和推荐Agent：引入LLM的推理能力，以Seed为基础训练大模型执行推荐任务的能力，推荐Token和自然语言Token联合训练实现模态融合，让推荐系统具备理解自然语言的能力，从而用推荐Agent方式实现更具扩展性的分发交互体验
2、突出强调利用大模型COT的推理能力，改进被动推荐效果
3、遵循用户的正向、负向指令的能力，彻底解决用户反馈中“Dislike不生效”、新用户兴趣探索、用户调控推荐画风等难题
4、在产品中提供和用户进行对话交互的能力，用户可根据自身需求调整推荐的效果
5、消息推送系统中嵌入大模型的用户-内容推理匹配能力，追求在内容零展、低展的情况下精准、快速的推送给用户，实现极高的推送时效性
6、构建基于大模型的推荐Agent能力，让大模型能和目前推荐系统业务策略和逻辑能更好的融合和调用。

课题挑战：
1、跨体裁一致性与可控生成；
2、结构化理解准确可复用；
3、模型落地成本/时延/轻量化；
4、LLM与内容的对齐、解码方案探索，包括纯文本方案或基于SID的方案；
5、LLM推荐指令COT数据集构建和个性化推荐推理能力的训练方法探索；
6、用户推荐正向、负向指令理解和线上执行能力探索；
7、推荐系统能力模块化&工具化，推荐Agent设计。

课题价值：
1、提效降本，提升IP产能与变现；
2、增强推荐效果与可解释性；
3、沉淀多模态通用底座；
4、探索基于LLM推理能力的推荐范式。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

机器学习+

大模型+

NeurIPS+

ICML+

CVPR+

ICCV+

还有更多 •••

登录查看完整学习资料

相关职位

【实习】大模型驱动的内容生产与分发：IP跨体裁生成与LLM推荐-今日头条（北京/上海/杭州）

实习A221557

团队介绍：今日头条推荐算法团队，致力于为用户提供个性化新闻和信息推荐服务，提升头条产品的用户体验。我们的业务涉及内容的个性化分发、生态与质量治理、热点和垂类等多个方向。在这里，你可以研究和改进最前沿的推荐、大模型等算法，结合对产品、数据的深度分析，将技术应用到实际业务中，服务数亿用户。课题介绍：番茄系聚合海量故事IP，今日头条拥有丰富内容形态，但生产与分发仍面临改编链路长、成本高，以及推荐过度依赖稀疏ID、对新内容/低活用户不友好等问题。本课题以多模态大模型为底座：在番茄通过LLM创作提效与结构化内容理解，构建IP资产并打通“小说→剧本→分镜→动态漫/短剧/音频”的生成与辅助创作；在小说、短剧、今日头条把内容理解信号融入推荐建模，提升兴趣捕捉与可解释分发，最终实现生产与分发协同提升。 1、大模型推荐和推荐Agent：引入LLM的推理能力，以Seed为基础训练大模型执行推荐任务的能力，推荐Token和自然语言Token联合训练实现模态融合，让推荐系统具备理解自然语言的能力，从而用推荐Agent方式实现更具扩展性的分发交互体验 2、突出强调利用大模型COT的推理能力，改进被动推荐效果 3、遵循用户的正向、负向指令的能力，彻底解决用户反馈中“Dislike不生效”、新用户兴趣探索、用户调控推荐画风等难题 4、在产品中提供和用户进行对话交互的能力，用户可根据自身需求调整推荐的效果 5、消息推送系统中嵌入大模型的用户-内容推理匹配能力，追求在内容零展、低展的情况下精准、快速的推送给用户，实现极高的推送时效性 6、构建基于大模型的推荐Agent能力，让大模型能和目前推荐系统业务策略和逻辑能更好的融合和调用。课题挑战： 1、跨体裁一致性与可控生成； 2、结构化理解准确可复用； 3、模型落地成本/时延/轻量化； 4、LLM与内容的对齐、解码方案探索，包括纯文本方案或基于SID的方案； 5、LLM推荐指令COT数据集构建和个性化推荐推理能力的训练方法探索； 6、用户推荐正向、负向指令理解和线上执行能力探索； 7、推荐系统能力模块化&工具化，推荐Agent设计。课题价值： 1、提效降本，提升IP产能与变现； 2、增强推荐效果与可解释性； 3、沉淀多模态通用底座； 4、探索基于LLM推理能力的推荐范式。

更新于 2026-04-14上海

实习-大模型数据算法工程师-北京-核心本地商业基础研发平台-风控算法

实习核心本地商业-基

1、参与大模型算法结合风控业务落地的相关工作。 2、跟踪和研究业界SOTA算法和技术，完成算法的调研、选型与调优。

更新于 2025-12-26北京

实习-大模型数据算法工程师-北京-核心本地商业基础研发平台-风控算法

实习核心本地商业-基

1、参与大模型算法结合风控业务落地的相关工作。 2、跟踪和研究业界SOTA算法和技术，完成算法的调研、选型与调优。

更新于 2026-04-07北京

实习-大模型算法研发工程师

实习算法

参与智能辅助驾驶 Planner（规划器）基座预训练相关数据处理工作，包括路测 / 仿真数据的矢量化重构、场景切片、时序轨迹清洗、长尾场景筛选与预训练数据集构建；协助研发 Planner 预训练任务，如轨迹预测自监督、多智能体交互博弈建模等，参与损失函数设计与实验验证；基于 PyTorch 框架，协助搭建时序规划模型（Transformer/Mamba 等），参与预训练、微调全流程，负责实验日志记录与结果分析；优化预训练数据 Pipeline，提升数据加载、预处理效率，配合解决训练中的 CPU/IO 瓶颈问题；跟进智能辅助驾驶规划、具身智能、时序大模型领域前沿论文，参与技术调研与简单算法复现；协助撰写实验报告、技术文档，配合团队完成项目迭代与成果沉淀。

更新于 2026-05-14上海