字节跳动内容生态算法应用实习生-内容质量与数据服务平台

实习兼职A226475A2025-07-16地点：北京状态：招聘

扫码手机上打开

任职要求

1、2026届本科及以上学历在读，计算机科学、数学、统计学相关专业优先；
2、熟练掌握并运用Python、SQL、Pandas、Spark等语言，了解CV/NLP/音频常用算法，具备良好的数据分析和问题解决能力，能够独立进行模型调优和性能优化；
3、熟…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

ByteIntern：面向2026届毕业生（2025年9月-2026年8月期间毕业），为符合岗位要求的同学提供转正机会。
团队介绍：抖音集团内容质量与数据服务平台（DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE，简称CQC）是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队，在各产品运营增长方面开展支持工作，为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心，在全国10余个城市有业务分布。

1、负责内容生态场景的模型运维业务，能够独立负责模型训练全链路工作，包括但不限于大模型调用、微调、评估优化，以及机器学习和深度学习模型的训练和工程化落地；
2、深入理解业务需求与数据特征，从业务目标达成出发设计大模型或大小模型协同解决方案，通过Prompt工程、RAG、微调等技术提升内容识别、理解、治理等场景的应用效果，优化业务流程和效率；
3、主导大模型在业务中的创新应用，包括但不限于搭建领域适合的微调方案、设计多模型融合策略、优化模型部署上线流程，推动大模型规模化落地；
4、持续跟踪AI前沿技术动态，推动大模型与行业知识库，业务规则的结合，构建可复用的模型能力中台；
5、高效、规范管理模型项目需求，做好经验沉淀，将训练经验扩展至多业务场景，保证项目投入ROI。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

Python+

SQL+

Pandas+

Spark+

NLP+

还有更多 •••

登录查看完整学习资料

相关职位

后端开发实习生-抖音/直播/电商/剪映

实习A216706A

ByteIntern：面向2026届毕业生（2025年9月-2026年8月期间毕业），为符合岗位要求的同学提供转正机会。团队介绍：负责公司数个产品的推荐引擎、平台开发和大数据等工作。我们的工作涉及海量数据处理和对产品数据复杂深入的分析。在这里，你可以深入钻研大数据产品的改进和优化，探索前沿的技术；可以通过对产品的深度理解和思考，将数据应用到业务中去；也可以通过对产品和内容生态的深度分析，影响产品未来的发展方向。 1、参与字节跳动公司抖音、直播等业务的数据平台的开发工作； 2、支撑抖音、直播等业务的快速迭代，实现超大规模数据量及访问量下数据服务质量保障； 3、深入理解抖音、直播等业务并沉淀相应的数据能力，实现数据资产价值的最大化。

更新于 2025-02-17深圳

AIGC算法实习生-广告业务-筋斗云人才计划（北京/上海/深圳）

实习A96776

团队介绍：广告业务原为商业产品与技术部门，为抖音集团的商业变现提供广告产品与技术，负责端到端大型广告系统建设，覆盖抖音、今日头条、西瓜视频、番茄小说、穿山甲等产品矩阵，践行"激发生意新可能"理念，致力于让营销更省心、更高效、更美好，推动商业的可持续增长，让不分体量、地域的企业及个体，都能通过数字化技术激发创造、驱动生意。连接广告主、用户及生态伙伴、成为开放共赢的全球最佳智能营销平台之一。在这里，你将投身建设面向未来的数字营销能力，接触到全球先进的商业产品架构、模型和算法，在互联网广告行业始终创新。课题介绍： 1、核心技术架构： 1）下一代广告技术栈：模型算法层：搭建基于强化学习的智能出价与流量预估系统，攻克深层转化场景下的数据稀疏、多源异构数据融合（延迟数据/埋点噪声/跨平台行为）等行业难题；系统工程层：构建支持基于长序列特征的实时预估框架，研发支持动态创意组合的自动化投放引擎； AIGC融合层：建立文/图/视频多模态生成技术中台，实现从IP素材生成到智能投放的全链路闭环； 2）行业首创的AIGC解决方案：正在搭建全球领先的"小说→漫剧"智能生产线，攻克三大技术堡垒：多模态叙事引擎：研发支持角色一致性保持（Character-aware Diffusion）、分镜自动生成（Storyboard LLM）、动态运镜控制（Camera ControlNet）的复合型生成框架；工业化工作流：构建支持分布式渲染、多版本AB测试、合规性审核的智能生产管线，实现日均千级素材产能；投放增效系统：开发生成质量量化评估模型（QAGAN），建立素材生成-投放效果的反哺优化机制； 2、岗位挑战：你将主导：构建支持沿模型的混合推理框架，优化多卡并行下的生成效率；设计跨模态对齐算法，提升文字指令到视觉元素的可控生成精度；研发基于用户行为分析的智能素材变异系统，实现CTR提升30%+的个性化内容生成；打造从内容生产到实时竞价的全自动化广告引擎； 3、我们期待这样的开拓者：精通Diffusion Models技术栈，具有LoRA/ControlNet/T2I-Adapter等微调框架的实战调优经验；熟悉多模态大模型（如VideoPoet、Sora等视频生成技术原理），具备跨模态表征学习研究背景；拥有广告算法背景者优先，熟悉CVR预估、智能出价等核心模块与生成式AI的结合点；出色的工程化能力，主导过至少一个完整AIGC项目的端到端落地（从模型训练到服务部署）。

更新于 2025-05-26北京

智能审核多模态大模型实习生-电商-筋斗云人才计划

实习A201245

团队介绍：Data-电商-平台治理算法团队，通过优化算法，和业务团队协作，对字节旗下的电商产品进行全方位的质量和生态的治理，既包括风险、违规和低质问题的打击，也包括健康电商生态的建设和优化，在最大程度的优化平台治理的效果的同时提升治理的工作效率，降低成本。另外一方面，平台治理算法团队致力于攻坚前沿的AI技术，以技术驱动推动业务的变革和发展，领域涉及广泛，包括但不限于NLP/CV/多模态/大模型/图算法/序列算法等。课题介绍：背景：电商智能审核业务比较复杂，随着审核技术的不断演进，各个领域面临着新的风险问题和对抗形式，这对大模型的应用提出了新的挑战。例如，在电商审核业务中，涉及审核PBR变更、长文本、长时序、多语言、少样本和AIGC生成对抗等问题时，现有的开源大模型表现往往不尽人意。因此，针对这些挑战，我们亟需研发专门针对电商智能审核的大模型，以提升其在电商治理中的有效性和适应性。特别的，针对电商业务特点，我们需要探索高质量的数据自动生成、高效的MOE Embedding、Auto-Prompt生成、高质量 COT输出、大模型知识蒸馏等。此外，该模型应能够满足电商审核业务的需求，实现高准确率的自主决策和可解释性的COT生成，显著减少误判。针对动态变化的审核PBR变更，它能够通过RAG模块自动检索类似的审核案例，将复杂的审核PBR分解为简单的原子任务，自动拆分出驳回和豁免原子任务，并自动调用相应的Tools来解决这些任务，从而建立“知道拒绝并且知道为何拒绝”的业内领先智能审核系统。最终，大模型智能审核系统的审核效果需要接近或者超过人工审核，往全机审的路线上演进。研究方向：模态融合能力：提升文本、音频、图像、视频和直播等多模态的细粒度理解能力，实现高准确率的自主决策和可解释性的COT生成；Few-Shot能力：探索电商多语言、长时序和少样本问题，增强Few-Shot和Zero-Shot能力，针对多变的业务规则具备复杂指令和Auto-Prompt生成能力；攻防对抗能力：研究AIGC图像视频的判别，增强审核大模型对隐晦、抽象的生成式内容的攻防对抗能力；Agent能力：具备调用RAG模块，使用Tools，和Auto-planning能力；提升大模型的动态推理和反思能力。 1、深入理解电商治理业务，探索基于大模型、多模态模型，持续提升商家/达人在准入、发品、售后等各个业务场景的风险识别效果； 2、提升商品治理审核智能化水平，迭代优化治理大模型，提升大模型对治理规则和商品信息的理解，实现高准高召的问题识别和自动处置； 3、负责强化电商治理场景下，大模型推理和反思能力，通过商品业务域SFT、高质量Cot、强化学习、数据合成等技术方案，提升商品治理大模型底座能力； 4、参与构建挖掘电商直播、商品、商家和带货主播等多种实体的数据，对大规模网络/海量特征序列进行建模，支撑商家、达人分类/风险团伙挖掘等业务场景解决问题，并为商家/达人治理提供支持； 5、参与构建大规模的图存储和图学习平台，完善电商社区内商家/商品/达人/视频内容的关系建设，构建电商实体通用表征能力，赋能治理业务； 6、建设售后服务MLLM基座大模型，并利用RAG/Agent/RL等技术，解决复杂场景下对体验问题的理解能力。

更新于 2025-03-04北京

智能审核多模态大模型实习生-电商-筋斗云人才计划

实习A143587

更新于 2025-03-04上海