字节跳动算法实习生-国际化内容安全平台
任职要求
1、2026届硕士学位在读,计算机、软件工程、电子等相关专业优先; 2、丰富的ML/CV/NLP/推荐经验,包括但不限于: 1)机器学习/数据挖掘/CV/NLP/多模态等相关竞赛或行业经验; 2)机器学习/数据挖掘/人工智能/大模型相关领域的会议论文(KDD/WWW/NIPS/ICML/CVPR/ACL/AAAI...); 3)对预训练技术有深入研究者(不限于预训练,Post train,SFT/RFT,数据处理,评估等方面)可能获得优先的机会; 3、扎实的编程功底,熟悉Python/C++等编程语言; 4、优秀的分析问题和解决问题的能力,并热衷于解决具有挑战性的问题; 5、对技术充满热情,良好的沟通能力和团队合作精神; 6、每周可实习4天以上,可实习4个月以上。
工作职责
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:国际化内容安全平台团队致力于为字节跳动国际化产品的用户维护安全可信赖环境,通过开发、迭代机器学习模型和信息系统以更早、更快发掘风险、监控风险、响应紧急事件,以人工智能技术支持业务发展,力求更高效、更敏捷、更全能地维护站内生态安全。 1、投身于国际化业务场景下的预训练大模型技术研究与应用创新,专注于提升预训练效率,通过对海量数据的精准筛选与处理策略研究,优化数据选择机制,以及训练策略,完整基座语言模型的优化; 2、依托国际化场景对多语言的需求,深度优化多语言训练技术,包括数据策略和模型策略,提升在各语种知识迁移和对齐,实现强大的多语种基座模型能力; 3、深入探索后训练(Post training)技术,包括继续预训练(CPT),微调对齐(SFT,RFT)等不同的方面,精心钻研微调对齐技术和推理能力优化,确保大模型在国际化业务不同任务与领域应用中的精准适配与高效表现; 4、全力攻克模型效率优化难题,从模型架构设计、算法优化, 包括但不限于知识蒸馏、模型量化压缩,样本采样等方法等多维度入手,打造高效能、低能耗的预训练大模型,使其在实际业务应用中展现卓越的处理速度与资源利用率,助力构建智能、高效且具有广泛适应性的内容处理与分析系统; 5、建立有国际化短视频场景特色的预训练模型评估体系和数据体系,为模型的长期迭代提供有力支撑; 6、探索前沿AI技术,包含但不限于AIGC、LLM、多模态内容理解(视频/图像/音频/文本)等,以构建下一代安全模型。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:国际化内容安全平台团队致力于为字节跳动国际化产品的用户维护安全可信赖环境,通过开发、迭代机器学习模型和信息系统以更早、更快发掘风险、监控风险、响应紧急事件,以人工智能技术支持业务发展,力求更高效、更敏捷、更全能地维护站内生态安全。 1、投身于国际化业务场景下的预训练大模型技术研究与应用创新,专注于提升预训练效率,通过对海量数据的精准筛选与处理策略研究,优化数据选择机制,以及训练策略,完整基座语言模型的优化; 2、依托国际化场景对多语言的需求,深度优化多语言训练技术,包括数据策略和模型策略,提升在各语种知识迁移和对齐,实现强大的多语种基座模型能力; 3、深入探索后训练(Post training)技术,包括继续预训练(CPT),微调对齐(SFT,RFT)等不同的方面,精心钻研微调对齐技术和推理能力优化,确保大模型在国际化业务不同任务与领域应用中的精准适配与高效表现; 4、全力攻克模型效率优化难题,从模型架构设计、算法优化,包括但不限于知识蒸馏、模型量化压缩,样本采样等方法等多维度入手,打造高效能、低能耗的预训练大模型,使其在实际业务应用中展现卓越的处理速度与资源利用率,助力构建智能、高效且具有广泛适应性的内容处理与分析系统; 5、建立有国际化短视频场景特色的预训练模型评估体系和数据体系,为模型的长期迭代提供有力支撑; 6、探索前沿AI技术,包含但不限于AIGC、LLM、多模态内容理解(视频/图像/音频/文本)等,以构建下一代安全模型。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:国际化内容安全平台团队致力于为字节跳动国际化产品的用户维护安全可信赖环境,通过开发、迭代机器学习模型和信息系统以更早、更快发掘风险、监控风险、响应紧急事件,以人工智能技术支持业务发展,力求更高效、更敏捷、更全能地维护站内生态安全。 1、投身于国际化业务场景下的预训练大模型技术研究与应用创新,专注于提升预训练效率,通过对海量数据的精准筛选与处理策略研究,优化数据选择机制,以及训练策略,完整基座语言模型的优化; 2、依托国际化场景对多语言的需求,深度优化多语言训练技术,包括数据策略和模型策略,提升在各语种知识迁移和对齐,实现强大的多语种基座模型能力; 3、深入探索后训练(Post training)技术,包括继续预训练(CPT),微调对齐(SFT,RFT)等不同的方面,精心钻研微调对齐技术和推理能力优化,确保大模型在国际化业务不同任务与领域应用中的精准适配与高效表现; 4、全力攻克模型效率优化难题,从模型架构设计、算法优化, 包括但不限于知识蒸馏、模型量化压缩,样本采样等方法等多维度入手,打造高效能、低能耗的预训练大模型,使其在实际业务应用中展现卓越的处理速度与资源利用率,助力构建智能、高效且具有广泛适应性的内容处理与分析系统; 5、建立有国际化短视频场景特色的预训练模型评估体系和数据体系,为模型的长期迭代提供有力支撑; 6、探索前沿AI技术,包含但不限于AIGC、LLM、多模态内容理解(视频/图像/音频/文本)等,以构建下一代安全模型。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:国际化内容安全平台团队致力于为字节跳动国际化产品的用户维护安全可信赖环境,通过开发、迭代机器学习模型和信息系统以更早、更快发掘风险、监控风险、响应紧急事件,以人工智能技术支持业务发展,力求更高效、更敏捷、更全能地维护站内生态安全。 1、负责字节跳动短视频/直播产品的内容理解和用户建模; 2、深入理解内容安全策略,结合机器学习等技术,优化内容安全业务流程和效率; 3、深入理解业务和机器学习技术,优化短视频/直播理解和建模,提升推荐效果和内容生态; 4、深入理解业务和机器学习技术,优化用户/创作者理解和建模,提升推荐效果和创作生态。