字节跳动大模型数据工程研发实习生-TikTok AI创新中心
任职要求
1、硕士及以上学位在读,计算机/信息科学/软件等理工学科背景; 2、具备扎实的计算机理论基础,对新技术有强烈的学习热情,具有优秀的编码能力,会使用SQL,掌握Java、Python、Scala中任意一门编程语言; 3、有大数据相关工具,分布式计算工具(Map/Reduce,Hadoop,Hive等)工作经验优先; 4、善于沟通,对数据敏感,责任心强、积极主动; 5、每周可以实习4-5天,连续实习3个月。
工作职责
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心,是致力于AI基础设施建设和创新研究的部门,探索行业领先的人工智能技术,包括大语言模型,多模态大模型等研究方向。我们希望研发能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。在Code AI方向,我们利用大语言模型强大的代码理解与推理能力,提升程序性能与研发效率。 1、在视频生成和视频理解领域,参与建设高质量、多样性的数据,建设顶尖数据集,探索数据配方的奥秘; 2、参与解决大规模数据生成的成本和分布式性能问题,一起尝试去定义LLM和AI LLM的研发新范式; 3、探索把AI技术应用在大模型的全生命周期中,包括不限于数据建设、数据生成、指令微调、偏好对齐等; 4、建设高质量、多样性的视频数据集,探索更多相关应用的落地场景。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心,是致力于AI基础设施建设和创新研究的部门,探索行业领先的人工智能技术,包括大语言模型,多模态大模型等研究方向。我们希望研发能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。在Code AI方向,我们利用大语言模型强大的代码理解与推理能力,提升程序性能与研发效率。 1、在视频生成和视频理解领域,参与建设高质量、多样性的数据,建设顶尖数据集,探索数据配方的奥秘; 2、参与解决大规模数据生成的成本和分布式性能问题,一起尝试去定义LLM和AI LLM的研发新范式; 3、探索把AI技术应用在大模型的全生命周期中,包括不限于数据建设、数据生成、指令微调、偏好对齐等; 4、建设高质量、多样性的视频数据集,探索更多相关应用的落地场景。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心,是致力于AI基础设施建设和创新研究的部门,探索行业领先的人工智能技术,包括大语言模型,多模态大模型等研究方向。我们希望研发能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。在Code AI方向,我们利用大语言模型强大的代码理解与推理能力,提升程序性能与研发效率。 1、在视频生成和视频理解领域,参与建设高质量、多样性的数据,建设顶尖数据集,探索数据配方的奥秘; 2、参与解决大规模数据生成的成本和分布式性能问题,一起尝试去定义LLM和AI LLM的研发新范式; 3、探索把AI技术应用在大模型的全生命周期中,包括不限于数据建设、数据生成、指令微调、偏好对齐等; 4、建设高质量、多样性的视频数据集,探索更多相关应用的落地场景。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心,是致力于AI基础设施建设和创新研究的部门,探索行业领先的人工智能技术,包括大语言模型,多模态大模型等研究方向。我们希望研发能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。在Code AI方向,我们利用大语言模型强大的代码理解与推理能力,提升程序性能与研发效率。 1、与算法研究员紧密合作,定义高质量的数据集评价标准; 2、阅读相关领域最新研究论文或报告,寻找高效科学的方法获取及构建高质量数据; 3、与工程师密切配合,搭建高效的数据采集、获取与生产管线; 4、设计训练数据标注所需的流程、规则与画像,对项目的质量和进度负责。
团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok智能创作团队是为TikTok业务提供AI,特效,音视频创作技术能力,涵盖了计算机视觉、图形学、拍摄编辑、特效、客户端、服务端工程等技术领域,并以多种形式向抖音提提供业界前沿的内容理解、内容创作、互动体验与消费的能力和行业解决方案。 1、负责TikTok视频特效方向的研发工作; 2、负责AI人像美化、视频和图像的特效算法研发和业务落地; 3、参与AI在CV、CG领域前沿技术的分析和研究。