logo of bytedance

字节跳动多模态大模型-内容生成算法工程师-TikTok-筋斗云人才计划

校招全职A19005地点:上海状态:招聘

任职要求


1、获得博士学位,人工智能、计算机、数学相关专业优先;
2、具备扎实的编码能力、数据结构和基础算法功底,熟练运用各种算法框架与工程框架;
3、在国际会议或期刊发表论文者(包括但不限于ACL、EMNLP、NeurIPSICMLICLRCVPR等)优先;
4、拥有扎实的机器学习基础,在深度学习强化学习NLP、多模态方向有深入的理解与研究经历;
5、具备良好的沟通协作能力,能够与团队共同探索新技术,推动技术发展。

工作职责


团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。
TikTok研发团队,旨在实现TikTok业务的研发工作,搭建及维护业界领先的产品。加入我们,你能接触到包括用户增长、社交、直播、电商C端、内容创造、内容消费等核心业务场景,支持产品在全球赛道上高速发展;也能接触到包括服务架构、基础技术等方向上的技术挑战,保障业务持续高质量、高效率、且安全地为用户服务;同时还能为不同业务场景提供全面的技术解决方案,优化各项产品指标及用户体验。 
在这里, 有大牛带队与大家一同不断探索前沿, 突破想象空间。 在这里,你的每一行代码都将服务亿万用户。在这里,团队专业且纯粹,合作氛围平等且轻松。目前在北京,上海,杭州、广州、深圳分别开放多个岗位机会。

课题介绍:
多模态模型能帮助提取视频的多模态内容信息,单用户对内容的注意力是个性化的,所以基于对比学习或者生成式学习得到的内容信息无法能和推荐系统相匹配,如何将基于纯内容信号得到的多模态信息用到推荐系统里目前是一个开放的话题我们希望通过多模态模型和推荐系统联合建模的方式来个性化的提取用户-内容的联合信号,并能实现内容建模和个性化建模的双重提升。

1、探索多模态模型,包括多模态预训练,多模态LLM; 
2、将多模态模型应用于图像/视频的生成创作、逻辑推理、深层语义理解、视频语义压缩、视频高光判断等; 
3、探索LLM、多模态等的高效Finetuning技术和推理技术,保证模型在业务场景中的快速适配和高效调用;
4、主要研究方向包括:多模态预训练、图片和视频的生成、图片和视频风格迁移、跨模态检索、大模型多标签分类、半监督学习、自监督学习。
包括英文材料
学历+
数据结构+
算法+
NeurIPS+
ICML+
CVPR+
机器学习+
深度学习+
强化学习+
NLP+
相关职位

logo of bytedance
社招A80728A

团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok研发团队,旨在实现TikTok业务的研发工作,搭建及维护业界领先的产品。加入我们,你能接触到包括用户增长、社交、直播、电商C端、内容创造、内容消费等核心业务场景,支持产品在全球赛道上高速发展;也能接触到包括服务架构、基础技术等方向上的技术挑战,保障业务持续高质量、高效率、且安全地为用户服务;同时还能为不同业务场景提供全面的技术解决方案,优化各项产品指标及用户体验。 在这里, 有大牛带队与大家一同不断探索前沿, 突破想象空间。 在这里,你的每一行代码都将服务亿万用户。在这里,团队专业且纯粹,合作氛围平等且轻松。目前在北京,上海,杭州、广州、深圳分别开放多个岗位机会。 课题介绍: 多模态模型能帮助提取视频的多模态内容信息,单用户对内容的注意力是个性化的,所以基于对比学习或者生成式学习得到的内容信息无法能和推荐系统相匹配,如何将基于纯内容信号得到的多模态信息用到推荐系统里目前是一个开放的话题我们希望通过多模态模型和推荐系统联合建模的方式来个性化的提取用户 - 内容的联合信号,并能实现内容建模和个性化建模的双重提升。 1、探索多模态模型,包括多模态预训练,多模态LLM; 2、将多模态模型应用于图像/视频的生成创作、逻辑推理、深层语义理解、视频语义压缩、视频高光判断等; 3、探索LLM、多模态等的高效Finetuning技术和推理技术,保证模型在业务场景中的快速适配和高效调用; 4、主要研究方向包括:多模态预训练、图片和视频的生成、图片和视频风格迁移、跨模态检索、大模型多标签分类、半监督学习、自监督学习。

更新于 2025-05-27
logo of bytedance
校招A252936

团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok研发团队,旨在实现TikTok业务的研发工作,搭建及维护业界领先的产品。加入我们,你能接触到包括用户增长、社交、直播、电商C端、内容创造、内容消费等核心业务场景,支持产品在全球赛道上高速发展;也能接触到包括服务架构、基础技术等方向上的技术挑战,保障业务持续高质量、高效率、且安全地为用户服务;同时还能为不同业务场景提供全面的技术解决方案,优化各项产品指标及用户体验。 在这里, 有大牛带队与大家一同不断探索前沿, 突破想象空间。 在这里,你的每一行代码都将服务亿万用户。在这里,团队专业且纯粹,合作氛围平等且轻松。目前在北京,上海,杭州、广州、深圳分别开放多个岗位机会。 课题介绍: 多模态模型能帮助提取视频的多模态内容信息,单用户对内容的注意力是个性化的,所以基于对比学习或者生成式学习得到的内容信息无法能和推荐系统相匹配,如何将基于纯内容信号得到的多模态信息用到推荐系统里目前是一个开放的话题我们希望通过多模态模型和推荐系统联合建模的方式来个性化的提取用户 - 内容的联合信号,并能实现内容建模和个性化建模的双重提升。 1、探索多模态模型,包括多模态预训练,多模态LLM; 2、将多模态模型应用于图像/视频的生成创作、逻辑推理、深层语义理解、视频语义压缩、视频高光判断等; 3、探索LLM、多模态等的高效Finetuning技术和推理技术,保证模型在业务场景中的快速适配和高效调用; 4、主要研究方向包括:多模态预训练、图片和视频的生成、图片和视频风格迁移、跨模态检索、大模型多标签分类、半监督学习、自监督学习。

更新于 2025-05-23
logo of bytedance
社招I5124

团队介绍:TikTok内容生态算法团队立足于平台海量用户和短视频内容,利用多模态、LLM/MLLM、NLP&CV等技术,负责对各类内容做分析、加工、生成等内容层操作,内容形态包括但不限于短视频、图文、全网热点页面、客服对话等,产出内容理解特征、大模型生成中间页、全网热点发现&理解能力以及智能客服系统。 同时在TikTok供给侧提供面向全平台的创作灵感个性化推荐能力。 在这里,有上百个语种,NLP/LLM等技术面临多语种挑战。 在这里,有海量短视频内容,MLLM及多模态技术有更多应用场景。 平台用户量大,各项业务如本地生活、搜索等都处于高速发展期,有大量实际落地和应用场景。 1、参与TikTok业务中的NLP/CV基础算法相关研发工作,深度理解业务,解决和跟进一线业务问题; 2、与产品运营团队紧密协作,在热点挖掘、本地生活等业务方向持续迭代优化算法效果,达成业务目标; 3、结合业务场景挑战,跟踪前沿领域研究成果,推动技术创新在业务场景的深度应用,包括但不限于热点发现/信息抽取与结构化/多模态/大模型/文本生成/检索与相关性等算法领域。

更新于 2023-01-10
logo of bytedance
社招A01682

团队介绍:TikTok内容生态算法团队立足于平台海量用户和短视频内容,利用多模态、LLM/MLLM、NLP&CV等技术,负责对各类内容做分析、加工、生成等内容层操作,内容形态包括但不限于短视频、图文、全网热点页面、客服对话等,产出内容理解特征、大模型生成中间页、全网热点发现&理解能力以及智能客服系统。 同时在TikTok供给侧提供面向全平台的创作灵感个性化推荐能力。 在这里,有上百个语种,NLP/LLM等技术面临多语种挑战。 在这里,有海量短视频内容,MLLM及多模态技术有更多应用场景。 平台用户量大,各项业务如本地生活、搜索等都处于高速发展期,有大量实际落地和应用场景。 1、负责TikTok的内容生态业务推荐算法工作,和产品、运营等团队紧密合作,深度理解TikTok推荐业务发展,共同制定长短期的业务目标; 2、深入参与到机器学习技术研究中,在解决具体问题的同时形成完整系统的方法论,持续提升用户体验; 3、研究方向包含且不局限于:深度学习、图神经网络、多任务学习、Learning to rank、模型压缩和加速、多模态技术等,善于结合业务的实际问题来做好技术的探索和研究; 4、组织推进组内以及跨部门合作项目,帮助团队的进步和新人成长。

更新于 2023-06-08