logo of bytedance

字节跳动推荐大模型算法工程师-生活服务-筋斗云人才计划(北京/上海/成都)

校招全职A230597地点:北京状态:招聘

任职要求


1、获得博士学位,计算机科学、人工智能、自然语言处理计算机视觉等相关专业优先;
2、扎实的机器学习基础和编码能力,在机器学习NLP、CV等有较深入的研究经验,熟练掌握主要的算法数据结构;
3、在搜索、广告、推荐和大模型领域,有参与或者主导过关键项目的优先;
4、在国际会议发表论文者优先,包括但不限于KDD、SIGIR、RecSys、ACL、NeurIPS等;
5、具备较好的问题分析和解决能力,对技术有热情,热衷于推动和解决各种挑战。

工作职责


团队介绍:生活服务业务依托于抖音、抖音极速版等平台,致力于促进用户与本地服务的连接。过去一年,生活服务业务开创了全新的视频种草和交易体验,让更多用户通过抖音发现线下好去处,也帮助众多本地商家拓展了新的经营阵地。我们期待你的加入,一同为亿万用户创造更美好的生活。 

课题介绍:推荐算法是生活服务场景交易增长的核心驱动力,我们希望借鉴LLM的成功思路,结合生活服务场景的时空特点,探索在生活服务场景推荐算法和架构的颠覆性创新,解锁更大的算法效果提升空间。
重点探索以下方向:
1、基于类Transformer结构的生成式推荐大模型技术,验证生活服务推荐场景的Scaling Law,探索面向大模型的推荐算法建模范式;
2、算法和工程协同设计与优化,提升海量数据、超大参数背景下的训练与推理的效率;
3、多体裁多模态表征学习和推荐模型结合;
4、结合生活服务场景特有的时空属性,进行时间和空间感知的算法建模。

1、负责生活服务场景推荐大模型的算法优化,引入生成式AI技术,优化建模方案、模型结构、特征和样本等,提升场景交易效率;
2、验证生活服务场景的推荐大模型Scaling Law,应对大模型训练中的新挑战;
3、算法和工程协同设计与优化,提升海量数据、超大参数背景下的训练与推理效率;
4、多体裁多模态表征学习和推荐大模型结合;
5、结合生活服务场景特有的时空属性,进行时间和空间感知的算法建模。
包括英文材料
学历+
NLP+
OpenCV+
机器学习+
算法+
数据结构+
大模型+
RecSys+
NeurIPS+
相关职位

logo of bytedance
社招A26865A

团队介绍:生活服务业务依托于抖音、抖音极速版等平台,致力于促进用户与本地服务的连接。过去一年,生活服务业务开创了全新的视频种草和交易体验,让更多用户通过抖音发现线下好去处,也帮助众多本地商家拓展了新的经营阵地。我们期待你的加入,一同为亿万用户创造更美好的生活。 课题介绍:推荐算法是生活服务场景交易增长的核心驱动力,我们希望借鉴LLM的成功思路,结合生活服务场景的时空特点,探索在生活服务场景推荐算法和架构的颠覆性创新,解锁更大的算法效果提升空间。 重点探索以下方向: 1、基于类Transformer结构的生成式推荐大模型技术,验证生活服务推荐场景的Scaling Law,探索面向大模型的推荐算法建模范式; 2、算法和工程协同设计与优化,提升海量数据、超大参数背景下的训练与推理的效率; 3、多体裁多模态表征学习和推荐模型结合; 4、结合生活服务场景特有的时空属性,进行时间和空间感知的算法建模。 1、负责生活服务场景推荐大模型的算法优化,引入生成式AI技术,优化建模方案、模型结构、特征和样本等,提升场景交易效率; 2、验证生活服务场景的推荐大模型Scaling Law,应对大模型训练中的新挑战; 3、算法和工程协同设计与优化,提升海量数据、超大参数背景下的训练与推理效率; 4、多体裁多模态表征学习和推荐大模型结合; 5、结合生活服务场景特有的时空属性,进行时间和空间感知的算法建模。

更新于 2025-05-27
logo of bytedance
社招A15618

团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 本项目旨在探索推荐领域下的大模型新范式,突破现在持续了较长时间的推荐模型结构和Infra的方案,且效果大幅好于现在的基线模型,在抖音短视频/直播/电商/头条/剪映等多个业务场景上得到应用。推荐领域的大模型是比较有挑战的事情,推荐对工程效率的要求更高,且用户的推荐体验上是个性化的,本课题会以下多个方向来做深入的研究,探索和建设推荐场景的大模型方案,大幅提升推荐模型的天花板。 【课题挑战/必要性】 自然语言领域LLM的出现,效果在众多垂直任务上都好于sota模型,从推荐领域看过去工业级推荐系统在较长的时间没有大幅的变化过。本项目旨在探索推荐领域下的大模型方案,改变现在持续了较长时间的推荐模型结构和Infra的基本范式,且效果大幅好于现在的模型,在抖音短视频/直播等多个业务场景上得到应用。但是怎么做好推荐领域的大模型也是一个比较有挑战的事情,推荐对工程效率的要求更高,且用户的推荐体验上是个性化的,以及如何短视频、直播等体裁上做号内容的表征也是需要被解决的问题,这里会从模型参数scaling up、内容和用户的表征学习、内容理解多模态、超长序列建模、生成式推荐模型等多个方向来做深入的研究,对推荐场景的模型做系统性的升级。 【课题内容】 跨模态的对齐和统一表征学习(推荐、内容多模态、自然语言); 推荐模型参数和算力scaling up; 超长序列建模; 生成式推荐模型; 【涉及研究方向】 推荐算法、推荐大模型

更新于 2025-06-05
logo of bytedance
校招A225663A

团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 课题背景:探索推荐领域下的大模型新范式,突破现在持续了较长时间的推荐模型结构和Infra的方案,且效果大幅好于现在的基线模型,在抖音短视频/直播/电商/头条/剪映等多个业务场景上得到应用。推荐领域的大模型是比较有挑战的事情,推荐对工程效率的要求更高,且用户的推荐体验上是个性化的,本课题会以下多个方向来做深入的研究,探索和建设推荐场景的大模型方案,大幅提升推荐模型的天花板。 课题挑战:自然语言领域LLM的出现,效果在众多垂直任务上都好于sota模型,从推荐领域看过去工业级推荐系统在较长的时间没有大幅的变化过。本项目旨在探索推荐领域下的大模型方案,改变现在持续了较长时间的推荐模型结构和Infra的基本范式,且效果大幅好于现在的模型,在抖音短视频/直播等多个业务场景上得到应用。但是怎么做好推荐领域的大模型也是一个比较有挑战的事情,推荐对工程效率的要求更高,且用户的推荐体验上是个性化的,以及如何短视频、直播等体裁上做号内容的表征也是需要被解决的问题,这里会从模型参数scaling up、内容和用户的表征学习、内容理解多模态、超长序列建模、生成式推荐模型等多个方向来做深入的研究,对推荐场景的模型做系统性的升级。 课题内容: 1、跨模态的对齐和统一表征学习(推荐、内容多模态、自然语言); 2、推荐模型参数和算力scaling up; 3、超长序列建模; 4、生成式推荐模型; 5、涉及研究方向:推荐算法、推荐大模型。

更新于 2025-05-26
logo of bytedance
校招A174103

团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 课题背景:探索推荐领域下的大模型新范式,突破现在持续了较长时间的推荐模型结构和Infra的方案,且效果大幅好于现在的基线模型,在抖音短视频/直播/电商/头条/剪映等多个业务场景上得到应用。推荐领域的大模型是比较有挑战的事情,推荐对工程效率的要求更高,且用户的推荐体验上是个性化的,本课题会以下多个方向来做深入的研究,探索和建设推荐场景的大模型方案,大幅提升推荐模型的天花板。 课题挑战:自然语言领域LLM的出现,效果在众多垂直任务上都好于sota模型,从推荐领域看过去工业级推荐系统在较长的时间没有大幅的变化过。本项目旨在探索推荐领域下的大模型方案,改变现在持续了较长时间的推荐模型结构和Infra的基本范式,且效果大幅好于现在的模型,在抖音短视频/直播等多个业务场景上得到应用。但是怎么做好推荐领域的大模型也是一个比较有挑战的事情,推荐对工程效率的要求更高,且用户的推荐体验上是个性化的,以及如何短视频、直播等体裁上做号内容的表征也是需要被解决的问题,这里会从模型参数scaling up、内容和用户的表征学习、内容理解多模态、超长序列建模、生成式推荐模型等多个方向来做深入的研究,对推荐场景的模型做系统性的升级。 课题内容: 1、跨模态的对齐和统一表征学习(推荐、内容多模态、自然语言); 2、推荐模型参数和算力scaling up; 3、超长序列建模; 4、生成式推荐模型; 5、涉及研究方向:推荐算法、推荐大模型。

更新于 2025-05-26