logo of bytedance

字节跳动搜索算法工程师(大模型方向)-Data

社招全职A67624A地点:北京状态:招聘

任职要求


1、优秀的代码能力、数据结构和基础算法功底,熟悉C/C++Python;
2、出色的问题分析和解决能力,能深入解决大模型训练和应用存在的问题;
3、有自然语言处理计算机视觉、视频理解、强化学习等领域的经验者优先;
4、有大模型预训练、模型优化及下游应用经验者优先。

工作职责


1、探索搜索引擎与大模型前沿技术的结合,实现搜索引擎全链路革新并进行极致的系统优化,提升搜索引擎对用户个性化需求的判断能力,对Query理解、相关性、满意度、内容理解等任务进行重建,探索大模型的个性化意图解析、相关性判定、生成式召回、排序大模型等技术方向,提升用户团购、餐饮、酒旅、休闲娱乐等生活服务领域的搜索体验,促进生态良性发展;
2、推进AI搜索、AIGC创新应用的落地,研发以人工智能技术为核心的新技术、新产品,满足用户的智能交互需求,结合抖音生活服务业务的充分供给,探索交互式搜索的新范式,在需求理解、逻辑推理、需求极致满足层面提升搜索引擎的智能化,强化现实与物理世界的交互能力;
3、探索大模型在上下游中的应用方式,关注和推进相关技术在业务场景的落地,包括但不限于大规模数据标注、数据评估、治理审核等方向,让模型达到或超过人类水平;
4、深入跟踪调研大模型以及相关方向(包括但不限于NLP/CV/多模态/强化学习)的前沿技术,探索模型在未来生活中的更多使用场景,拓展模型的应用范围。
包括英文材料
数据结构+
算法+
C+
C+++
Python+
大模型+
NLP+
OpenCV+
强化学习+
相关职位

logo of bytedance
社招A235254

1、为全球企业级客户提供高效的算法服务,包括但不限于传统搜推广、大模型技术与搜推结合以及大模型应用产品; 2、理解不同行业的客户场景和需求,落地相应的算法解决方案,包括但不限于电商/内容推荐、基于大模型技术的搜索方案以及知识库问答等LLM上层应用; 3、探索大模型相关方向的前沿技术,推进相关技术在业务场景的落地,包括但不限于长序列建模/多模态/RAG/智能体; 4、与产品研发团队协作建设平台产品,在多云环境下为全球范围内的客户提供算法解决方案,包括但不限于智能推荐平台和大模型搜推平台。

更新于 2024-05-09
logo of bytedance
社招A189664A

1、为全球企业级客户提供高效的算法服务,包括但不限于传统搜推广、大模型技术与搜推结合以及大模型应用产品; 2、理解不同行业的客户场景和需求,落地相应的算法解决方案,包括但不限于电商/内容推荐、基于大模型技术的搜索方案以及知识库问答等LLM上层应用; 3、探索大模型相关方向的前沿技术,推进相关技术在业务场景的落地,包括但不限于长序列建模/多模态/RAG/智能体; 4、与产品研发团队协作建设平台产品,在多云环境下为全球范围内的客户提供算法解决方案,包括但不限于智能推荐平台和大模型搜推平台。

更新于 2024-05-09
logo of bytedance
社招A114276

1、为全球企业级客户提供高效的算法服务,包括但不限于传统搜推广、大模型技术与搜推结合以及大模型应用产品; 2、理解不同行业的客户场景和需求,落地相应的算法解决方案,包括但不限于电商/内容推荐、基于大模型技术的搜索方案以及知识库问答等LLM上层应用; 3、探索大模型相关方向的前沿技术,推进相关技术在业务场景的落地,包括但不限于长序列建模/多模态/RAG/智能体; 4、与产品研发团队协作建设平台产品,在多云环境下为全球范围内的客户提供算法解决方案,包括但不限于智能推荐平台和大模型搜推平台。

更新于 2024-05-09
logo of bytedance
社招A15618

团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 本项目旨在探索推荐领域下的大模型新范式,突破现在持续了较长时间的推荐模型结构和Infra的方案,且效果大幅好于现在的基线模型,在抖音短视频/直播/电商/头条/剪映等多个业务场景上得到应用。推荐领域的大模型是比较有挑战的事情,推荐对工程效率的要求更高,且用户的推荐体验上是个性化的,本课题会以下多个方向来做深入的研究,探索和建设推荐场景的大模型方案,大幅提升推荐模型的天花板。 【课题挑战/必要性】 自然语言领域LLM的出现,效果在众多垂直任务上都好于sota模型,从推荐领域看过去工业级推荐系统在较长的时间没有大幅的变化过。本项目旨在探索推荐领域下的大模型方案,改变现在持续了较长时间的推荐模型结构和Infra的基本范式,且效果大幅好于现在的模型,在抖音短视频/直播等多个业务场景上得到应用。但是怎么做好推荐领域的大模型也是一个比较有挑战的事情,推荐对工程效率的要求更高,且用户的推荐体验上是个性化的,以及如何短视频、直播等体裁上做号内容的表征也是需要被解决的问题,这里会从模型参数scaling up、内容和用户的表征学习、内容理解多模态、超长序列建模、生成式推荐模型等多个方向来做深入的研究,对推荐场景的模型做系统性的升级。 【课题内容】 跨模态的对齐和统一表征学习(推荐、内容多模态、自然语言); 推荐模型参数和算力scaling up; 超长序列建模; 生成式推荐模型; 【涉及研究方向】 推荐算法、推荐大模型

更新于 2025-06-05