logo of bytedance

字节跳动搜索算法工程师(大模型方向)-Data

社招全职A67624A地点:北京状态:招聘

任职要求


1、优秀的代码能力、数据结构和基础算法功底,熟悉C/C++或Python;
2、出色的问题分析和解决能力,能深入解决大模型训练和应用存…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、探索搜索引擎与大模型前沿技术的结合,实现搜索引擎全链路革新并进行极致的系统优化,提升搜索引擎对用户个性化需求的判断能力,对Query理解、相关性、满意度、内容理解等任务进行重建,探索大模型的个性化意图解析、相关性判定、生成式召回、排序大模型等技术方向,提升用户团购、餐饮、酒旅、休闲娱乐等生活服务领域的搜索体验,促进生态良性发展;
2、推进AI搜索、AIGC创新应用的落地,研发以人工智能技术为核心的新技术、新产品,满足用户的智能交互需求,结合抖音生活服务业务的充分供给,探索交互式搜索的新范式,在需求理解、逻辑推理、需求极致满足层面提升搜索引擎的智能化,强化现实与物理世界的交互能力;
3、探索大模型在上下游中的应用方式,关注和推进相关技术在业务场景的落地,包括但不限于大规模数据标注、数据评估、治理审核等方向,让模型达到或超过人类水平;
4、深入跟踪调研大模型以及相关方向(包括但不限于NLP/CV/多模态/强化学习)的前沿技术,探索模型在未来生活中的更多使用场景,拓展模型的应用范围。
包括英文材料
数据结构+
算法+
C+
C+++
还有更多 •••
相关职位

logo of tencent
社招TEG技术

1.研发智能体关键技术,推动指令理解、深度推理、反思优化等核心能力在Data+AI场景的技术落地和优化; 2.构建智能体工具调用体系,研发支持多工具调度的function call能力,优化多智能体协同决策机制; 3.参与搜索算法全链路优化,重点突破Query语义解析、内容理解、混合召回策略及RAG生成效果; 4.跟进LLM与智能体领域前沿技术,参与关键技术预研及工业级解决方案设计。

更新于 2025-05-20北京
logo of bytedance
社招A119582

团队介绍:Data-电商团队,负责电商创新项目的算法和大数据工作。依托于字节跳动产品,帮助用户发现并获得好物,享受美好生活。在这个团队,我们不仅要通过推荐和搜索算法帮助用户买到感兴趣的好东西,也要通过风控算法和智能平台治理算法去甄别违规行为,保护用户的购物体验;我们还要建设智能客服技术、大规模商品知识图谱来提升各个交易环节的效率;我们也要结合机器学习和运筹算法,来优化供应链和物流的效率和成本,并进一步提升用户体验;另外我们还会用人工智能来帮助商家提升经营能力。我们的使命:没有难卖的优价好物,让美好生活触手可得。 课题介绍: 背景:电商领域短视频内容正逐渐成为业务增长和用户体验优化的重要方向,通过多模态的视频理解与生成大模型创新解决电商场景中的核心挑战,例如短视频与电商商品的精准匹配、AIGC(AI生成内容)视频生成等,让用户在浏览短视频时获得更精准的商品匹配,并为内容创作者提供更便捷强大的创作工具。 研究方向:本课题聚焦于多模态视频理解与生成。构建高效的多模态嵌入模型,实现视频、图像、文本、商品等模态间的统一表示学习,以增强短视频与电商商品的关联性。通过大规模跨模态数据集的构建与优化,提升视频与商品的匹配精准度,使模型能够自动识别短视频中的商品或品牌,并精准映射至电商库,支持用户在观看时直接获取相关购买信息。此外,还将探索 AIGC(AI生成内容)短视频技术,包括商品图像+文本生成带货视频、智能剪辑与特效添加、虚拟试穿等,降低电商内容制作成本,提升营销效率。 1、负责对电商场景下的商品内容、视频内容进行理解和可控生成,赋能电商全链路场景,提供优质商品供给、内容供给、商家、达人供给等,建立商品履约视角的商品理解算法体系,为商品履约保驾护航,提升购物体验; 2、基于前沿的AIGC模型能力,帮助降低商家素材制作成本,提升平台优质供给(短视频、图文等),利用NLP、CV、多模态技术,增强对短视频内容、图文、商品理解能力,支持搜索、推荐、商城全导购链路,提升消费者在内容场和货架场购物体验; 3、挖掘电商垂直领域大规模、高质量Pretrain数据集,基于字节跳动通用大模型,研发电商行业大模型,探索电商交互式导购新场景; 4、跟踪AIGC/CV/NLP/多模态/LLM领域的最新研究和技术发展,负责算法模型迭代升级。

更新于 2025-05-27北京
logo of bytedance
社招A235254

1、为全球企业级客户提供高效的算法服务,包括但不限于传统搜推广、大模型技术与搜推结合以及大模型应用产品; 2、理解不同行业的客户场景和需求,落地相应的算法解决方案,包括但不限于电商/内容推荐、基于大模型技术的搜索方案以及知识库问答等LLM上层应用; 3、探索大模型相关方向的前沿技术,推进相关技术在业务场景的落地,包括但不限于长序列建模/多模态/RAG/智能体; 4、与产品研发团队协作建设平台产品,在多云环境下为全球范围内的客户提供算法解决方案,包括但不限于智能推荐平台和大模型搜推平台。

更新于 2024-05-09深圳
logo of bytedance
社招A15618

团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 本项目旨在探索推荐领域下的大模型新范式,突破现在持续了较长时间的推荐模型结构和Infra的方案,且效果大幅好于现在的基线模型,在抖音短视频/直播/电商/头条/剪映等多个业务场景上得到应用。推荐领域的大模型是比较有挑战的事情,推荐对工程效率的要求更高,且用户的推荐体验上是个性化的,本课题会以下多个方向来做深入的研究,探索和建设推荐场景的大模型方案,大幅提升推荐模型的天花板。 【课题挑战/必要性】 自然语言领域LLM的出现,效果在众多垂直任务上都好于sota模型,从推荐领域看过去工业级推荐系统在较长的时间没有大幅的变化过。本项目旨在探索推荐领域下的大模型方案,改变现在持续了较长时间的推荐模型结构和Infra的基本范式,且效果大幅好于现在的模型,在抖音短视频/直播等多个业务场景上得到应用。但是怎么做好推荐领域的大模型也是一个比较有挑战的事情,推荐对工程效率的要求更高,且用户的推荐体验上是个性化的,以及如何短视频、直播等体裁上做号内容的表征也是需要被解决的问题,这里会从模型参数scaling up、内容和用户的表征学习、内容理解多模态、超长序列建模、生成式推荐模型等多个方向来做深入的研究,对推荐场景的模型做系统性的升级。 【课题内容】 跨模态的对齐和统一表征学习(推荐、内容多模态、自然语言); 推荐模型参数和算力scaling up; 超长序列建模; 生成式推荐模型; 【涉及研究方向】 推荐算法、推荐大模型

更新于 2025-06-05北京