logo of bytedance

字节跳动大模型算法工程师-社交通讯

社招全职A60493A地点:北京状态:招聘

任职要求


1、教育背景:本科及以上学历,计算机科学与技术、数学、统计学、人工智能等相关专业优先;
2、技术能力:精通PythonGoJava等至少一门编程语言,具备扎实的机器学习深度学习理论基础,熟悉大模型训练、微调等核心技术;
3、经验要求:有大模型算法研发、优化经验,熟悉Prompt Engineering、RAGSFT、RL等技术;有社交平台相关算法工作经验,或在多模态数据处理、大模型评测领域有实践成果者优先;
4、创新与学习能力:对新技术有强烈好奇心,具备快速学习与应用前沿算法的能力;善于思考创新,能够结合业务场景提出算法优化与创新方案;
5、团队协作与沟通:良好的团队协作能力,能够与跨部门团队高效沟通,将技术方案转化为业务价值;对数据敏感,具备较强的逻辑分析与问题解决能力。

工作职责


1、模型训练与创新:主导大模型的持续训练、微调及优化工作,通过有监督微调(SFT)、强化学习(RL)等技术,提升模型在社交领域的专业性;探索创新算法与技术,如基于社交关系图谱的个性化提示策略,增强大模型在社交场景下的推理与交互能力;
2、数据挖掘:构建并维护适配抖音社交场景的训练数据集,通过数据清洗、标注与增强,提升数据质量。结合用户行为数据,挖掘数据背后的社交逻辑与用户偏好,为大模型训练提供精准的数据支撑,驱动模型性能提升;
3、大模型评测:制定和实施全方位的大模型评估方案,结合人工评估和自动化评估手段,建立完整的评测体系,确保模型性能的可靠性和稳定性;
4、业务深度协作落地:与产品、运营、设计团队紧密合作,将大模型算法成果转化为实际的社交功能与产品体验;从需求分析到方案设计,全程参与,确保算法能够切实解决业务痛点,助力抖音社交业务增长;
5、前沿技术探索与应用:追踪大模型领域的前沿技术与研究成果,结合抖音社交业务特点,评估新技术的应用可行性。
包括英文材料
学历+
Python+
Go+
Java+
机器学习+
深度学习+
大模型+
算法+
Prompt+
RAG+
SFT+
相关职位

logo of tencent
社招微信基础AI探索

1.负责社交大模型方向的记忆检索、Agent函数调用、风格化基座模型等方向的算法突破; 2.紧密贴合业务,通过后训练(SFT&RL)提升模型的专项问题解决能力; 3.基于微信场景数据提供技术解决方案,探索业界前沿技术在业务中的落地与指标优化。

更新于 2025-10-07
logo of bytedance
社招A176516

1、模型训练与创新:主导大模型的持续训练、微调及优化工作,通过有监督微调(SFT)、强化学习(RL)等技术,提升模型在社交领域的专业性;探索创新算法与技术,如基于社交关系图谱的个性化提示策略,增强大模型在社交场景下的推理与交互能力; 2、数据挖掘:构建并维护适配抖音社交场景的训练数据集,通过数据清洗、标注与增强,提升数据质量;结合用户行为数据,挖掘数据背后的社交逻辑与用户偏好,为大模型训练提供精准的数据支撑,驱动模型性能提升; 3、大模型评测:制定和实施全方位的大模型评估方案,结合人工评估和自动化评估手段,建立完整的评测体系,确保模型性能的可靠性和稳定性; 4、业务深度协作落地:与产品、运营、设计团队紧密合作,将大模型算法成果转化为实际的社交功能与产品体验;从需求分析到方案设计,全程参与,确保算法能够切实解决业务痛点,助力抖音社交业务增长; 5、前沿技术探索与应用:追踪大模型领域的前沿技术与研究成果,结合抖音社交业务特点,评估新技术的应用可行性。

更新于 2025-05-07
logo of bytedance
社招A184454

1、模型训练与创新:主导大模型的持续训练、微调及优化工作,通过有监督微调(SFT)、强化学习(RL)等技术,提升模型在社交领域的专业性;探索创新算法与技术,如基于社交关系图谱的个性化提示策略,增强大模型在社交场景下的推理与交互能力; 2、数据挖掘:构建并维护适配抖音社交场景的训练数据集,通过数据清洗、标注与增强,提升数据质量;结合用户行为数据,挖掘数据背后的社交逻辑与用户偏好,为大模型训练提供精准的数据支撑,驱动模型性能提升; 3、大模型评测:制定和实施全方位的大模型评估方案,结合人工评估和自动化评估手段,建立完整的评测体系,确保模型性能的可靠性和稳定性; 4、业务深度协作落地:与产品、运营、设计团队紧密合作,将大模型算法成果转化为实际的社交功能与产品体验;从需求分析到方案设计,全程参与,确保算法能够切实解决业务痛点,助力抖音社交业务增长; 5、前沿技术探索与应用:追踪大模型领域的前沿技术与研究成果,结合抖音社交业务特点,评估新技术的应用可行性。

更新于 2025-05-07
logo of bytedance
社招A15618

团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 本项目旨在探索推荐领域下的大模型新范式,突破现在持续了较长时间的推荐模型结构和Infra的方案,且效果大幅好于现在的基线模型,在抖音短视频/直播/电商/头条/剪映等多个业务场景上得到应用。推荐领域的大模型是比较有挑战的事情,推荐对工程效率的要求更高,且用户的推荐体验上是个性化的,本课题会以下多个方向来做深入的研究,探索和建设推荐场景的大模型方案,大幅提升推荐模型的天花板。 【课题挑战/必要性】 自然语言领域LLM的出现,效果在众多垂直任务上都好于sota模型,从推荐领域看过去工业级推荐系统在较长的时间没有大幅的变化过。本项目旨在探索推荐领域下的大模型方案,改变现在持续了较长时间的推荐模型结构和Infra的基本范式,且效果大幅好于现在的模型,在抖音短视频/直播等多个业务场景上得到应用。但是怎么做好推荐领域的大模型也是一个比较有挑战的事情,推荐对工程效率的要求更高,且用户的推荐体验上是个性化的,以及如何短视频、直播等体裁上做号内容的表征也是需要被解决的问题,这里会从模型参数scaling up、内容和用户的表征学习、内容理解多模态、超长序列建模、生成式推荐模型等多个方向来做深入的研究,对推荐场景的模型做系统性的升级。 【课题内容】 跨模态的对齐和统一表征学习(推荐、内容多模态、自然语言); 推荐模型参数和算力scaling up; 超长序列建模; 生成式推荐模型; 【涉及研究方向】 推荐算法、推荐大模型

更新于 2025-06-05