logo of bytedance

字节跳动大语言模型应用算法工程师-豆包大模型

社招全职1年以上A247041地点:上海状态:招聘

任职要求


1、硕士研究生及以上学历,计算机、通信、数学等相关专业(有数学、编程竞赛的有加分);
2、多年左右NLP/深度学习研发经验,至少1年大模型应用相关实战经验;
3、深入理解LLM技术栈(如RLHF、Prompt Engineering、…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。
豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。

1、团队负责公司大模型的研发和应用,研究相关技术在搜索、推荐、广告、创作、对话和客服等领域的全新应用和解决方案,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式;主要工作方向包括:
1)优化&创新RLHF算法训练效率与模型泛化能力;
2)Long CoT技术的实现和应用;
3)多模态大模型(文本、图像、语音)的Posttraining算法;
4)构建高质量、多领域的数据合成方法;
5)探索LLM在情感对话、创作等场景的应用。
包括英文材料
学历+
NLP+
深度学习+
大模型+
Prompt+
Python+
还有更多 •••
相关职位

logo of bytedance
社招A78654

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责字节跳动机器学习平台的开发,支撑公司相关业务的算法生产与高效迭代; 2、设计和实现机器学习相关的基础设施、框架、工具链等,并推动落地到业务中; 3、探索业界前沿的机器学习相关技术,持续提升平台能力、降低算法使用成本。

更新于 2024-10-23杭州
logo of bytedance
社招A51590

团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、利用大模型优化搜索相关性、权威性、时效性等模型,解决各种复杂长尾查询的Ranking问题; 2、利用大模型做Doc理解,筛选优质Doc以及更好支持在线检索; 3、大模型在搜索召回和粗排等阶段的应用。

更新于 2025-04-16杭州
logo of bytedance
社招A101286

团队介绍:字节跳动Stone-Cross Platform团队成立于2023年,致力于开发业界前沿的应用框架,构建AI模型驱动的前沿系统和基础设施,提升开发者和用户体验。 课题介绍: 课题背景:随着AI大模型研究的不断发展,文本生成、多模态理解以及Agent规划能力有了巨大的提升和突破,以豆包多模态交互、UI-TARS和Operator等GUI Agent、Deepseek-R1推理模型为典型案例,应用的构建以及交互方式迎来了巨大的机遇和变革。我们希望结合AI模型的多模态理解和生成、深度思考,深入AI Agent所需的交互和基础设施,探索大模型在AI应用构建效率和为智能交互体验上的创新。 研究方向: 本课题旨在利用大模型技术开发智能应用交互框架,研究内容包括:围绕大模型设计应用框架,利用大模型提升应用构建效率,如UI理解及代码生成等;使用大模型来理解应用的多模态context及用户意图,进行意图规划及推理执行,完成用户交互;优化编程语言的设计,使其容易被大语言模型理解,自动验证和实现编程语言的自动生成,和编程语言之间的相互转译,从而加速新编程语言生态的构建;通过该课题的研究,我们希望实现更加智能、便捷和高效的应用框架,推动AI驱动的应用交互的普及与发展。 1、参与大模型在应用框架中的算法研究,探索和优化模型对应用的理解和生成能力、AI Agent等技术; 2、研究和开发智能UI交互技术,提升GUI Agent的智能水平、UI的智能化交互和个性化水平; 3、设计跨平台、高性能、大模型便于理解和生成的编程语言; 4、建设和优化应用中Agent Context、Planning、Tool using等能力,提升应用的理解和响应水平; 5、探索多模态数据融合技术,解决复杂场景下的精准推理与决策问题; 6、整理研究数据,撰写技术报告和发表研究论文。

更新于 2025-05-22广州
logo of bytedance
社招A140205

团队介绍:字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品的搜索算法创新和架构研发工作。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1)探索最前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2)探索跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3)探索大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4)探索千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务,方方面面都进行深入研究和创新。 1、探索搜索引擎与大模型、LLM、MLLM、多模态、机器学习、强化学习等前沿技术的结合,实现搜索引擎全链路革新并进行极致的系统优化,探索提升AI搜索引擎的能力,包含而不限于相关性、权威性、时效性、意图理解能力等;探索LLM适性索引、LLM相关性、生成式召回、排序大模型等; 2、构建大规模高质量数据(数据建设、数据抓取与解析、数据合成等)、训练和优化AI搜索的机器学习模型(多模态内容理解、指令微调、索引筛选、Query分析、Scalable Oversight、Long CoT、模型推理/规划、模型优化、构建全面客观准确的评测体系等); 3、探索推进AI搜索、AIGC创新应用的落地(包含而不限于豆包、电商、抖音、智能硬件、AI找搭配/虚拟穿搭等大模型应用场景),研发以人工智能技术为核心的新技术、新产品,探索满足用户的智能交互需求,提升现实与物理世界的交互能力。

更新于 2025-02-25北京