字节跳动豆包大模型应用算法工程师-Data AML

校招全职A674782025-08-04地点：深圳状态：招聘

扫码手机上打开

任职要求

1、2026届获得硕士及以上学位，计算机、通信、数学等相关专业；
2、扎实的机器学习/NLP/RL基础，有想法且动手能力强，出色的探索能力，在ACL/EMNLP/NAACL/NeurIPS/ICML/ICLR等顶…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

团队介绍：Data AML是字节跳动的机器学习中台，为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力，并在这些业务的问题上研究一些具有通用性和创新性的算法。同时，也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。

1、专注改进大模型在现实世界复杂任务的效果，追求通用可规模化的方法，包括不限于复杂推理、多模态、自主Agent、以及可扩展监督和大规模数据合成等方法；
2、推动大模型技术在高难度场景中的前沿应用，包括不限于Agent系统、专业咨询、科研协作、深度洞察、个性化教育等高价值场景；
3、面向广泛的现实世界高价值任务，设计科学、严谨的量化评测体系，提升模型的智能水平。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

机器学习+

NLP+

还有更多 •••

登录查看完整学习资料

相关职位

大语言模型应用算法工程师-豆包大模型

社招1年以上A247041

团队介绍：字节跳动豆包大模型团队成立于 2023 年，致力于开发业界最先进的 AI 大模型技术，成为世界一流的研究团队，为科技和社会发展作出贡献。豆包大模型团队在AI领域拥有长期愿景与决心，研究方向涵盖NLP、CV、语音等，在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源，在相关领域持续投入，已推出自研通用大模型，提供多模态能力，下游支持豆包、扣子、即梦等50+业务，并通过火山引擎开放给企业客户。目前，豆包APP已成为中国市场用户量最大的AIGC应用。 1、团队负责公司大模型的研发和应用，研究相关技术在搜索、推荐、广告、创作、对话和客服等领域的全新应用和解决方案，满足用户不断增长的智能交互需求，全面提升用户在未来世界的生活和交流方式；主要工作方向包括： 1）优化&创新RLHF算法训练效率与模型泛化能力； 2）Long CoT技术的实现和应用； 3）多模态大模型（文本、图像、语音）的Posttraining算法； 4）构建高质量、多领域的数据合成方法； 5）探索LLM在情感对话、创作等场景的应用。

更新于 2025-02-18上海

算法工程师/研究员(J65868)

社招0-3年XYZ

各类大模型算法岗位：包括不限于 ✓大模型应用（Rag、Agent的研究等） ✓大模型技术研究 (指令微调、强化学习、推理等) ✓多模态理解与生成研究（文本、图像、视频、音频等）

更新于 2025-02-18北京

前端开发工程师-豆包

社招A41627

1、负责面向AI场景的平台系统产品-豆包的业务前端开发工作； 2、参与通用组件、中后台建站、研发效能等工程化建设； 3、深入发掘和分析业务需求，撰写技术方案和系统实现。

更新于 2025-02-07上海

大模型推理存储系统工程师/专家-Seed

社招A121315

团队介绍：字节跳动豆包大模型团队（Seed）成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限，并探索新的交互。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等，在中国、新加坡、美国等地设有实验室和岗位。豆包大模型团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责机器学习系统存储相关组件的设计和开发，服务于大模型推理的各业务场景（LLM/S2S/VLM/多模态等），包括模型分发加载、KV Cache存储和优化，数据IO性能优化，提高推理TTFT、TBT等核心性能指标； 2、负责设计和实现面向大模型推理的多层级存储系统，综合利用显存、本地内存、分布式内存/磁盘、远端大容量存储系统（HDFS/对象存储）等多种介质进行数据的存储和迁移管理，实现「近计算缓存+远端大容量存储」的一体化分级系统； 3、负责优化大模型KV Cache命中率，从推理框架，流量调度，多级缓存等多个系统纬度入手定制化优化策略；优化数据的读取性能，充分利用近计算侧的NVLink、RDMA高速网络、GPU Direct技术实现数据的高效传输；优化数据副本的存放策略，实现负载流量和存储数据的合理化分布； 4、负责设计和实现高效、易用的数据访问接口，实现和推理框架、引擎的无缝对接，管理KV Cache的生命周期； 5、负责Kubernetes场景下多级存储系统的接入、管理、运维、监控，确保稳定性； 6、负责多机房、多地域、多云场景的系统搭建和容灾，优化跨集群的数据摆放。

更新于 2024-12-20上海