logo of bytedance

字节跳动大语言模型算法研究员-Seed

社招全职A168184地点:北京状态:招聘

任职要求


1、熟练掌握RL、LLMNLP、机器人、CV、搜索推荐系统的研究或应用经验,熟悉大型模型训练者优先;
2、熟练掌握数据结构算法基础技能,熟练掌握C/C++或Python,有ACM/ICPC、IOI、TopCoder等大赛获奖者优先;
3、有RL、NLP、深度学习等有影响力的项目或…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。
Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。

1、LLM推理和规划;在整个开发过程中增强LLM推理和规划,包括数据采集、模型评估、预训练、SFT、奖励建模和强化学习,以提高LLM的整体性能;
2、通过重写、扩充和生成等方法合成大规模、高质量的数据;如指令调优、偏好对齐、模型优化以提高LLM在各个阶段(预训练、SFT、RLHF)的能力;
3、通过RLHF/RLAIF进行偏好对齐,探索全新的训练范式,优化大模型在文本、图像、语音等多模态上的表现;
4、研究和实施稳健的评估方法,以评估LLM在各个阶段的表现,揭示其能力的潜在机制和来源,并利用这种理解来推动模型改进;
5、探索和优化有效的LLM训练方法(如主动学习、课程学习)和目标,以完善缩放规律,实现卓越的模型性能;
6、相关应用落地,包括内容创作、逻辑推理、代码生成等,深入研究和探索大模型在未来生活中的更多使用场景。
包括英文材料
大模型+
NLP+
推荐系统+
数据结构+
算法+
C+
还有更多 •••
相关职位

logo of bytedance
社招A172966

1、开发自然科学的基础大模型,用于蛋白质结构预测、分子构象生成和蛋白质设计; 2、利用公共基准和数据库评估新的AI/ML方法; 3、与多学科团队密切合作,将创新算法应用于解决前沿挑战。

更新于 2025-06-05上海
logo of bytedance
社招J1XR2

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索研究多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术; 2、探索多模态理解与生成交织的基础模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、模型优化;提升数据合成、Scalable Oversight、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力; 3、探索突破包括而不限于多模态RAG,视觉COT与Agent等在内的多模态模型、世界模型进阶能力,构建GUI/游戏等虚拟世界的通用多模态Agent; 4、利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以人工智能技术为核心的新技术、新产品。

更新于 2021-08-31北京
logo of bytedance
社招A97538A

1、探索研究更多内在奖励的机制,从而激发模型主动学习和自我更新的能力; 2、探索构建长期记忆机制,为下一代高效的推理模型、长序列推理及建模提供基础; 3、探索多模态感知能力的边界,研究如何从海量超低信噪比的多模态数据中可扩展地获取知识,和如何打好多模态融合的基础、构建统一建模的工具; 4、探索模型使用工具和基于视觉系统的行动能力,包括全模态Agent基础建模的新方案、以及复杂环境的交互学习能力。

更新于 2025-04-07北京
logo of bytedance
社招A161238

1、开发自然科学的基础大模型,用于蛋白质结构预测、分子构象生成和蛋白质设计; 2、利用公共基准和数据库评估新的AI/ML方法; 3、与多学科团队密切合作,将创新算法应用于解决前沿挑战。

更新于 2024-07-22上海