字节跳动大模型算法研究员-Seed
任职要求
1、2026届获得本科及以上学历; 2、在语言模型、计算机视觉、多模态、AIGC、机器学习等一个或多个领域有较深入的研究者;具有优秀的基础算法、扎实的机器学习基础; 3、好奇心驱动,具有出色的分析、解决问题的能力,有自主探索解决方案的能力者; 4、具有良好的沟通协作能力,对追求纯粹的技术有强烈热情,工作积极主动,能够与团队融洽合作,一起探索新技术并快速试验想法,推进技术进步。 加分项: 1、在NeurIPS、ICLR、ICML、ACL、CVPR、ICCV 等顶级会议/期刊上发表论文者优先; 2、在ACM/ICPC、NOI/IOl、Top Coder、Kaggle等比赛获奖者优先; 3、在大语言模型、多模态模型、世界模型、RL,主导过大影响力项目者优先。
工作职责
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与大模型机制的基本研究,方向包括但不限于大模型可解释性、可控性;Agent的世界认知、任务规划、自我认知;Multi-Agent的协作与对抗; 2、持续追踪大语言模型/多模态大模型等方向的前沿技术。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、LLM推理和规划;在整个开发过程中增强LLM推理和规划,包括数据采集、模型评估、预训练、SFT、奖励建模和强化学习,以提高LLM的整体性能; 2、通过重写、扩充和生成等方法合成大规模、高质量的数据;如指令调优、偏好对齐、模型优化以提高LLM在各个阶段(预训练、SFT、RLHF)的能力; 3、通过RLHF/RLAIF进行偏好对齐,探索全新的训练范式,优化大模型在文本、图像、语音等多模态上的表现; 4、研究和实施稳健的评估方法,以评估LLM在各个阶段的表现,揭示其能力的潜在机制和来源,并利用这种理解来推动模型改进; 5、探索和优化有效的LLM训练方法(如主动学习、课程学习)和目标,以完善缩放规律,实现卓越的模型性能; 6、相关应用落地,包括内容创作、逻辑推理、代码生成等,深入研究和探索大模型在未来生活中的更多使用场景。
1、加入背景多元的研究团队,和机器学习、计算化学、计算生物等领域的团队成员密切配合,通过合作来追求突破性的研究成果; 2、参与构建和优化覆盖全生物分子类型的复合物结构预测模型,共同定义和开发下一代模型; 3、以复合物结构预测模型为基础,进一步解决多构象和动态预测、亲和力预测、生物分子设计等挑战性问题; 4、基于深度学习和计算生物领域新的研究成果,设计高可扩展的模型架构和更优的生成算法,结合生物领域洞察、数据驱动和物理先验提升效果。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索研究多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术; 2、探索多模态理解与生成交织的基础模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、模型优化;提升数据合成、Scalable Oversight、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力; 3、探索突破包括而不限于多模态RAG,视觉COT与Agent等在内的多模态模型、世界模型进阶能力,构建GUI/游戏等虚拟世界的通用多模态Agent; 4、利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以人工智能技术为核心的新技术、新产品。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责提升大模型的“智商”,全链路(包含评估,Pretrain,SFT,RLHF等)提升大模型的逻辑推理、任务规划等能力; 2、研究数据合成、Scalable oversight,突破数据瓶颈,减轻对人类标注的依赖; 3、研究System 2在推理、规划能力中的应用,用“慢思考”提升效果,优化模型基础能力; 4、探索如何构建稳健的评估方法,全面、客观、公正地评估模型的基础推理规划能力,以及和复杂环境的交互能力; 5、提升模型的工具调用、API交互能力,通过构建Agent、Multi-agent解决复杂问题。