logo of bytedance

字节跳动大语言模型评测算法实习生-Seed

实习兼职A114889A地点:北京状态:招聘

任职要求


1、本科及以上学历在读,计算机科学、自然语言处理、人工智能等相关专业优先;
2、对大语言模型有浓厚的兴趣和热情,拥有出色的代码编程能力与执行力;
3、工作细心、耐心,有较强的责任心和团队合作精神;
4、LLM的评估是一项既需要一定的前瞻视野,同时又需要将模糊的定义转化为可量化工作的一个问题,因此希望优秀的你能够兼具这二者。

工作职责


日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。
Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。

1、参与大语言模型的评测工作,包括但不限于基础能力、FunctionCall、指令遵循、安全等能力维度的评估;
2、深度参与调研和实施将业内前沿、有价值的基准点引入豆包模型的评估体系中;
3、协助设计和执行评测方案,收集和分析评测数据,提供有价值的反馈和建议;
4、跟踪和研究行业内最新的大语言模型技术和评测方法,为团队提供前沿的知识和见解。
包括英文材料
学历+
NLP+
大模型+
相关职位

logo of bytedance
实习A174072

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动豆包大模型团队(Seed)成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限,并探索新的交互。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 豆包大模型团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索模型在预训练阶段与后训练阶段的内在一致性,跨训练阶段预测模型性能上限; 2、探索从可解释性角度提出更多更深入的基于模型内在机理的评测标准; 3、提出更好的Benchmark,定义模型能力,定义AGI; 4、从评测角度对模型进行Red Teaming,找到模型的短板并针对性提出模型改进; 5、探索全新的模型和智能应用,如Agent Foundation Model,DeepResearch,需要的评测基准。

更新于 2025-04-10
logo of bytedance
实习A110329

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、建立下一代多模态模型评测体系,引导模型向AGI的方向发展:创建针对推理与交互的下一代多模态模型评测Leaderboard,包括而不限于长视频高帧率评估、视频流式交互评估、视觉COT评估、世界模型评估方法,GUI/游戏等虚拟世界的通用多模态Agent评估方法; 2、探索多模态大模型能力边界:追踪业界对于模型能力的边界拓展进程,持续迭代复杂度更高的评测集合,防止基准测试饱和模型过拟合; 3、优化评测工程链路与评测手段:探索自动化评测任务构造和自动化评估方法,提升模型评测效率。

更新于 2025-03-06
logo of bytedance
实习A27697

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、建立下一代多模态模型评测体系,引导模型向AGI的方向发展:创建针对推理与交互的下一代多模态模型评测Leaderboard,包括而不限于长视频高帧率评估、视频流式交互评估、视觉COT评估、世界模型评估方法,GUI/游戏等虚拟世界的通用多模态Agent评估方法; 2、探索多模态大模型能力边界:追踪业界对于模型能力的边界拓展进程,持续迭代复杂度更高的评测集合,防止基准测试饱和模型过拟合; 3、优化评测工程链路与评测手段:探索自动化评测任务构造和自动化评估方法,提升模型评测效率。

更新于 2025-03-06
logo of bytedance
实习A90553A

Top Seed人才计划-豆包大模型研究实习生专项:面向 2025 年 9 月及以后毕业的博士及本硕在读同学,加入我们,你可以自主决定研究课题,与正式员工享受同等权限和资源,和优秀的研究员一起,向智能上限发起挑战。 团队介绍:字节跳动豆包大模型团队(Seed)成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限,并探索新的交互。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。豆包大模型团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、专注改进大模型在现实世界复杂任务的效果,追求通用可规模化的方法,包括不限于复杂推理、多模态、自主Agent、以及可扩展监督和大规模数据合成等方法; 2、推动大模型技术在高难度场景中的前沿应用,包括不限于Agent系统、专业咨询、科研协作、深度洞察、个性化教育等高价值场景; 3、面向广泛的现实世界高价值任务,设计科学、严谨的量化评测体系,提升模型的智能水平。

更新于 2025-03-20