字节跳动强化学习研究实习生-Seed

实习兼职A507412025-06-25地点：上海状态：招聘

扫码手机上打开

任职要求

1、硕士及以上学位在读，计算机科学等相关专业优先；
2、具有优秀的基础算法、扎实的机器学习基础；
3、在语言模型、计算机视觉、多模态、AIGC、机器学习等一个或多个领域有较深入的研究者；
4、好奇心驱…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

日常实习：面向全体在校生，为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍：字节跳动Seed团队成立于2023年，致力于寻找通用智能的新方法，追求智能上限。团队研究方向涵盖LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代AI交互等、在中国、新加坡、美国等地设有实验室和岗位。
Seed团队在AI领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的AI研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过50个应用场景。

1、开发更高效的大模型强化学习算法；
2、利用强化学习优化智能体，解决复杂任务。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

算法+

还有更多 •••

登录查看完整学习资料

相关职位

大语言模型AI搜索Agent算法实习生-Top Seed Intern

实习A183941

Top Seed人才计划-豆包大模型研究实习生专项：面向 2025 年 9 月及以后毕业的博士及本硕在读同学，加入我们，你可以自主决定研究课题，与正式员工享受同等权限和资源，和优秀的研究员一起，向智能上限发起挑战。团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等，在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。 1、AI搜索总结Agent研发： 1）设计并实现基于LLM的搜索总结Agent，提升搜索结果的理解、推理与结构化总结能力； 2）探索LLM Reasoning技术（如思维链、多步推理），优化复杂查询的Deep Research模式，实现长文本理解与跨文档信息融合； 3）构建端到端系统，涵盖意图识别、知识检索、结果生成与偏好对齐，提升用户体验； 2、模型优化及应用： 1）通过指令微调（Instruction Tuning）、偏好对齐（RLHF/DPO）等技术优化模型在搜索场景的适应性； 2）探索多模态信息（文本、代码、结构化数据）融合的搜索与生成技术； 3）研究未来生活中的创新应用场景（如个性化知识助手、自动化研究工具），探索技术边界。

更新于 2025-03-18北京

大语言模型AI搜索Agent算法实习生-Top Seed Intern

实习A176762

Top Seed人才计划-豆包大模型研究实习生专项：面向2025年9月及以后毕业的博士及本硕在读同学，加入我们，你可以自主决定研究课题，与正式员工享受同等权限和资源，和优秀的研究员一起，向智能上限发起挑战。团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等，在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。 1、AI搜索总结Agent研发： 1）设计并实现基于LLM的搜索总结Agent，提升搜索结果的理解、推理与结构化总结能力； 2）探索LLM Reasoning技术（如思维链、多步推理），优化复杂查询的Deep Research模式，实现长文本理解与跨文档信息融合； 3）构建端到端系统，涵盖意图识别、知识检索、结果生成与偏好对齐，提升用户体验； 2、模型优化及应用： 1）通过指令微调（Instruction Tuning）、偏好对齐（RLHF/DPO）等技术优化模型在搜索场景的适应性； 2）探索多模态信息（文本、代码、结构化数据）融合的搜索与生成技术； 3）研究未来生活中的创新应用场景（如个性化知识助手、自动化研究工具），探索技术边界。

更新于 2025-03-19上海

大语言模型AI搜索Agent算法实习生-Top Seed Intern

实习A149567

Top Seed人才计划-豆包大模型研究实习生专项：面向2025年9月及以后毕业的博士及本硕在读同学，加入我们，你可以自主决定研究课题，与正式员工享受同等权限和资源，和优秀的研究员一起，向智能上限发起挑战。团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等，在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。 1、AI搜索总结Agent研发： 1）设计并实现基于LLM的搜索总结Agent，提升搜索结果的理解、推理与结构化总结能力； 2）探索LLM Reasoning技术（如思维链、多步推理），优化复杂查询的Deep Research模式，实现长文本理解与跨文档信息融合； 3）构建端到端系统，涵盖意图识别、知识检索、结果生成与偏好对齐，提升用户体验； 2、模型优化及应用： 1）通过指令微调（Instruction Tuning）、偏好对齐（RLHF/DPO）等技术优化模型在搜索场景的适应性； 2）探索多模态信息（文本、代码、结构化数据）融合的搜索与生成技术； 3）研究未来生活中的创新应用场景（如个性化知识助手、自动化研究工具），探索技术边界。

更新于 2025-03-19北京

大语言模型AI搜索Agent算法实习生-Top Seed Intern

实习A118101

Top Seed人才计划-豆包大模型研究实习生专项：面向 2025年 9 月及以后毕业的博士及本硕在读同学，加入我们，你可以自主决定研究课题，与正式员工享受同等权限和资源，和优秀的研究员一起，向智能上限发起挑战。团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等，在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。 1、AI搜索总结Agent研发： 1）设计并实现基于LLM的搜索总结Agent，提升搜索结果的理解、推理与结构化总结能力； 2）探索LLM Reasoning技术（如思维链、多步推理），优化复杂查询的Deep Research模式，实现长文本理解与跨文档信息融合； 3）构建端到端系统，涵盖意图识别、知识检索、结果生成与偏好对齐，提升用户体验； 2、模型优化及应用： 1）通过指令微调（Instruction Tuning）、偏好对齐（RLHF/DPO）等技术优化模型在搜索场景的适应性； 2）探索多模态信息（文本、代码、结构化数据）融合的搜索与生成技术； 3）研究未来生活中的创新应用场景（如个性化知识助手、自动化研究工具），探索技术边界。

更新于 2025-03-18上海