阿里巴巴LLM大模型应用算法实习生
任职要求
1. 硕士及以上学历,计算机、数学等相关专业,国际顶会论文发表者优先。 2. 有大规模机器学习,商品理解,个性化推荐,广告,信息检索,自然语言处理相关领域工作经验者优先。 3. 对LLM、智能体(Agent)领域有深入的研究,熟悉常见LLM模型,理解LLM的原理和架构。 4. 具备扎实的机器学习/深度学习基础,熟练掌握深度学习框架,如PyTorch等,并对其底层原理有深入理解。
工作职责
1. 探索基于LLM的Query理解大模型,通过天猫的数据微调大模型生成ID表征向量,在搜索和推荐算法各模块进行深度的探索和应用。包括但不限于语义相关性、类目预测、召回排序等。 2. 探索生成式搜索技术(如Query扩展、结果摘要生成),助力搜索从“信息呈现”向“决策辅助”升级。 3. 结合业务需求,设计和扩展LLM的应用场景范围及规模,提高模型微调后再垂直领域的应用及专家模式的架构尝试。 4. 跟进业界前沿NLP、CV、大模型前沿技术趋势,开展前沿算法的研究工作,结合实际业务需求,将技术应用到实际业务场景。
Top Seed人才计划-豆包大模型研究实习生专项:面向 2025 年 9 月及以后毕业的博士及本硕在读同学,加入我们,你可以自主决定研究课题,与正式员工享受同等权限和资源,和优秀的研究员一起,向智能上限发起挑战。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、优化&创新RLHF算法训练效率与模型泛化能力; 2、Long CoT技术的实现和应用; 3、多模态大模型(文本、图像、语音)的Posttraining算法; 4、构建高质量、多领域的数据合成方法; 5、探索LLM在情感对话、创作等场景的应用。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动豆包大模型团队(Seed)成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限,并探索新的交互。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。豆包大模型团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、优化&创新RLHF算法训练效率与模型泛化能力; 2、Long CoT技术的实现和应用; 3、多模态大模型(文本、图像、语音)的Posttraining算法; 4、构建高质量、多领域的数据合成方法; 5、探索LLM在情感对话、创作等场景的应用。
Top Seed人才计划-豆包大模型研究实习生专项:面向 2025 年 9 月及以后毕业的博士及本硕在读同学,加入我们,你可以自主决定研究课题,与正式员工享受同等权限和资源,和优秀的研究员一起,向智能上限发起挑战。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、优化&创新RLHF算法训练效率与模型泛化能力; 2、Long CoT技术的实现和应用; 3、多模态大模型(文本、图像、语音)的Posttraining算法; 4、构建高质量、多领域的数据合成方法; 5、探索LLM在情感对话、创作等场景的应用。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、负责公司大模型的研发和应用,研究相关技术在搜索、推荐、广告、创作、对话和客服等领域的全新应用和解决方案,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式; 2、优化&创新RLHF算法训练效率与模型泛化能力; 3、Long CoT技术的实现和应用; 4、多模态大模型(文本、图像、语音)的Posttraining算法; 5、构建高质量、多领域的数据合成方法; 6、探索LLM在情感对话、创作等场景的应用。