字节跳动豆包AI搜索架构工程师-Seed大模型人才校招
任职要求
1、2027届获得本科及以上学历,计算机、电子信息、软件工程等相关专业; 2、具备优秀的代码能力(C++/Golang/Python)、数据结构和基础算法功底,以及扎实的软件工程基础(包括系统设计、API开发和代码质量控制); 3、对大模型方向充满热情,不断探索前沿技术领域并持续接受新挑战,同时有强烈的学习欲望,对新技术抱有足够热情和好奇心,愿意沿AGI方向进行持续探索; 4、对系统性能优化、AI基础设施建设及前沿模型技术有浓厚兴趣,具备良好的协作与自驱能力…
工作职责
Seed 大模型人才校招,是字节跳动 Seed 面向高校人才推出的招聘项目。我们始终相信,真正重要的技术进步来自对高难度问题的持续挑战。面对 AI 时代的巨大机遇,Seed 团队并不止步于模型迭代,而是选择进入技术深水区,推进下一代 AI 范式突破,不断探索智能的边界与上限。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限,为科技和社会发展作出贡献。 Seed 团队在 AI 领域拥有长期愿景与决心,团队研究方向涵盖 MLLM、GenMedia、AI for Science、机器人等,在中国、新加坡、美国等地设有实验室和岗位。目前,团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、即梦、TRAE 等超过 50 个应用场景,并通过火山引擎开放给企业客户。第三方数据显示,豆包 App 用户量在中国市场排名第一,豆包大模型日均 Token 调用量行业领先。 1、建设豆包AI搜索,搭建完整RAG功能的LLM搜索引擎; 2、针对LLM搜索中的各个环节,如联网检索、大模型推理进行优化; 3、设计和搭建在离线个性化AI搜索能力,实现对用户更准确的问答; 4、持续建设更灵活、合理、功能更强大的架构以保障快速发展的业务可以高效达成。
Seed 大模型人才校招,是字节跳动 Seed 面向高校人才推出的招聘项目。我们始终相信,真正重要的技术进步来自对高难度问题的持续挑战。面对 AI 时代的巨大机遇,Seed 团队并不止步于模型迭代,而是选择进入技术深水区,推进下一代 AI 范式突破,不断探索智能的边界与上限。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限,为科技和社会发展作出贡献。 Seed 团队在 AI 领域拥有长期愿景与决心,团队研究方向涵盖 MLLM、GenMedia、AI for Science、机器人等,在中国、新加坡、美国等地设有实验室和岗位。目前,团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、即梦、TRAE 等超过 50 个应用场景,并通过火山引擎开放给企业客户。第三方数据显示,豆包 App 用户量在中国市场排名第一,豆包大模型日均 Token 调用量行业领先。 1、下一代搜索问答Agent构建 1)设计基于LLM的端到端智能问答系统,覆盖意图理解、查询改写、检索增强、多源信息融合与高质量答案生成; 2)探索Deep Research能力,解决复杂问题、多轮对话与跨文档推理场景; 2、模型能力演进与前沿探索 1)推动Reasoning能力落地(CoT/多步推理/自我反思与验证),提升复杂问题求解能力; 2)探索RL Scaling、多目标优化等前沿方向,持续提升模型智能上限; 3)构建Agentic能力,打造具备自主决策能力的智能系统; 3、高价值场景落地如电商/本地生活等 1)打造从“信息获取→理解→决策”的一体化体验(如商品对比、导购推荐、生活服务决策); 2)融合结构化数据与实时信息,实现多模态、多源知识协同推理; 4、评测体系与工程闭环建设 1)构建覆盖真实性、时效性、权威性、相关性与用户体验的评测体系; 2)打通数据-模型-系统优化闭环,持续提升效果与工程效率。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、AI搜索总结Agent研发: 1)设计并实现基于LLM的搜索总结Agent,提升搜索结果的理解、推理与结构化总结能力; 2)探索LLM Reasoning技术(如思维链、多步推理),优化复杂查询的Deep Research模式,实现长文本理解与跨文档信息融合; 3)构建端到端系统,涵盖意图识别、知识检索、结果生成与偏好对齐,提升用户体验; 2、模型优化及应用: 1)通过指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术优化模型在搜索场景的适应性; 2)探索多模态信息(文本、代码、结构化数据)融合的搜索与生成技术; 3)研究未来生活中的创新应用场景(如个性化知识助手、自动化研究工具),探索技术边界。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、利用大模型优化搜索相关性、权威性、时效性等模型,解决各种复杂长尾查询的Ranking问题; 2、利用大模型做DOC理解,筛选优质DOC以及更好支持在线检索; 3、大模型在搜索召回和粗排等阶段的应用。
团队介绍:字节跳动豆包大模型团队(Seed)成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限,并探索新的交互。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 豆包大模型团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、以自研推理引擎为中心的在线推理服务和近离线批式推理任务框架,负责超大规模机器学习系统架构的设计开发,解决系统高并发、高可靠性、高可扩展性等技术难关,为搜索、推荐、审核等业务提供深度模型推理全场景端到端解决方案; 2、针对PyTorch、TensorFlow等框架提供高自动化、极致性能的模型优化方案,技术方案不限于子图匹配、编译优化、模型量化、异构硬件等; 3、面向全球多地域超大规模GPU算力集群,通过弹性调度、GPU超卖、任务编排等方式不断提升算力利用率; 4、与算法部门深度合作,进行算法与系统的联合优化。