夸克算法实习生-大模型应用方向-搜索召回
任职要求
1、计算机、数学或统计学相关专业硕士及以上学历,在自然语言处理、大规模预训练模型领域有经验; 2、在自然语言理解、深度学习等领域有较深入的研究,熟练使用pytorch/tensorflow等至少一种主流深度学习框架,能够独立实现前…
工作职责
1、负责大规模预训练模型在全网百亿级网页搜索引擎的定向优化及落地工作,主要参与查询理解和搜索召回以及大模型在搜索中落地进行探索应用。 2、基于海量用户行为数据以及人工标注数据,结合自然语言处理、性能优化、数据挖掘、机器学习等前沿技术,支持prompt工程、LLM微调、LLM强化学习等工作。 3、研究方向包括但是不限于大规模预训练技术、文本生成、模型蒸馏/窃取、强化学习等。
1. Agent方向:直接参与到导购Agent的算法研发工作,包含无障碍导购Agent、搜索导购Agent两个Agent项目并结合技术创新与实际业务落地,产出高质量论文、专利与开源成果。包括相关项目的高质量数据构建,支撑复杂任务建模与行为学习,运用大模型SFT、RL等Post-training训练方法并探索 Online RL 等前沿方法,设计并落地“过程监督 + 结果监督”联合训练范式,融合MCTS、ToT、Reflection等推理方法,等等; 2. LLM应用方向:探索基于LLM的Query理解大模型,通过天猫的数据微调大模型生成ID表征向量,在搜索和推荐算法各模块进行深度的探索和应用。包括但不限于语义相关性、类目预测、召回排序等。探索生成式搜索技术(如Query扩展、结果摘要生成),助力搜索从“信息呈现”向“决策辅助”升级; 3. 结合业务需求,设计和扩展LLM的应用场景范围及规模,提高模型微调后再垂直领域的应用及专家模式的架构尝试; 4. 跟踪LLM与Agent领域的国际前沿技术动态,开展前沿算法的研究工作,推动技术创新在业务场景中的落地应用,重点突破复杂推理、GUI Agent、AI搜索等方向的技术沉淀和业务创新。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、利用大模型优化搜索相关性、权威性、时效性等模型,解决各种复杂长尾查询的Ranking问题; 2、利用大模型做DOC理解,筛选优质DOC以及更好支持在线检索; 3、大模型在搜索召回和粗排等阶段的应用。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、利用大模型优化搜索相关性、权威性、时效性等模型,解决各种复杂长尾查询的Ranking问题; 2、利用大模型做DOC理解,筛选优质DOC以及更好支持在线检索; 3、大模型在搜索召回和粗排等阶段的应用。