logo of bytedance

字节跳动大语言模型AI搜索算法工程师-豆包大模型

社招全职A51590地点:杭州状态:招聘

任职要求


1、优秀的代码能力、数据结构和基础算法功底,熟练掌握C/C++Python;
2、熟悉深度学习LLM相关的算法和技术,有一定的算法应用经验;
3、拥有出色的数据和问题分析能力,对新问题能够独立探索解决方案;
4、良好的沟通协作能力,能和团队一起探索新技术,推进技术进步;
5、有搜索算法经验以及ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先。

工作职责


团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。
豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。

1、利用大模型优化搜索相关性、权威性、时效性等模型,解决各种复杂长尾查询的Ranking问题;
2、利用大模型做Doc理解,筛选优质Doc以及更好支持在线检索;
3、大模型在搜索召回和粗排等阶段的应用。
包括英文材料
数据结构+
算法+
C+
C+++
Python+
深度学习+
大模型+
Kaggle+
相关职位

logo of bytedance
社招A71419A

团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、利用大模型优化搜索相关性、权威性、时效性等模型,解决各种复杂长尾查询的Ranking问题; 2、利用大模型做Doc理解,筛选优质Doc以及更好支持在线检索; 3、大模型在搜索召回和粗排等阶段的应用。

更新于 2025-02-18
logo of bytedance
社招A100639A

团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、利用大模型优化搜索相关性、权威性、时效性等模型,解决各种复杂长尾查询的Ranking问题; 2、利用大模型做Doc理解,筛选优质Doc以及更好支持在线检索; 3、大模型在搜索召回和粗排等阶段的应用。

更新于 2025-02-18
logo of bytedance
社招A109086

1、深入探索LLM在搜索场景中的推理能力与深度研究(Deep Research)模式,优化信息整合与总结效果,打造高效、精准的智能搜索产品,推动AI技术在实际应用中的突破; 2、AI搜索总结Agent研发: 1)设计并实现基于LLM的搜索总结Agent,提升搜索结果的理解、推理与结构化总结能力; 2)探索LLM Reasoning技术(如思维链、多步推理),优化复杂查询的Deep Research模式,实现长文本理解与跨文档信息融合; 3)构建端到端系统,涵盖意图识别、知识检索、结果生成与偏好对齐,提升用户体验; 3、模型优化及应用: 1)通过指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术优化模型在搜索场景的适应性; 2)探索多模态信息(文本、代码、结构化数据)融合的搜索与生成技术; 3)研究未来生活中的创新应用场景(如个性化知识助手、自动化研究工具),探索技术边界。

更新于 2025-02-19
logo of bytedance
社招A249732

1、深入探索LLM在搜索场景中的推理能力与深度研究(Deep Research)模式,优化信息整合与总结效果,打造高效、精准的智能搜索产品,推动AI技术在实际应用中的突破; 2、AI搜索总结Agent研发: 1)设计并实现基于LLM的搜索总结Agent,提升搜索结果的理解、推理与结构化总结能力; 2)探索LLM Reasoning技术(如思维链、多步推理),优化复杂查询的Deep Research模式,实现长文本理解与跨文档信息融合; 3)构建端到端系统,涵盖意图识别、知识检索、结果生成与偏好对齐,提升用户体验; 3、模型优化及应用: 1)通过指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术优化模型在搜索场景的适应性; 2)探索多模态信息(文本、代码、结构化数据)融合的搜索与生成技术; 3)研究未来生活中的创新应用场景(如个性化知识助手、自动化研究工具),探索技术边界。

更新于 2025-02-19