logo of bytedance

字节跳动基于预训练大模型的端到端生成式搜索技术研究-搜索(北京/上海/杭州)

校招全职A08000地点:北京状态:招聘

任职要求


1、2027届毕业,获得博士学位,人工智能、计算机、自然语言处理计算机视觉等相关专业优先;
2、在人工智能领域顶级会议上有发表论文或有深入研究经历者优先;
3、…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、红果短剧、番茄小说、AI搜索等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。
我们使用前沿的机器学习\大模型技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,致力于支撑字节跳动持续多元化的产品创新和高速的业务增长、基于大模型革新和重塑下一代搜索技术体系,充分给同学们提供成长自我的机会。
主要工作方向包括:
1、探索前沿的NLP技术:全面基于LLM的Query分析、相关性、个性化预估、满意度评估、生成式检索等,全链路应用LLM/VLM,每个细节都充满挑战;
2、跨模态匹配技术:进行多模态预训练,在超大规模的多模态表征、匹配、生成等多个技术方向上持续突破,打造世界领先的多模态搜索系统;
3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;
4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新;
5、推荐技术:基于超大规模机器学习、因果推断、大模型推理等技术手段,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。

课题介绍:随着大模型技术的快速发展,AI搜索领域迎来了新的机遇和挑战。传统搜索技术在面对海量数据、多模态信息以及用户多轮复杂需求时,开始暴露出很多问题。因此需要基于大模型来构建下一代AI搜索系统,提升搜索系统的智能化水平,优化用户体验,具体目标包括:
1、探索大模型与排序算法的结合,提升个性化排序的精度和用户体验。
2、探索基于多模态预训练的端到端生成式搜索大模型
3、探索基于大模型Agent技术,提升复杂多义Query和多轮搜索下的用户满意度。

课题挑战:
1、个性化排序的挑战:传统排序算法难以充分利用多模态信息,且模型复杂度有限,无法满足用户对精准化和个性化搜索的需求;
2、超大规模检索排序的挑战:传统的基于判别式的级联排序系统,难以满足搜索千亿级别候选的检索排序效率需求;
3、搜索需求日益复杂的挑战:用户搜索需求的复杂度在不断增加,传统搜索框架难以在多轮对话下,准确理解长难、多义Query的语义,导致搜索结果满意度低。

课题价值:
1、技术价值:突破传统搜索技术瓶颈,构建大模型Agent驱动的下一代AI搜索架构,解决个性化排序、超大规模检索排序、复杂搜索需求理解满足等行业难题;
2、业务价值:大幅度提升搜索的用户体验和满意度,带动搜索场景LT和主动搜索心智的提升。
包括英文材料
学历+
NLP+
OpenCV+
机器学习+
还有更多 •••
相关职位

logo of bytedance
实习A106228

团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、红果短剧、番茄小说、AI搜索等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。 我们使用前沿的机器学习\大模型技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,致力于支撑字节跳动持续多元化的产品创新和高速的业务增长、基于大模型革新和重塑下一代搜索技术体系,充分给同学们提供成长自我的机会。 主要工作方向包括: 1、探索前沿的NLP技术:全面基于LLM的Query分析、相关性、个性化预估、满意度评估、生成式检索等,全链路应用LLM/VLM,每个细节都充满挑战; 2、跨模态匹配技术:进行多模态预训练,在超大规模的多模态表征、匹配、生成等多个技术方向上持续突破,打造世界领先的多模态搜索系统; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新; 5、推荐技术:基于超大规模机器学习、因果推断、大模型推理等技术手段,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。 课题介绍:随着大模型技术的快速发展,AI搜索领域迎来了新的机遇和挑战。传统搜索技术在面对海量数据、多模态信息以及用户多轮复杂需求时,开始暴露出很多问题。因此需要基于大模型来构建下一代AI搜索系统,提升搜索系统的智能化水平,优化用户体验,具体目标包括: 1、探索大模型与排序算法的结合,提升个性化排序的精度和用户体验。 2、探索基于多模态预训练的端到端生成式搜索大模型 3、探索基于大模型Agent技术,提升复杂多义Query和多轮搜索下的用户满意度。 课题挑战: 1、个性化排序的挑战:传统排序算法难以充分利用多模态信息,且模型复杂度有限,无法满足用户对精准化和个性化搜索的需求; 2、超大规模检索排序的挑战:传统的基于判别式的级联排序系统,难以满足搜索千亿级别候选的检索排序效率需求; 3、搜索需求日益复杂的挑战:用户搜索需求的复杂度在不断增加,传统搜索框架难以在多轮对话下,准确理解长难、多义Query的语义,导致搜索结果满意度低。 课题价值: 1、技术价值:突破传统搜索技术瓶颈,构建大模型Agent驱动的下一代AI搜索架构,解决个性化排序、超大规模检索排序、复杂搜索需求理解满足等行业难题; 2、业务价值:大幅度提升搜索的用户体验和满意度,带动搜索场景LT和主动搜索心智的提升。

更新于 2026-04-13北京
logo of netease
社招2-5年网易有道

我们正在寻找一位AI算法应用工程师,加入我们的技术团队。 该职位将负责开发和优化我们的基于LLM的大模型AI应用,预训练、基座需求较少。重点在于AI应用的开发阶段,后续可能会有SFT或DPO的需求。开发基于大模型的应用产品,以教育行业落地为导向,实现技术价值最大化。 工作职责: 1.负责企业应用中生成式AI能力的设计、开发和部署,提供更好的用户体验 2.结合工作流、提示工程、模型选择、模型微调等技术,支持关键产品功能 3.开发并维护我们使用大型语言模型能力的服务,保证算法服务的稳定性和可观测性 4.跟进前沿趋势,为团队调研引入新的AI应用场景

更新于 2025-04-16北京
logo of didi
社招技术

公司介绍 滴滴于 2016 年组建自动驾驶技术研发部门,致力于打造世界领先的 L4 级自动驾驶技术,通过科技让出行更安全、更高效。我们相信,将自动驾驶技术部署在共享出行车队中,将创造最大的社会价值。依托滴滴在出行领域的 先进技术、海量数据、丰富经验和完整的出行平台生态,我们正在打造并运营世界领先的自动驾驶 Robotaxi 车队,推动自动驾驶在城市复杂交通场景中的规模化落地。 职位描述 作为感知团队的一员,你将与国内外顶尖人才一起,研究和开发自动驾驶领域的前沿算法,直接赋能 L4 Robotaxi 的大规模部署。 你将面向真实城市道路场景中的多样化挑战,利用多模态传感器(LiDAR、Camera、Radar 等)设计、开发并优化感知算法,解决物体识别、障碍物检测、场景理解、意图预测与大模型赋能等核心问题。 在这里,你将有机会: 与中美两地的优秀工程师和科学家合作,参与世界级的技术竞争; 深入研究并推动最前沿的学术成果在产业中的落地; 在全球最大出行平台之一的业务场景中,实现科研成果的规模化应用。 主要方向与职责: 你将在以下方向中选定一个或多个方向深入负责,并承担从研发到落地、从算法到系统的端到端职责: (一)物体识别与跟踪 设计并实现基于 LiDAR / Camera / Radar 的多模态检测模型,识别车辆、行人、自行车、静态障碍物、交通标志等 提升精度、召回率与抗扰性(抗遮挡、夜间、恶劣天气、长尾类别) (二)通用障碍物识别 识别未知类别 /未训练类别的障碍物 基于异常检测 /开放类别识别的算法研究与工程实现 在非结构化环境(施工区域、道路损坏、落物等)中提升鲁棒性 (三)场景和意图理解 语义分割、实例分割、道路 /车道/交通标志/交通灯等结构物识别 场景理解,例如施工区域识别、可通行区域识别等 意图理解,例如行人动作识别、起步意图识别等 交互和事件识别,例如多方交互、交通规则冲突、非规范驾驶行为等 (四)感知大模型 /多模态 探索或应用预训练多模态大模型,将视觉、语言、地图/文本信息融合以增强感知能力 零样本 / 少样本 / 跨域泛化的策略研发 将大模型成果迁移到真实车队感知系统中,提升复杂场景下的鲁棒性 (五)模型评估、验证 构建完整的评估管道,包括离线评估 + 真实道路 + 模拟环境测试,支持回归检测与性能监控 指标体系设计 (Precision, Recall, IoU, latency, false positives rate 等)

更新于 2026-01-06北京
logo of meituan
社招食杂零售

1、负责美团电商零售业务领域大模型应用研发,包括智能助手、内容生成、基于大模型的预测、智能决策规划等,端到端提升应用效果。 2、负责大模型前沿技术探索,沉淀相关算法技术最佳实践,包括模型微调、垂直领域知识增强、偏好对齐、推理效果优化、助手开发等。 3、能深入业务,挖掘大模型在零售经营各个环节的创新应用机会点,提升商品经营、供应链物流运营、履约服务方面的智能化水平。

更新于 2025-06-22北京|上海