百度搜索算法实习生(J91990)
实习兼职MEG地点:北京状态:招聘
任职要求
- 计算机/人工智能相关专业,有丰富的搜索/广告/推荐算法经验者优先 - 深度熟悉多模态理解相关算法者优先,具有跨模态检索或大模型重排序项目经验者加分 - 有扎实的大模型基础,具备大模型post-training、sft、rl等相关经验者优先 - 发表过计算机领域顶会论文、知名竞赛获奖等经历者优先 - 具有较好的团队合作沟通能力、问题分析能力,有较强的责任心和自驱力
工作职责
负责百度整页、视频、图片等搜索业务,运用前沿技术重塑搜索信息交互方式,提升整页、视频、图片等用户体验,实习内容包括但不限于: - 迭代亿级资源库的召回排序机制,构建多目标融合建模体系,提升整体搜索体验 - 负责NLP方向相关技术研发,包括不限于用户意图理解、语义对齐、搜索结果rerank等 - 主导超大规模搜索CTR预估模型优化,重点攻关面向搜索场景的多模态用户行为序列建模算法 - 优化多模态内容理解与跨模态语义匹配算法,探索基于VLM的重排序框架,融合多模态内容信息进行端到端用户感知优化
包括英文材料
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
SFT+
https://cameronrwolfe.substack.com/p/understanding-and-using-supervised
Understanding how SFT works from the idea to a working implementation...
相关职位
实习D3967
1. 通过语言模型、相关性建模、序列到序列生成、大模型SFT等手段,优化搜索词补全、搜索词推荐等业务场景,带来快手用户搜索次数和搜索体验的增长; 2. 基于LLM、多模态生成模型等前沿技术,结合用户行为和视频内容理解,探索为视频看后搜等场景生成优质搜索词; 3. 在快手海量视频及用户数据下,通过用户/视频表征学习、序列建模等技术创新,挖掘对排序有用的特征信息,提升点击与消费时长预估,持续优化大规模推荐系统的召回、排序算法。
更新于 2025-05-08

实习技术类
职位描述 1、利用大规模机器学习算法对内容搜索场景实时兴趣进行建模,提升点击转化效率; 2、负责优化得物商品内容化场景用户内容关系挖掘,优化内容的召回排序逻辑; 3、对用户、商家的行为做深入的理解和分析,制定针对的算法策略赋能供需两端。
更新于 2024-04-16
实习内容理解
1、短文本理解方向。对海量Query进行自动化的改写、实体抽取等,使得搜索结果更精准; 2、长文本理解方向。对复杂的长文本笔记进行多模态理解、标签建设,为下游提供高质量特征; 3、跟踪业界最新研究成果,并应用到实际产品中;
更新于 2025-09-10