阿里巴巴淘天算法技术-搜索召回算法工程师-杭州/北京
任职要求
1. 计算机科学、人工智能、机器学习或相关领域的硕士或博士学历。 2. 在深度学习和自然语言处理领域有丰富的经验,熟悉BERT、GPT等预训练模型,并具备跨模态数据处理经验。 3. 能够熟练使用深度学习框架,如PyTorch、TensorFlow等,并有大规模分布式训练经验。 4. 对图像处理、语音处理等领域的相关技术有较深的理解,尤其是在电商数据分析和处理方面有经验者优先。 5. 具备良好的团队合作和沟通能力,能够与跨职能团队紧密合作,解决复杂的电商数据处理和模型优化问题。 6. 具有学术论文发表、专利申请或公开讲座的历史记录者优先考虑。
工作职责
团队背景: 淘宝文本搜索算法团队是淘天集团内专注于创新和优化搜索技术的核心团队。我们的任务是通过持续研发高效、精准的搜索算法,以提升用户的在线购物体验和满意度,进而推动电商平台的商业成功。 岗位职责: 1. 设计和参与升级淘宝电商搜索系统的整体召回算法框架,包括但不限于倒排索引检索、多模态语义向量召回检索、生成式检索以及个性化检索。 2. 负责研发和优化电商BERT类型的多模态预训练模型,以应用于电商领域中搜索召回的稀疏检索、稠密检索,以及相关性模型、Query理解等多种任务中。 3. 研究和应用最新的可学习稀疏检索算法和倒排索引技术,以提高系统的搜索相关商品召回率,推动淘宝电商搜索倒排系统向高效、智能化在线截断方向演进。 4. 设计、实现和优化基于大型预训练模型的稠密检索系统,处理大规模电商数据,包括商品信息、用户搜索日志等,充分利用样本技术提高搜索结果的相关商品召回率,以提供高效的搜索体验;并结合近似最近邻搜索(Approximate Nearest Neighbor, ANN)算法,同时在表征和索引上协同优化商品搜索召回的性能。 5. 负责淘宝电商商品搜索领域生成式大模型商品检索方向的优化与应用,打造垂直领域业界标杆;研究商品索引结构设计、大模型生成式商品检索技术、大模型预训练的目标与下游商品检索任务对齐等技术。 6. 负责设计、实现和优化电商领域的个性化搜索召回系统,结合行为序列预训练建模技术,以提高搜索结果的个性化匹配和用户满意度;实现和优化电商领域商品维度的效率模型与退款率模型。
面向AI内容创作场景,负责内容搜索与推荐系统的算法设计、优化及落地,通过精准的算法策略提升内容分发效率与用户体验,支撑AI生成内容(AIGC)、创作者生态等核心业务的增长。 岗位职责: 1.算法设计与优化:负责AI内容创作场景下推荐算法与搜索算法的研发迭代,包括但不限于召回、排序、过滤、个性化推荐等模块,优化内容匹配精准度与用户点击率、停留时长等核心指标。 2.数据驱动迭代:基于用户行为数据、内容特征数据等,构建算法评估体系,通过AB测试等方式验证算法效果,持续迭代优化推荐策略,解决冷启动、多样性不足等实际业务问题。 3.特征工程与模型搭建:参与内容特征、用户特征的挖掘与构建,结合场景需求选择或改进合适的推荐模型(如协同过滤、深度学习模型等),提升模型预测精度与泛化能力。 4.系统协同与落地:与工程、产品、数据等团队协作,将算法方案转化为可落地的技术实现,保障推荐系统的高可用性、低延迟与稳定性,适配AI内容创作场景的动态变化需求。 5.技术探索与沉淀:跟踪推荐算法、AI大模型在内容领域的应用动态,探索大模型与推荐系统结合的创新方向(如生成式推荐、意图理解增强等),沉淀算法研发经验与技术方案。
社区搜索: “遇事不决小红书”,小红书已经成为越来越多年轻人的日常搜索首选,超过 70% 的活跃用户在小红书上有主动搜索行为。社区搜索团队负责小红书搜索效果优化和前沿技术的探索,致力于打造中国最大的生活搜索引擎。 搜索是大模型技术应用最早和最广泛的ToC场景,小红书搜索算法团队致力于使用大模型革新传统搜索技术,包括但不限于AI搜索、生成式召回、基于LLM的新相关性范式、生成式推荐、大规模个性化预估、多模态大模型搜索等等;除此之外,前沿技术研究与落地也是小红书搜索算法团队重要的研究课题,小红书搜索团队每年至少发表二十余篇顶级学术会议论文,我们期待具有探索精神的你加入我们,一起参与充满挑战的新一代搜索引擎的建设 广告搜索: 1、精准理解用户搜索意图,洞察用户需求,对 Query 和多模态广告物料进行准确分析; 2、面向亿级别物料库构建稳定、相关和高效的搜索广告召回算法 & 架构设计,提升广告匹配效率,促进广告高效投放。 电商搜索: 1、触发策略:用户数据理解、深度匹配,传统匹配、用户意图识别、query纠错/改写、相关性建模等; 2、质量预估:点击率、转化率、客单价、交易额预估等; 3、机制设计:排序机制、流量预估、多样性机制等; 4、创意优化:商品图片、标题、优惠信息等展示创意优化。
社区搜索: “遇事不决小红书”,小红书已经成为越来越多年轻人的日常搜索首选,超过 70% 的活跃用户在小红书上有主动搜索行为。社区搜索团队负责小红书搜索效果优化和前沿技术的探索,致力于打造中国最大的生活搜索引擎。 搜索是大模型技术应用最早和最广泛的ToC场景,小红书搜索算法团队致力于使用大模型革新传统搜索技术,包括但不限于AI搜索、生成式召回、基于LLM的新相关性范式、生成式推荐、大规模个性化预估、多模态大模型搜索等等;除此之外,前沿技术研究与落地也是小红书搜索算法团队重要的研究课题,小红书搜索团队每年至少发表二十余篇顶级学术会议论文,我们期待具有探索精神的你加入我们,一起参与充满挑战的新一代搜索引擎的建设 广告搜索: 1、精准理解用户搜索意图,洞察用户需求,对 Query 和多模态广告物料进行准确分析; 2、面向亿级别物料库构建稳定、相关和高效的搜索广告召回算法 & 架构设计,提升广告匹配效率,促进广告高效投放。 电商搜索: 1、触发策略:用户数据理解、深度匹配,传统匹配、用户意图识别、query纠错/改写、相关性建模等; 2、质量预估:点击率、转化率、客单价、交易额预估等; 3、机制设计:排序机制、流量预估、多样性机制等; 4、创意优化:商品图片、标题、优惠信息等展示创意优化。
1、负责GEB广告投放中的各种策略和算法优化,即定向、召回、精排、混排、出价等各阶段模型、策略的优化,极致优化变现效率和广告ROI; 2、深入垂直行业广告诉求,在策略/出价/召回/排序/ROAS等方向,为广告主提供End2End产品解决方案; 3、负责利用策略和模型手段,从用户生态、投放体验、长期可持续的广告业务等方面,探索最新的商业化变现技术和商业产品设计,平衡变现效率和用户体验关系,为广告长期增长负责; 4、参与CTR,CVR等广告模型的设计、开发和迭代,跟踪深度学习、计算广告、推荐系统等最新前沿研究成果和竞赛动态,快速实现并落地应用于实际任务中,结合实际问题开展数据分析和迭代优化,提出创新性解决方案; 5、深入原生/激励/新样式互动等特色业务场景,设计并落地模型、策略一体化方案,推动业务全面发展。