字节跳动大模型搜索算法工程师/专家-电商
任职要求
1、本科及以上学历,计算机、电子、数学等相关专业; 2、在搜索、推荐、搜广推、自然语言处理NLP、自然语言理解NLU、LLM、MLLM、多模态、机器学习、深度学习等一个或多个领域有较深入的研究者优先; 3、熟悉大模型预训练、Post-Training、SFT、RLHF、RL者优先; 4、熟Linux开发环境,熟练使用C++和Python语言; 5、具有良好的问题分析解决能力,沟通协作能力,工作积极主动,能够与团队融洽合作,一起探索新技术,推进技术进步。 加分项: 1、具有优秀的基础算法、扎实的机器学习/深度学习基础,熟悉NLP…
工作职责
团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。 主要工作方向包括: 1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新; 5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。 1、探索搜索引擎与大模型、LLM、MLLM、多模态、机器学习、强化学习等前沿技术的结合,实现搜索引擎全链路革新并进行极致的系统优化,探索提升AI搜索引擎的能力,包含而不限于相关性、权威性、时效性、意图理解能力等;探索LLM适性索引、LLM相关性、生成式召回、排序大模型等; 2、构建大规模高质量数据(数据建设、数据抓取与解析、数据合成等)、训练和优化AI搜索的机器学习模型(多模态内容理解、指令微调、索引筛选、Query分析、Scalable Oversight、Long CoT、模型推理/规划、模型优化、构建全面客观准确的评测体系等); 3、探索推进AI搜索、AIGC创新应用的落地(包含而不限于豆包、电商、抖音、智能硬件、AI找搭配/虚拟穿搭等大模型应用场景),研发以人工智能技术为核心的新技术、新产品,探索满足用户的智能交互需求,提升现实与物理世界的交互能力。
团队介绍:字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品的搜索算法创新和架构研发工作。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1)探索最前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2)探索跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3)探索大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4)探索千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务,方方面面都进行深入研究和创新。 1、探索搜索引擎与大模型、LLM、MLLM、多模态、计算机视觉、机器学习、强化学习等前沿技术的结合,实现搜索引擎全链路革新并进行极致的系统优化,探索提升AI搜索引擎的能力,包含而不限于相关性、权威性、时效性、意图理解能力等;探索LLM适性索引、LLM相关性、生成式召回、排序大模型等; 2、构建大规模高质量数据(数据建设、数据抓取与解析、数据合成等)、训练和优化AI搜索的机器学习模型(多模态内容理解、指令微调、索引筛选、Query分析、Scalable Oversight、Long CoT、模型推理/规划、模型优化、构建全面客观准确的评测体系等); 3、探索推进AI搜索、AIGC创新应用的落地(包含而不限于豆包、电商、抖音、智能硬件、AI找搭配/虚拟穿搭等大模型应用场景),研发以人工智能技术为核心的新技术、新产品,探索满足用户的智能交互需求,提升现实与物理世界的交互能力。
团队介绍 AE搜索算法团队,负责AIDC AliExpress(AE)、JP- AO和天猫淘宝海外等国际化电商搜索业务优化,为全球100多个国家使用不用语言的用户持续电商搜索体验与效率,并结合大模型升级技术与产品体验创新。 多年来团队紧跟工业界和学术界前沿,在多语言Query理解与相关性、国家差异化召回与排序模型、多语言Query导购与大模型在多语言搜索中应用等技术方向持续探索创新,带来业务快速增长同时发表⾼⽔平学术论⽂20+篇(如AAAI、 IJCAI、TKDE、TMM、RecSys、CIKM和ICDM),申请专利15+项。 职位描述 1. 多语言 Query 理解、商品理解和相关性,包括:Query和商品NER、Query类目预测、Query改写与扩展、多语言&跨语言语义相关性等;LLM在多语言电商搜索领域应用,包括:大模型 CT 和 SFT,以及在Query理解、语义相关性、商品理解上的应用; 2. 个性化召回与排序相关技术:基于大规模深度模型的CTR/CVR预估模型及个性化召回模型,包括用户行为序列建模、多目标建模、多模态跨场景迁移建模、国家差异化建模体系建设等; 3. 个性化多语言Query推荐,包括:下拉、底纹、风向标等场域,基于异构行为序列建模、多场景建模的多语言Query推荐技术研究与应用;
我们是阿里国际-Accio算法团队。Accio是阿里巴巴集团的战略级AI原生应用产品,也是全球首个B2B AI Search Agent,我们通过持续探索Agent、LLM、VLM、RL、Reasoning、AI Search等前沿技术,自研基座、Agent系统以及AI Search系统,驱动实现全球B2B电商贸易业务跨越式发展。 职位描述: 1. 负责开发和优化AI原生的全网搜索系统,包括但不限于文本和多模态模型训练、跨模态生成与检索、生成式搜索技术等; 2. 负责搜索系统算法设计与实施,负责搜索系统中的query理解、召回、相关性、排序等关键模块的算法设计与优化; 3. 负责全网商家/商品的Deep Research、全网询盘Agent链路的设计、实现和优化,负责将业界的SOTA Agent模型在业务场景中落地。