腾讯多模态搜索算法工程师
任职要求
1.计算机视觉/机器学习/模式识别/人工智能/计算机等相关专业硕士以上学历; 2.熟练掌握 Python、c/c++等语言,有丰富的搜索、CV、多模态搜索领域实践和科研经验,熟悉pyTorch/TensorFlow等深度学习…
工作职责
1.参与元宝、QQ浏览器等场景AI搜索场景下文搜图、图搜图、文搜视频等多模搜索算法工作,通过技术优化,提升AI搜索场景下多模搜索效果; 2.工作内容包含但不限于:文图/图图/文视频召回、相关性、排序算法升级、系统优化等; 3.涉及技术包含但不限于:图片理解、图片质量、视频理解、多模态模型训练和调优、搜索召回、搜索相关性、搜索排序等; 4.持续探索前沿多模态搜索技术在AI搜索业务中的落地应用。
团队介绍:字节跳动抖音搜索团队主要负责抖音搜索算法创新和架构研发工作,主要包括短视频、直播、本地生活、视觉搜索等多个业务线。 在这里,你将有机会参与搜索业务的多模态技术研发和落地。用前沿的深度学习算法、海量文本、图片、视频数据,用激动人心的技术给用数亿用户带来更理想的多模态搜索体验。方向可能包括: 1、多模态生成大模型:视频多模态大模型、大规模细粒度分类、自监督学习等模型应用和研究; 2、视觉智能:视频分析、物体检测、主体识别、视频tracking、细粒度分类等技术,真正理解用户需求; 3、视觉搜索体验改进:相关性排序召回、用户行为模型、意图识别等各个搜索模块的体验改进。
1.负责图像检索类产品中的算法设计和优化,紧贴业务需求,持续优化技术方案以提升业务效果; 2.负责目标检测、目标识别、图像检索方向的技术研究和技术能力基建; 3.跟踪前沿研究进展,根据实际应用场景不断改进与优化,并落地业务场景中。
AI的快速发展正在引领信息获取和知识搜索模式的革命性变化。各类智能信息助手正在迅速迭代,逐步向基于大语言模型的自然语言交互式知识获取方式转型。我们团队工作范围包括支付宝搜索、全网搜索、搜索智能体、大模型后训练及应用等。致力于应用前沿的人工智能技术,结合蚂蚁的生态特色,提升用户获取信息的效率和准确性,探索信息获取体验的新边界。 1. 参与和负责AI搜索场景下的核心搜索算法研发,持续提升Query理解、多模态理解、召回排序、RAG生成、智能体规划等环节的效果; 2. 支持多元业务需求的快速迭代,始终以优化用户体验与提升业务价值为目标; 3. 关注AI搜索技术前沿进展和业界先进应用,不断探索,持续创新突破核心技术。
1. 负责Agentic Search(搜索智能体)技术探索和架构研发,支持深度搜索、多模态(文本、图像、视频)检索等应用创新; 2. 设计并实现AI搜索的落地应用,包括利用大模型进行Query理解、任务分解、环境感知、语义检索、校验反思、总结归纳等模块的模型算法优化; 3. 构建和维护面向AI搜索的高质量的检索库,制定完善的数据清洗、标注和预处理规范流程,完成亿级规模检索库的索引与优化,利用AI技术扩充和丰富检索数据,提升检索系统的泛化能力和鲁棒性; 4. 与业务部门(如产品、运营团队)协作,将AI搜索能力嵌入现有工作流(如搜索引擎、智能问答、个性化推荐等),支撑美团场景落地应用。