百度视觉模型推理开发实习生(J98660)
任职要求
-计算机或相关专业在读研究生(研究生导师知情且同意) -每周至少线下实习3天,实习期6个月以上 -熟悉Linux环境下,理解类机制,使用C++或Python语言 -具备扎实的计算机科学编程能力,熟悉常用的数据结构…
工作职责
-负责CV深度学习模型和多模态大模型推理部署 -负责深度学习模型移植到多种硬件推理平台 -参与CV模型和多模态大模型推理优化,提升模型推理吞吐量 -参与模型部署工具链开发,提高部署效率
团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。 主要工作方向包括: 1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新; 5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。 课题介绍: 1、课题背景:随着互联网数据规模的爆炸式增长和用户对搜索体验需求的不断提升,传统搜索引擎基于关键词匹配和规则推理的局限性日益凸显。例如,用户意图的复杂性、自然语言的歧义性、多模态数据(文本、图像、视频等)的融合检索需求,以及长尾查询的精准响应等问题,均对搜索系统的智能化提出了更高要求。 近年来,大模型技术(如GPT、BERT、多模态大模型等)在自然语言理解、知识推理和生成任务中展现出强大能力,为智能搜索的语义理解、意图识别和个性化推荐提供了新的技术路径。同时,数据库技术在高效数据存储、索引优化和实时检索方面的持续演进,为构建支持大模型推理的高性能搜索系统奠定了基础。 2、研究方向:本课题旨在结合大模型技术与数据库技术,探索新一代智能搜索系统的核心架构与关键技术,突破传统搜索的语义理解瓶颈,构建更高效、精准且可扩展的智能搜索服务,满足复杂场景下的用户需求。
团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。 主要工作方向包括: 1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新; 5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。 课题介绍: 1、课题背景:随着互联网数据规模的爆炸式增长和用户对搜索体验需求的不断提升,传统搜索引擎基于关键词匹配和规则推理的局限性日益凸显。例如,用户意图的复杂性、自然语言的歧义性、多模态数据(文本、图像、视频等)的融合检索需求,以及长尾查询的精准响应等问题,均对搜索系统的智能化提出了更高要求。 近年来,大模型技术(如GPT、BERT、多模态大模型等)在自然语言理解、知识推理和生成任务中展现出强大能力,为智能搜索的语义理解、意图识别和个性化推荐提供了新的技术路径。同时,数据库技术在高效数据存储、索引优化和实时检索方面的持续演进,为构建支持大模型推理的高性能搜索系统奠定了基础。 2、研究方向:本课题旨在结合大模型技术与数据库技术,探索新一代智能搜索系统的核心架构与关键技术,突破传统搜索的语义理解瓶颈,构建更高效、精准且可扩展的智能搜索服务,满足复杂场景下的用户需求。
1、参与可灵 AIGC 生态产品矩阵的应用设计、开发与优化; 2、负责跟进和探索AI Agent领域最新的技术和趋势,结合具体业务场景,给出工业化落地方案; 3、设计并实现高性能、高并发、高可用的系统架构,解决海量多媒体数据处理、模型推理等工程挑战,持续优化系统性能与稳定性。