logo of bytedance

字节跳动搜索推荐算法专家-Data

社招全职A165186地点:上海状态:招聘

任职要求


1、基础要求:较好的算法设计能力和工程实现能力,有机器学习/强化学习/NLP应用(其一)的实践经验;
2、具备良好的沟通和表达能力,对好的用户体验有自己的认识,有较好的产品意识者优先。

加分项:
1、有推荐系统优化经验者优先;
2、有大规模NLP语言模型预训练经验优先;
3、参加过ACM等竞赛并取得好名次者优先。

工作职责


团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。

1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;
2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力;
3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;
4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新;
5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。
包括英文材料
算法+
机器学习+
强化学习+
NLP+
相关职位

logo of bytedance
社招2年以上A21012

团队介绍:Data-电商-知识图谱团队,通过实体挖掘、关系抽取、知识融合等技术手段,将海量的非结构化文本进行结构化建模,构建起了大规模的电商知识图谱,支持电商业务的发展;同时,结构化的电商知识也能融入大规模的预训练模型,进一步提升在各个下游任务上的性能。我们利用这些前沿的NLP技术落地到图谱构建和下游的多个业务场景:商品/短视频分类和属性识别、评价情感分析、短标题生成等。此外,为支持国际化电商业务发展,在多语言、低资源等诸多新挑战下,我们积极探索利用跨语言迁移提升目标语言的模型、利用知识迁移去缓解低资源场景下的标注数据稀缺难点等课题,助力国际化电商知识图谱的快速建设,为业务的蓬勃发展提供助力。 团队在电商货品供给和商品成长业务中寻找商品侧建模算法专家,负责搭建商品和商家维度的预测模型。 1、电商货品供给提升:基于抖音平台的商品和商家信息,运用机器学习和深度学习等相关技术,进行商品同款识别,用于提升供给、新品识别等场景; 2、单商品侧建模预测:基于抖音平台的直播间、短视频、货架场等电商数据,预测商品销量、爆款潜力、拉新复购潜力等不同维度的指标,预测结果用于提升推荐搜索分发模型的流量效率,以及促进平台商家商品经营动作,提高商品销量; 3、参与数据到算法和业务落地的全流程:包括但不限于深度数据分析、特征工程、算法模型设计、评估、迭代和上线,并持续探索最前沿技术。

更新于 2024-04-29
logo of kuaishou
社招1年以上D4899

1、负责搭建快手NLP技术体系,包括但不限于文本分类、知识图谱、翻译、对话等; 2、与业务部门进行沟通与协作,交付满足产品需求的核心算法模型与能力。

更新于 2025-04-11
logo of bytedance
社招5年以上A127410

团队介绍:字节跳动基础架构数据库团队,致力于构建认知型数据基础设施,持续定义数据技术的未来边界。团队基于全栈自研技术,打造了涵盖关系型数据库、NoSQL 数据库、大规模图平台、多模态搜索、云原生中间件等十余项产品的数据库矩阵,用独创的技术架构实现事务处理、混合查询、智能检索等全场景覆盖。我们不仅支撑集团核心业务,更通过火山引擎为客户提供具备企业级稳定性的数据库产品,助力客户以数据驱动实现业务增长。团队在大规模分布式架构、极致性能计算/存储引擎、软硬协同优化等领域具备顶尖技术积淀。面向 AI 时代,我们正在突破传统架构边界:一方面深化 AI 原生驱动内核、AI 算子优化等创新方向,推动数据库向智能 Copilot 演进;另一方面聚焦超大规模图计算、分布式跨模态数据联邦查询等前沿领域,构建支持跨模态数据管理的下一代设施。我们践行“务实浪漫”的极客文化,既在 VLDB 、SIGMOD 等顶级会议持续输出突破性成果,又以商业落地为导向打造全场景的产品矩阵。团队汇聚众多顶尖数据库专家和卓越工程师,分布在国内/海外多地。现诚邀具备数据库内核研发经验、分布式系统架构能力及 AI 创新视野的优秀人才,共同探索技术无人区,定义 AI 时代的数据基座,赋能全球企业实现 AI 驱动的业务变革。 1、负责AI时代的数据库架构设计:涵盖支持AI/ML工作负载的新型数据库系统架构,优化AI模型训练与推理的数据访问效率;构建支持向量搜索、图计算、时序分析等AI场景的混合型数据库解决方案,探索LLM大模型与数据库系统的深度集成方案,如自然语言SQL生成、智能查询优化; 2、负责数据库智能策略研发:研发基于 AI 的数据库性能调优系统,包括自动索引推荐、查询计划优化、资源分配策略等;构建智能监控系统,实现异常检测、根因分析、容量预测等AIOps能力;开发自适应存储引擎,根据数据访问模式动态调整存储结构; 3、负责AI数据基础设施构建:构建AI数据基础设施,如支持特征工程、模型训练、推理服务的全流程数据管道架构,实现数据库与机器学习框架(TensorFlow/PyTorch)的高效对接; 4、负责AI与数据库结合的实践方案探索与落地:探索AI技术和数据库各产品结合的最佳实践方案并落地,服务超大规模的集团内部业务及火山引擎业务。

更新于 2025-03-04
logo of meituan
社招3年以上核心本地商业-美

1.负责美团平台地图服务的搜推算法策略迭代,优化用户搜推体验,提升地理位置搜索推荐准确率,提高用户点击率和转化率等核心指标; 2.应用大模型/NLP/深度学习/机器学习等理论和方法,优化查询理解、召回、粗排、精排、重排等算法模块; 3.负责前沿技术探索,包括大模型技术在搜索场景的落地应用。

更新于 2025-04-03