logo of kuaishou

快手搜索数据流研发实习生

实习兼职D3969地点:北京状态:招聘

任职要求


1、26届及以后、本科及以上计算机相关专业,熟悉Java/C++等编程语言及常用数据结构算法;
2、对数据系统相关知识有一定的了解和实践,包括但不限于flink/Hadoo…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与快手搜索引擎数据链路架构相关的研发工作,为索引排序等相关数据链路设计和实现合理的数据流方案;
2、持续优化和提升数据链路的实时性/稳定性和正确性,满足视频电商等多业务场景快速迭代和拓展的诉求;
3、对现有数据方案不足进行分析,在生产环境trouble-shooting,并完成相应数据任务的迁移和改造。
包括英文材料
Java+
C+++
数据结构+
算法+
还有更多 •••
相关职位

logo of ke
实习集团

1、搜索引擎、分布式计算、大数据基础架构、CRM、工作流等设计研发; 2、深入发掘和分析业务的需求,撰写技术方案和系统设计,最终完成编码工作; 3、平台搭建及优化,参与技术方案和系统设计评审,把握复杂系统设计,确保系统的架构质量; 4、参与前瞻技术的跟踪调研和产品创新。

更新于 2025-03-30北京
logo of baidu
实习MEG

-推荐策略部坐标百度双引擎(搜索+信息流)核心业务,以Feed推荐体验的最终呈现,提供推荐能力平台化服务。 -研究数据挖掘或统计学习领域的前沿技术,并用于实际问题的解决和优化 -大规模机器学习算法研究及并行化实现,为各种大规模机器学习应用研发核心技术 -通过对数据的敏锐洞察,深入挖掘产品潜在价值和需求,进而提供更有价值的产品和服务,通过技术创新推动产品成长

更新于 2025-02-13北京
logo of aliyun
实习阿里云2026届

阿里云持续推进AI技术深化战略布局,围绕AI 和云计算的基础设施建设、AI基础模型平台、企业级AI应用方向构建核心场景。为此,我们正积极招募优秀人才: 负责云计算和大数据基础技术研发,包括不限于以下方向: 1、云基础设施技术,包括研发面向百万级服务器的网络(如RDMA、可编程芯片)、服务器(如异构计算)、数据中心,以及构建超大规模的基础设施智能化运维体系(如AIOps); 2、虚拟化技术,包括XEN、KVM等开源技术的改进,以及也包括我们自研的SDN、VPC等网络虚拟化、存储虚拟化技术,还包括Docker等轻量级的容器方案; 3、MySQL、PostgreSQL、MongoDB、Redis、HBase等开源数据库内核的改进; 4、包含单集群上万个节点,多地多集群的超大规模分布式存储系统(文件系统,KVstore,BigTable等等)、分布式计算系(MapReduce,DAG,MPI并行计算、Batch、类Hive/spark的计算系统包括离线,分布式开发语言,分布式开发IDE,查询优化,流式实时计算,图计算,MPP等等)、弹性分布式资源管理和调度(海量多维度的多目标的调度系统,多个资源维度资源隔离技术等等)、机器学习平台(包括Paratemter Server,深度学习,逻辑回归等等)、异构等新型硬件上计算(包括CPU,GPU,FPGA,RDMA等等); 5、大数据在线引擎体系的目标是集广告、搜索、推荐的投放三位于一体,在近百毫秒周期内,从服务端跨越至移动端上智能,支撑总体近TB级的模型,完成知识推理向量匹配等各种召回,以及其它深度学习的排序和预测算法,参与计算的数十亿商品保持实时更新,支持数百位算法工程师面向众多场景展开测试,在算子流图化的抽象之下,引擎内的模型和数据可随时调整布局满足迭代所需; 6、参与大规模高并发场景下的开发者工具如IDE、SDK、CLI的开发工作,toB相关认证、权限、审计平台合规等相关工具平台的研发工作。

更新于 2025-04-29北京|成都|杭州
logo of bytedance
实习A147566A

团队介绍:字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品的搜索工程、算法创新和架构研发工作。我们的职责是用前沿的技术去打造一个用户体验佳、信息效率高的搜索引擎产品。我们的愿景是做一款用户首选的搜索引擎,我们的使命是可以充分整合内容,高效连接人与信息。 团队主要负责抖音、今日头条、西瓜视频、问答和百科等产品的业务研发和架构研发工作。 我们使用前沿的前端、客户端和服务端技术赋能于搜索业务的快速迭代,并在技术上不断创新和突破。同时专注于大流量、高并发、低延时的搜索系统的构建,在性能优化上,追求从内存、Disk等优化到业务架构和网络协议的创新探索,在迭代效能上不断探索容器化、动态化、搭建化等方案的创新,技术氛围强,充分给同学们提供自我成长的机会。 1、参与ByteDance搜索引擎研发工作,用前沿的机器学习深度学习算法、海量的数据,做激动人心的技术、给用户更好的搜索体验; 2、参与抖音/电商/生活服务等核心产品的搜索研发工作,致力于为数亿用户提供数千亿精准搜索结果,打造极致的搜索体验; 3、参与搜索核心算法改进,可选的方向包括: (1)NLP:利用LLM等技术,研发新的自然语言处理算法和信息检索技术,提高搜索引擎的准确性和智能化程度。 (2)召回与排序:借助语义理解、个性化预估、机制设计等技术,解决超大规模的视频、商品、直播、POI等搜索业务下的召回、排序、重混排模型; (3)多模态:基于海量网页图文、抖音视频数据的大规模多模态预训练和视频分析技术,提升视觉搜索的使用体验; (4)页面分析和摘要:从千亿视频/网页中提取最有价值的信息,进行结构化字段提取、智能摘要生成、转码等工作来优化搜索体验; (5)链接分析:从万亿链接中找出最有价值的网页,优化链接质量、索引质量、垃圾作弊识别、调度策略等。 课题介绍:随着大模型技术的快速发展,智能搜索领域迎来了新的机遇和挑战。传统搜索技术在面对海量数据、多模态信息以及用户复杂需求时,逐渐暴露出模型容量不足、语义理解能力有限、资源利用率低等问题。基于大模型的智能搜索构建旨在通过引入大模型技术,提升搜索系统的智能化水平,优化用户体验,并解决超大规模检索、复杂语义理解、资源高效利用等核心问题。具体目标包括: 1、探索大模型与排序算法的结合,提升个性化排序的精度和用户体验; 2、研究生成式检索算法,解决百亿乃至千亿级别候选库的超大规模检索问题; 3、利用大语言模型(LLM)提升复杂多义Query的搜索满意度; 4、构建高性能、低资源消耗的大规模批流一体检索和计算系统,提升资源利用率。 1、个性化排序:传统排序算法难以充分利用多模态信息(如文本、图像、视频等),且模型复杂度有限,无法满足用户对精准化和个性化搜索的需求; 2、超大规模检索:传统判别式模型在千亿级别候选库的检索中,面临模型容量不足、索引效率低下等问题,亟需新一代检索算法; 3、复杂Query理解:用户搜索需求日益复杂,传统搜索引擎难以准确理解长难句、多义Query的语义,导致搜索结果满意度低; 4、资源利用率:搜索系统存储和计算分离的架构导致资源利用率低,如何在保证性能的同时优化资源使用成为关键问题。

更新于 2025-04-21珠海