logo of dewu

得物搜索算法实习生

实习兼职技术类地点:上海状态:招聘

任职要求


职位要求
1、熟悉统计机器学习理论,熟悉常见分类、聚类机器学习深度学习算法;
2、熟悉C++/Java/Python,具备优秀的编码能力,至少熟悉一种常见的机器学习/深度学习平台;
3、有钻研精神,主观能动性强,能适应快速变化的业务需求,具备良好的团队合作精神和沟通技巧;
4、实习期要求在3个月或以上。

工作职责


职位描述
1、利用大规模机器学习算法对内容搜索场景实时兴趣进行建模,提升点击转化效率;
2、负责优化得物商品内容化场景用户内容关系挖掘,优化内容的召回排序逻辑;
3、对用户、商家的行为做深入的理解和分析,制定针对的算法策略赋能供需两端。
包括英文材料
机器学习+
深度学习+
算法+
C+++
Java+
Python+
相关职位

logo of kuaishou
实习D3967

1. 通过语言模型、相关性建模、序列到序列生成、大模型SFT等手段,优化搜索词补全、搜索词推荐等业务场景,带来快手用户搜索次数和搜索体验的增长; 2. 基于LLM、多模态生成模型等前沿技术,结合用户行为和视频内容理解,探索为视频看后搜等场景生成优质搜索词; 3. 在快手海量视频及用户数据下,通过用户/视频表征学习、序列建模等技术创新,挖掘对排序有用的特征信息,提升点击与消费时长预估,持续优化大规模推荐系统的召回、排序算法。

更新于 2025-05-08
logo of xiaohongshu
实习内容理解

1、短文本理解方向。对海量Query进行自动化的改写、实体抽取等,使得搜索结果更精准; 2、长文本理解方向。对复杂的长文本笔记进行多模态理解、标签建设,为下游提供高质量特征; 3、跟踪业界最新研究成果,并应用到实际产品中;

更新于 2025-09-10
logo of meituan
实习核心本地商业-业

1. 参与美团搜索引导、查询理解、召回、排序、重排等算法方向开发及优化; 2. 使用自然语言处理、深度学习、大模型等技术构建模型,并应用至线上服务; 3. 通过技术支撑业务发展,共同实现经营目标; 4. 与其他技术团队紧密配合,制定有效策略,完成搜索规模增长、交易效率提升、用户体验改善等目标;

更新于 2025-06-05
logo of bytedance
实习A130018

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。 主要工作方向包括: 1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新; 5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。 1、参与搜索引擎(策略、模型)研发工作,支持抖音/今日头条/电商/番茄小说/红果短剧等具有数亿用户的产品,致力于为数亿用户提供数千亿精准搜索结果,打造极致的搜索体验; 2、探索前沿技术,探索大模型等创新技术在AI搜索场景的落地,参与搜索引擎、搜索大模型的改进,包括而不限于: 1)NLP、大模型:构建大规模高质量数据(数据建设、数据抓取与解析、数据合成等)、分词、NER,文本、多模态预训练、Query分析、基础相关性等,全链路结合应用机器学习/深度学习模型,探索搜索引擎与大模型、LLM、MLLM、多模态、机器学习、强化学习等前沿技术的结合,实现搜索引擎全链路革新并进行极致的系统优化,探索提升AI搜索引擎的能力,包含而不限于相关性、权威性、时效性、意图理解能力等;探索新的自然语言处理算法、信息检索技术、LLM适性索引、LLM相关性、生成式召回、排序大模型等,提高搜索引擎的准确性和智能化程度; 2)召回与排序:借助语义理解、个性化预估、机制设计等技术,解决超大规模的视频、商品、直播、POI等搜索业务下的召回、排序、重混排模型; 3)多模态、跨模态匹配技术:基于海量网页图文、抖音视频数据的大规模多模态预训练和视频分析技术,提升视觉搜索的使用体验;在搜索中结合CV+NLP深度学习技术,实现多模态、视频搜索、强大的语义理解和检索能力; 4)页面分析和摘要:从千亿视频/网页中提取最有价值的信息,进行结构化字段提取、智能摘要生成、转码等工作来优化搜索体验; 5)链接分析:从万亿链接中找出最有价值的网页,优化链接质量、索引质量、垃圾作弊识别、调度策略等。

更新于 2025-01-10