logo of bytedance

字节跳动推荐算法工程师-国际电商(商城)

社招全职A76900地点:北京状态:招聘

任职要求


1、扎实的算法数据结构基础,优秀的问题理解能力和编码能力;
2、机器学习基础理论扎实,熟悉常用的算法模型(如CF、FM、Word2vec、LR、GBDT、DNN),对模型调优有一定实践经验;
3、对推荐系统召回/排序/多样性/冷启动中一个或多个方向有过深入的实践,了解业界经典的模型和方法;
4、熟悉至少一门编程语言(C/C++/Java/go/python),熟悉至少一种大数据计算工具(hive sql/spark/mapreduce),熟悉至少一种神经网络框架(TensorflowPytorch),熟悉Linux开发环境,具备一定的工程能力;
5、善于沟通,乐观自信,良好的团队合作精神;对新技术充满好奇,能够持续学习,乐于实践,无惧试错。
加分项 :
1、有个性化推荐、广告、搜索等相关领域的项目经验; 
2、在KDD、NeurIPS、WWW、SIGIR、WSDM、CIKM、ICLRICML、IJCAI、AAAI、RecSys等会议发表过论文;
3、有过数据挖掘/机器学习或ACM-ICPC/NOI/IOI相关的竞赛经历并取得优秀成绩;
4、有高关注度的机器学习相关博客或github项目。

工作职责


1、独特的业务问题,涉及到商品/直播/短视频等多种体裁的混合推荐,多个场景/多种目标的联合建模;
2、超大规模的推荐模型优化,利用深度学习、迁移学习、多任务学习、表征学习、强化学习等多种方法提升信息匹配的效率;
3、在用户长短期兴趣建模和特征交互方式上持续研究探索,不断提高用户兴趣的匹配精度;
4、在多样性,发现性,用户/物品冷启动,高品质商品和主播的挖掘等问题专项研究,构建良性的循环机制,优化内容电商生态;
5、结合内容电商的业务特性,进行模型和算法创新,打造业界领先的推荐算法和系统。
包括英文材料
算法+
数据结构+
机器学习+
GBDT+
推荐系统+
C+
C+++
Java+
Go+
Python+
大数据+
Hive+
SQL+
Spark+
MapReduce+
TensorFlow+
PyTorch+
Linux+
NeurIPS+
WSDM+
ICML+
RecSys+
数据挖掘+
GitHub+
相关职位

logo of bytedance
社招A24954

1、独特的业务问题,涉及到商品/直播/短视频等多种体裁的混合推荐,多个场景/多种目标的联合建模; 2、超大规模的推荐模型优化,利用深度学习、迁移学习、多任务学习、表征学习、强化学习等多种方法提升信息匹配的效率; 3、在用户长短期兴趣建模和特征交互方式上持续研究探索,不断提高用户兴趣的匹配精度; 4、在多样性,发现性,用户/物品冷启动,高品质商品和主播的挖掘等问题专项研究,构建良性的循环机制,优化内容电商生态; 5、结合内容电商的业务特性,进行模型和算法创新,打造业界领先的推荐算法和系统。

更新于 2024-02-01
logo of bytedance
社招A23152A

1、独特的业务问题,涉及到商品/直播/短视频等多种体裁的混合推荐,多个场景/多种目标的联合建模; 2、超大规模的推荐模型优化,利用深度学习、迁移学习、多任务学习、表征学习、强化学习等多种方法提升信息匹配的效率; 3、在用户长短期兴趣建模和特征交互方式上持续研究探索,不断提高用户兴趣的匹配精度; 4、在多样性,发现性,用户/物品冷启动,高品质商品和主播的挖掘等问题专项研究,构建良性的循环机制,优化内容电商生态; 5、结合内容电商的业务特性,进行模型和算法创新,打造业界领先的推荐算法和系统。

更新于 2024-02-01
logo of bytedance
社招A252843

1、独特的业务问题,涉及到商品/直播/短视频等多种体裁的混合推荐,多个场景/多种目标的联合建模; 2、超大规模的推荐模型优化,利用深度学习、迁移学习、多任务学习、表征学习、强化学习等多种方法提升信息匹配的效率; 3、在用户长短期兴趣建模和特征交互方式上持续研究探索,不断提高用户兴趣的匹配精度; 4、在多样性,发现性,用户/物品冷启动,高品质商品和主播的挖掘等问题专项研究,构建良性的循环机制,优化内容电商生态; 5、结合内容电商的业务特性,进行模型和算法创新,打造业界领先的推荐算法和系统。

更新于 2024-02-01
logo of bytedance
校招A221696

Team Introduction: The team primarily focuses on recommendation services for the International E-commerce Mall, covering information flow recommendation in core scenarios such as the mall homepage, transaction funnels, product detail pages, stores & showcases. Committed to providing hundreds of millions of users daily with precise and personalized recommendations for products, live streams, and short videos, the team dedicates itself to solving challenging problems in modern recommendation systems. Through algorithmic innovations, we continuously enhance user experience and efficiency, creating greater user and social value. Project Background/Objectives: This project aims to explore new paradigms for large models in the recommendation field, breaking through the long-standing structures of recommendation models and Infra solutions, achieving significantly better performance than current baseline models, and applying them across multiple business scenarios such as Douyin short videos/LIVE/E-commerce/Toutiao. Developing large models for recommendation is particularly challenging due to the high demands on engineering efficiency and the personalized nature of user recommendation experiences. The project will conduct in-depth research across the following directions to explore and establish large model solutions for recommendation scenarios: Project Challenges/Necessity: The emergence of LLMs in the natural language field has outperformed SOTA models in numerous vertical tasks. In contrast, industrial-grade recommendation systems have seen limited major innovations in recent years. This project seeks to revolutionize the long-standing paradigms of recommendation model architectures and Infra in the recommendation field, delivering models with significantly improved performance and applying them to scenarios like Douyin short video and LIVE. Key challenges include: High engineering efficiency requirements for recommendation systems; Personalized nature of user recommendation experiences; Effective content representation for media formats like short videos and live streams. The project will address these through deep research in model parameter scaling, content/user representation learning, multimodal content understanding, ultra-long sequence modeling, and generative recommendation models, driving systematic upgrades to recommendation models. Project Content: 1. Representation Learning Based on Content Understanding and User Behavior 2. Scaling of Recommendation Model Parameters and computing 3. Ultra-Long Sequence Modeling 4. Generative Recommendation Models Involved Research Directions: Recommendation Algorithms, Large Recommendation Models. 团队介绍: 推荐与营销团队,主要负责国际电商商城推荐业务,涵盖商城首页、交易链路、商品详情页、店铺&橱窗等多个核心场景的信息流推荐业务,致力于每天为亿量级用户提供精准个性化商品、直播、短视频推荐服务;团队致力于解决现代推荐系统中各种有挑战的问题,通过算法不断提升用户体验和效率、创造更大的用户和社会价值。 课题背景/目标: 本项目旨在探索推荐领域下的大模型新范式,突破现在持续了较长时间的推荐模型结构和Infra的方案,且效果大幅好于现在的基线模型,在抖音短视频/直播/电商/头条等多个业务场景上得到应用。推荐领域的大模型是比较有挑战的事情,推荐对工程效率的要求更高,且用户的推荐体验上是个性化的,本课题会以下多个方向来做深入的研究,探索和建设推荐场景的大模型方案。 课题挑战/必要性: 自然语言领域LLM的出现,效果在众多垂直任务上都好于sota模型,从推荐领域看过去工业级推荐系统在较长的时间没有大幅的变化过。本项目旨在探索推荐领域下的大模型方案,改变现在持续了较长时间的推荐模型结构和Infra的基本范式,且效果大幅好于现在的模型,在抖音短视频/直播等多个业务场景上得到应用。但是怎么做好推荐领域的大模型也是一个比较有挑战的事情,推荐对工程效率的要求更高,且用户的推荐体验上是个性化的,以及如何短视频、直播等体裁上做号内容的表征也是需要被解决的问题,这里会从模型参数scaling up、内容和用户的表征学习、内容理解多模态、超长序列建模、生成式推荐模型等多个方向来做深入的研究,对推荐场景的模型做系统性的升级。 课题内容: 1、基于内容理解和用户行为的表征学习; 2、推荐模型参数和算力scaling up; 3、超长序列建模; 4、生成式推荐模型。 涉及研究方向:推荐算法、推荐大模型。

更新于 2025-05-26