小红书大数据开发工程师-搜广推(特征&索引)
社招全职3-5年引擎地点:北京 | 上海状态:招聘
任职要求
1、计算机相关专业,本科以上学历,两年以上工作经验; 2、扎实的计算机专业基础知识,精通数据结构/算法设计; 3、熟练使用Hadoop、Spark、Hive、Flink等大…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责模型样本&特征平台开发,为搜广推算法模型提供高效稳定的学习能力 ; 2、负责搜广推索引传输系统优化和迭代,优化提高系统吞吐、降低延迟、提升迭代效率 ; 3、支持大规模搜广推数据的流式/批量处理 ;
包括英文材料
学历+
数据结构+
https://www.youtube.com/watch?v=8hly31xKli0
In this course you will learn about algorithms and data structures, two of the fundamental topics in computer science.
https://www.youtube.com/watch?v=B31LgI4Y4DQ
Learn about data structures in this comprehensive course. We will be implementing these data structures in C or C++.
https://www.youtube.com/watch?v=CBYHwZcbD-s
Data Structures and Algorithms full course tutorial java
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
还有更多 •••
相关职位
校招后端开发
1、负责模型样本&特征平台开发,为搜广推算法模型提供高效稳定的学习能力 ; 2、负责搜广推索引传输系统优化和迭代,优化提高系统吞吐、降低延迟、提升迭代效率 ; 3、支持大规模搜广推数据的流式/批量处理 。
更新于 2025-08-30上海|北京
校招后端开发
1、负责模型样本&特征平台开发,为搜广推算法模型提供高效稳定的学习能力 ; 2、负责搜广推索引传输系统优化和迭代,优化提高系统吞吐、降低延迟、提升迭代效率 ; 3、支持大规模搜广推数据的流式/批量处理 。
更新于 2025-08-30上海|北京
社招5年以上A45490
1. 负责互部搜广推一站式算法平台的建设,支撑百亿级收入规模下的广告、搜索和推荐算法模型高效迭代 2. 负责深度学习工作流各环节的深度优化,包括特征和样本生产提效,模型训练加速等 3. 探索基于大模型和Agent能力,重塑算法模型开发迭代工作流 4. 与算法团队密切合作,支撑搜广推算法前沿技术探索和落地
更新于 2026-03-26北京
社招A259456A
团队介绍:字节跳动推荐架构团队,负责字节跳动超10亿用户产品推荐系统架构的设计和开发,保障系统稳定和高可用;负责在线服务、离线数据流性能优化,解决系统瓶颈,降低成本开销;抽象系统通用组件和服务,建设推荐中台、数据中台,支撑新产品快速孵化以及为ToB赋能;实现灵活可扩展的高性能存储系统和计算模型,打通离在线数据流,构建统一的数据中台,支持推荐/搜索/广告。 1、为大规模推荐系统设计和实现合理的离线/实时数据架构,打造业界领先的离在线存储、批式流式计算框架等分布式系统,为海量数据和大规模业务系统提供可靠的平台化基础设施; 2、深入推荐系统,探索数据架构如何为业务赋能,提升线上效果; 3、尝试打破现有边界,探索核心框架的演进、新技术的应用、推荐大模型的落地; 4、生产系统的TROUBLE-SHOOTING和成本优化,设计和实现必要的机制和工具保障生产系统整体运行的稳定性与效率。
更新于 2025-05-13北京