logo of bytedance

字节跳动推荐数据开发工程师(离线/大数据方向)-中国直播

社招全职A259456A地点:北京状态:招聘

任职要求


1、扎实的编程能力,熟练一种或几种编程语言,例如Java/C++/Scala/Python;
2、熟悉大规模流批数据分布式计算与分布式存储的理论与架构设计;
3、有推荐、搜索、广告领域相关工作经验;
4、乐于挑战没有明显答案的问题,对新技术有强烈的学习热情,有较强技术视野。

【加分项】
1、对多个大数据数据处理领域的开源框架有较深入的理解,包括但不限于Flink/Spark/Hadoop/Hive/Kafka/Pulsar/Hbase/RocksDB/Hudi/Iceberge/Clickhouse;
2、有PB级以上数据流批处理经验;
3、熟悉搜广推离线链路,深入理解样本、特征、索引等在系统中的作用;
4、对机器学习架构或搜广推领域模型有一定了解。

工作职责


团队介绍:字节跳动推荐架构团队,负责字节跳动超10亿用户产品推荐系统架构的设计和开发,保障系统稳定和高可用;负责在线服务、离线数据流性能优化,解决系统瓶颈,降低成本开销;抽象系统通用组件和服务,建设推荐中台、数据中台,支撑新产品快速孵化以及为ToB赋能;实现灵活可扩展的高性能存储系统和计算模型,打通离在线数据流,构建统一的数据中台,支持推荐/搜索/广告。

1、为大规模推荐系统设计和实现合理的离线/实时数据架构,打造业界领先的离在线存储、批式流式计算框架等分布式系统,为海量数据和大规模业务系统提供可靠的平台化基础设施;
2、深入推荐系统,探索数据架构如何为业务赋能,提升线上效果;
3、尝试打破现有边界,探索核心框架的演进、新技术的应用、推荐大模型的落地;
4、生产系统的TROUBLE-SHOOTING和成本优化,设计和实现必要的机制和工具保障生产系统整体运行的稳定性与效率。
包括英文材料
Java+
C+++
Scala+
Python+
系统设计+
大数据+
Spark+
Hadoop+
Hive+
Kafka+
Pulsar+
HBase+
RocksDB+
ClickHouse+
机器学习+
相关职位

logo of bytedance
社招A42609

团队介绍:字节跳动豆包大模型团队(Seed)成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限,并探索新的交互。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 豆包大模型团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与AI编译器相关项目的技术方案规划,设计在离线全系统的计算图优化链路; 2、针对搜索/推荐/广告场景,优化模型训练/推理的计算图执行效率; 3、与全公司算法部门深度合作,为重点项目进行算法与系统的联合优化。

更新于 2025-05-13
logo of bytedance
社招66D2

字节跳动推荐架构团队,负责字节跳动旗下相关产品的推荐系统架构的设计和开发,保障系统稳定和高可用;负责在线服务、离线数据流性能优化,解决系统瓶颈,降低成本开销;抽象系统通用组件和服务,建设推荐中台、数据中台,支撑新产品快速孵化以及为ToB赋能。 1、为大规模推荐系统设计和实现合理的实时(流式计算)数据系统; 2、设计和实现灵活可扩展、稳定、高性能的存储系统和计算模型; 3、生产系统的trouble-shooting,设计和实现必要的机制和工具保障生产系统整体运行的稳定性; 4、打造业界领先的流式计算框架等分布式系统,为海量数据和大规模业务系统提供可靠的基础设施。

更新于 2021-09-26
logo of tencent
社招WXG技术

1.参与微信搜一搜表情业务个性化推荐/搜索方向算法优化工作,通过技术优化,提升微信海量用户的表情推荐和表情搜索的体验; 2.工作内容包括并不限于:序列建模排序、多队列召回、用户表征、人群优化、冷启动等; 3.涉及技术包括并不限于:长序列建模、用户兴趣表征学习、大模型应用、生成式推荐/搜索、海量行为分析和信号挖掘等; 4.持续探索前沿个性化技术在表情推荐/搜索业务中的落地应用。

更新于 2025-06-04
logo of amap
社招3年以上技术类-开发

1. 参与面向亿级用户和千万级流量的广告平台/广告引擎的系统架构、核心功能开发、工程优化与稳定性保障; 2. 推动AI在广告系统中的深度应用,包括个性化投放、智能创意生成(AIGC)、内容审核与推荐等模块的工程实现和性能提升; 3. 主导高可靠、高精度的广告计费/结算子系统研发,确保交易链路的准确性、数据一致性与高并发处理能力; 4. 设计并持续优化广告流量反作弊、异常监测与风控体系,支持实时攻击防御与灰产行为识别,提升平台安全水平; 5. 联合算法团队推动广告CTR/CVR预估、用户行为建模、内容理解等模型上线、服务化部署及效果监控; 6. 构建高效稳定的广告数据流和特征管理系统,支持线上实时计算、批量数据处理、特征提取与回流; 7. 建设完备的系统监控、告警、日志、安全与自动化测试等工程支持体系,保障广告系统全链路高可用与可观测性; 8. 关注业界前沿技术和最佳实践,将创新方案转化为商业价值,积极参与跨团队协作推动项目落地。

更新于 2025-10-14