
得物实时特征研发工程师/专家
社招全职3年以上技术类地点:北京 | 上海状态:招聘
任职要求
1. 计算机、数学或相关专业本科及以上学历,3年以上大数据开发经验。 2. 精通 Apache Flink,深刻理解其运行时架构、状态管理、时间窗口、容错机制等核心概念,有丰富的 Flink SQL/DataStream API 开发调试经验。 3. 熟练掌握 Java 或 Scala 编程语言,具备良好的系统设计和编码能力。 4. 熟悉 Ka…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 核心系统构建: 负责设计与搭建基于 Flink 的实时特征计算平台,保障其高可用、低延迟和高吞吐量。 2. 实时数仓与建模: 负责用户/item特征实时数仓的层次设计、模型开发与优化,构建主题明确、数据可信、易于复用的实时数据模型,为用户/物料特征计算提供高质量数据支撑。 3. 实时特征工程: 开发并优化实时特征管道(Feature Pipeline),包括行为序列、滑动窗口聚合、多流关联等复杂实时特征的加工与存储,为搜推模型提供高质量数据输入。 4. 平台保障与优化: 负责实时数据从接入、处理到输出全链路的稳定性保障、性能调优(如解决数据倾斜、反压问题)和故障排查,确保7x24小时服务稳定。 5. 技术演进: 研究并引入业界先进的流处理技术,解决超大数据量下的状态管理、窗口计算、精确一次语义(Exactly-Once)等技术挑战,推动平台技术架构持续演进。
包括英文材料
学历+
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Apache+
https://www.apache.org/
The Apache® Software Foundation (ASF) provides software for the public good, guided by community over code.
Flink+
https://nightlies.apache.org/flink/flink-docs-release-2.0/docs/learn-flink/overview/
This training presents an introduction to Apache Flink that includes just enough to get you started writing scalable streaming ETL, analytics, and event-driven applications, while leaving out a lot of (ultimately important) details.
https://www.youtube.com/watch?v=WajYe9iA2Uk&list=PLa7VYi0yPIH2GTo3vRtX8w9tgNTTyYSux
Today’s businesses are increasingly software-defined, and their business processes are being automated. Whether it’s orders and shipments, or downloads and clicks, business events can always be streamed. Flink can be used to manipulate, process, and react to these streaming events as they occur.
SQL+
https://liaoxuefeng.com/books/sql/introduction/index.html
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。
https://sqlbolt.com/
Learn SQL with simple, interactive exercises.
https://www.youtube.com/watch?v=p3qvj9hO_Bo
In this video we will cover everything you need to know about SQL in only 60 minutes.
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Scala+
系统设计+
https://roadmap.sh/system-design
Everything you need to know about designing large scale systems.
https://www.youtube.com/watch?v=F2FmTdLtb_4
This complete system design tutorial covers scalability, reliability, data handling, and high-level architecture with clear explanations, real-world examples, and practical strategies.
还有更多 •••
相关职位
社招2年以上D6323
1、打造业界领先的广告算法模型数据平台,包括样本拼接、特征构建、实验框架等,为快手的广告算法模型提供高效稳定的学习能力; 2、负责广告系统核心数据流架构的设计与开发,支撑广告百万级QPS,为机器学习系统、客户报表及内部分析系统提供高可靠的实时数据; 3、负责研发广告转化归因(Attribution)系统,通过归因策略提升快手广告算法的效率; 4、通过数据和算法技术,为快手的广告客户打造智能投放工具,包括投放模拟、账户诊断、出价建议等,提升广告主的投放效率。
更新于 2025-04-03北京
社招3-5年D11430
1、负责数据中台-商业化各个业务线数据仓库建设,构建商业化垂直数据集市; 2、定义并开发业务核心指标数据,负责垂直业务数据建模,如用户画像; 3、根据具体问题,设计并实现合适的可视化展示,构建数据持续观测平台; 4、参与数据平台的搭建,优化数据处理流程具体工作; 5、数据收集,反作弊数据仓库,用户数据仓库,UGC数据仓库,审核数据仓库的研发; 6、A/B测试实时ETL研发,转化漏斗分析平台研发。
更新于 2025-10-11北京
社招3年以上技术类-开发
1.负责高德共享出行业务的架构重构和持续演进,供需实时数据系统、司机优选系统、指标特征系统等建设; 2.协同产品/算法分析各项策略效果指标,优化、调整策略方向及规则;建立体系化的实验、分析、优化、迭代的机制; 3.保障链路稳定性及高可用、高并发、高性能;
更新于 2025-11-11北京