京东数据开发工程师(业务应用方向)
社招全职软件开发岗地点:北京状态:招聘
任职要求
1.对大规模数据处理、分布式存储计算、数据建模有浓厚兴趣,能够主动跟踪学习前沿技术; 2.深入理解常用的数据建模理论,有数据仓库模型建设经验优先; 3.有Hive Spark Flink Clickhouse Presto ES 开发经验者优先…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 基于对AI应用创新全链路业务理解,搭建企业级数据仓库主题模型体系,构建离线/实时数据模型,统一支撑核心数据产品和系统,为业务提供分析决策支持; 2. 参与从数据采集、存储、计算到查询应用的端到端的海量数据处理架构设计和开发,如批流一体、数据湖、OLAP等; 3. 负责面向业务目标的数据建模和分析工作,制定符合业务特点的解决方案并推进落地实施; 4. 不断探索行业内最新的大数据解决方案,提升算力、降低成本、拓展多元数据服务能力。
包括英文材料
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Flink+
https://nightlies.apache.org/flink/flink-docs-release-2.0/docs/learn-flink/overview/
This training presents an introduction to Apache Flink that includes just enough to get you started writing scalable streaming ETL, analytics, and event-driven applications, while leaving out a lot of (ultimately important) details.
https://www.youtube.com/watch?v=WajYe9iA2Uk&list=PLa7VYi0yPIH2GTo3vRtX8w9tgNTTyYSux
Today’s businesses are increasingly software-defined, and their business processes are being automated. Whether it’s orders and shipments, or downloads and clicks, business events can always be streamed. Flink can be used to manipulate, process, and react to these streaming events as they occur.
还有更多 •••
相关职位
社招软件开发岗
1. 基于对AI应用创新全链路业务理解,搭建企业级数据仓库主题模型体系,构建离线/实时数据模型,统一支撑核心数据产品和系统,为业务提供分析决策支持; 2. 参与从数据采集、存储、计算到查询应用的端到端的海量数据处理架构设计和开发,如批流一体、数据湖、OLAP等; 3. 负责面向业务目标的数据建模和分析工作,制定符合业务特点的解决方案并推进落地实施; 4. 不断探索行业内最新的大数据解决方案,提升算力、降低成本、拓展多元数据服务能力。
更新于 2025-06-10北京
社招数据开发岗
1.参与国际业务数据仓库主题的规划,负责某个具体业务应用方向的数仓建设; 2.负责数据仓库及数据集市的数模设计及元数据完善; 3.负责数据仓库ETL开发,包括离线、准实时及实时的任务开发; 4.负责数据集市的报表数据开发及接口数据开发。
更新于 2025-12-07北京
社招3年以上机器学习平台
【业务介绍】 作为公司统一的机器学习平台团队,负责调度公司所有模型训练与推理资源;基于自建的训推引擎,构建公司统一的机器学习平台,为公司所有算法同学(稀疏 & 稠密,含 LLM) 模型迭代提供端到端的一站式服务;包括 数据生产,模型训练,模型上线,特征管理,模型测试,资源管控等一系列能力。 【岗位职责】 1、负责机器学习链路,离在线数据相关的开发工作,包括样本数据、特征数据等的数据链路搭建、任务运维和调优、性能优化等 2、负责小红书大规模机器学习平台的后台系统设计和开发工作;包括样本平台,特征平台,训练平台,推理平台等AI应用后台建设等; 3、研究分析业内AI平台产品,优化技术方案,改进产品功能,完善产品体验。
上海