京东数据开发工程师
任职要求
1.计算机相关专业,3年以上数仓开发实施经验,能够根据业务设计数据仓库模型,保证数据的产出和质量; 2.精通sql开发,有较丰富的Hive sql性能调优经验,能进行udf开发者优先; 3.熟悉Mysql、Hbase、Redis、Doris、…
工作职责
1.参与数据仓库主题的规划,负责某个具体业务方向的数仓建设; 2.负责数据仓库及数据集市的数模设计及元数据完善; 3.负责数据仓库ETL开发,包括离线、准实时及实时的任务开发; 4.负责数据集市的报表数据开发及接口数据开发。

负责 Hadoop、Spark、Hive、HBase、Presto、Flink、ClickHouse 等大数据集群的规划、部署与算力调优,保障集群 7×24 小时稳定运行。 负责集群日常运维、性能调优、容量规划、故障排查与问题根治,保障服务达成 SLA 指标。 负责大数据开源组件二次封装、功能迭代与漏洞修复,搭建通用工具与服务,赋能数据平台建设。 为数据分析团队提供底层技术支撑,协助解决平台使用过程中各类复杂技术问题。算机、软件工程、数学等相关专业,本科及以上学历,拥有 3 年及以上大数据研发相关工作经验。 具备中大型集群(PB 级数据量或 50~100 节点规模)整体规划、搭建与优化实战经验。 有 Hadoop、Spark、Hive、Presto 等开源框架源码修改、二次开发经验者优先。 精通 Hadoop、Spark、Hive、HBase、Presto、Flink、ClickHouse 等主流大数据生态组件。 熟练使用 Java、Python、Shell 进行开发,精通 HiveSQL 性能调优。 可独立完成需求分析、技术选型,能够设计高可用、高可扩展的大数据解决方案。 具备钻研精神与自驱力,沟通表达良好,拥有较强的抗压能力及集群应急处置能力。 具备 AI 开发能力,熟练使用主流 AI 编程提效工具(如 Codex、CodeCopilot 等)。 拥有大数据场景下大模型 Agent 设计、开发及项目落地经验者优先。 了解或掌握机器学习算法底层原理者优先。 ## Key Responsibilities * Design, deploy, optimize, and maintain large-scale big data clusters based on technologies such as Hadoop, Spark, Hive, HBase, Presto, Flink, and ClickHouse. * Ensure 24×7 stability, reliability, and performance of production data platforms through proactive monitoring, capacity planning, and performance tuning. * Troubleshoot complex system issues, conduct root cause analysis, and implement long-term solutions to meet SLA requirements. * Develop and enhance internal platform capabilities through customization, secondary development, feature enhancements, and bug fixes of open-source big data components. * Build reusable tools, frameworks, and platform services to improve engineering efficiency and support data platform evolution. * Provide technical guidance and infrastructure support for data analysts, data engineers, and business teams, helping resolve complex platform-related challenges. * Participate in architecture design, technology evaluation, and best-practice establishment for enterprise-scale data platforms. ##
1、负责国际BI、零售通、米网相关数据相关数据应用、数仓底层开发和维护; 2、理解和拆解数据产品需求,完成数据分析、数据建模以及编码工作; 3、跨团队与服务端、前端、测试等完成需求沟通和协作,完成项目;
1、分析业务需求,建设数据库仓库,对业务部门提供数据支持; 2、参与数据源分析,完成大数据平台与各业务系统的数据对接; 3、完成基于大数据技术平台基础上的数据仓库设计和ETL开发; 4、调研相关技术,优化大数据开发流程,规划大数据平台应用。