
哈啰数据开发-普惠用车事业部
社招全职技术地点:上海状态:招聘
任职要求
1 、 本 科 及 以 上 学 历 , 5 年 以 上 数 据 研 发 经 验 ; 2 、 有 较 为 丰 富 的 数 据 仓 库 研 发 经 验 , 熟 悉 数 据 仓 库 、 数 据 体 系 和 数 据 价 值 的 建 设 及 优 化 ; 3 、 掌 握 数 据 管 理 治 理 的 相 关 理 论 , 熟 悉 数 据 治 理 、 数 据 标 准 、 企 业 级 数 据 建 模 、 主 数 据 、 元 数 据 管 理 等 方 法 论 , 4 、 精 通 SQL, 具 有 较 好 的 SQL 调 优 经 验 , 了 解 大 数 据 相 关 组 件 的 基 本 原 理 和 调 优 ; 5 、 熟 悉 大 数 据 架 构 , 具 备 实 时 或 离 线 数 据 研 发 能 力 , 熟 悉 Hive, Kafka , Spark, Storm , Hbase, F 丨 ink 等 相 关 技 术 ; 6 、 具 备 快 速 学 习 能 力 、 跨 团 队 沟 通 协 作 能 力 , 有 较 强 的 逻 辑 思 维 能 力 和 解 决 问 题 能 力 。
工作职责
1 、 负 责 基 础 数 据 建 设 , 提 供 通 用 、 稳 定 、 丰 富 、 高 效 的 公 共 数 据 能 力 , 提 升 数 据 支 持 业 务 的 效 率 , 探 索 数 据 的 增 量 价 值 ; 2 、 负 责 跨 领 域 数 据 治 理 : 底 座 建 设 , 数 据 建 模 , 数 据 清 洗 , 数 据 质 量 改 善 , 数 据 安 全 治 理 。 3 、 建 设 数 据 管 理 体 系 , 结 合 业 务 + 元 数 据 + 技 术 , 推 进 资 源 成 本 的 优 化 , 提 高 数 据 服 务 的 数 据 质 量 , 保 障 数 据 产 出 的 稳 定 性 。
包括英文材料
SQL+
https://liaoxuefeng.com/books/sql/introduction/index.html
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。
https://sqlbolt.com/
Learn SQL with simple, interactive exercises.
https://www.youtube.com/watch?v=p3qvj9hO_Bo
In this video we will cover everything you need to know about SQL in only 60 minutes.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
Kafka+
https://developer.confluent.io/what-is-apache-kafka/
https://www.youtube.com/watch?v=CU44hKLMg7k
https://www.youtube.com/watch?v=j4bqyAMMb7o&list=PLa7VYi0yPIH0KbnJQcMv5N9iW8HkZHztH
In this Apache Kafka fundamentals course, we introduce you to the basic Apache Kafka elements and APIs, as well as the broader Kafka ecosystem.
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Apache Storm+
[英文] Tutorial
https://storm.apache.org/releases/2.6.0/Tutorial.html
In this tutorial, you'll learn how to create Storm topologies and deploy them to a Storm cluster.
https://www.baeldung.com/apache-storm
This tutorial will be an introduction to Apache Storm, a distributed real-time computation system.
HBase+
[英文] HBase Tutorial
https://www.tutorialspoint.com/hbase/index.htm
HBase is a data model that is similar to Google's big table designed to provide quick random access to huge amounts of structured data. This tutorial provides an introduction to HBase, the procedures to set up HBase on Hadoop File Systems, and ways to interact with HBase shell.
相关职位

社招3年以上技术
职位描述 1、基于哈啰数据平台和机器学习平台对普惠用车宏观供需和用户画像开展实践研究以实现业务目标,包括但不限于数据挖掘、数据分析和算法工程落地等; 2,研发和实现统一的供需模型,为跨职能团队提供供需决策能力和闭环策略; 3,沉淀通用的供需数据驱动能力,建设相关的平台系统,提升系统迭代效率和迭代效果; 4,和上下游业务、产品等跨只能团队密切协作,推动产品的进化;
更新于 2025-08-07
实习A216886
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:依托抖音集团的科技能力和产品,我们为抖音电商、生活服务、直播等场景提供金融服务,为抖音用户提供更好的支付、消费金融、保险等金融服务。科技创新,普惠大众。 1、理解业务数据需求,负责数据探查、开发与分析、设计和构建对应业务的数据集市; 2、负责ETL流程的开发和优化工作,解决业务数据分析、数据报表、数据异常相关的技术问题; 3、负责主题数据质量问题的分析、跟进、解决。
更新于 2025-02-14
实习A225603
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:火山引擎是字节跳动旗下的云服务平台,将字节跳动快速发展过程中积累的增长方法、技术能力和工具开放给外部企业,提供云基础、视频与内容分发、大数据、人工智能、开发与运维等服务,帮助企业在数字化升级中实现持续增长。 1、参与理解内外部客户需求,解决实际问题,并从中提炼通用能力,为企业客户提供弹性、Serverless化的云原生大数据产品; 2、参与打造易用、高效、稳定、安全、普惠的云原生数仓、数据湖等产品。
更新于 2023-06-26