logo of didi

滴滴(资深/高级)数据仓库研发工程师(J250626017)

社招全职3年以上技术地点:北京状态:招聘

任职要求


1. 统招本科及以上学历,计算机等相关专业; 3年及以上的互联网数据仓库开发工作经验,对业务和数据敏感
2. 熟悉大数据处理架构(如FlinkSpark Streaming、Kafka Streams等),熟悉数据集成解决方案,实现跨平台、跨系统的数据ETL。
3. 熟悉 MySQLRedisHBaseClickHouse/Doris 等存储技术。能优化实时数据查询性能(如预聚合、索引优化)。
4. 精通 SQL,能编写复杂数据处理逻辑(如窗口函数、CDC 处理)。熟练使用 Python/Java/Scala 至少一种语言,能开发高效的数据清洗脚本。
5. 具备 非结构化/半结构化数据(JSONXML、日志、文本等)解析和清洗经验。熟练使用 正则表达式、ETL 工具(如 Logstash、NiFi)、UDF 开发等技术进行数据规范化处理。
6. 熟悉 Linux 环境,具备 集群监控(Prometheus/Grafana)、故障排查 经验。

【加分项】
1. 具备国际化风控业务经验优先
2. 有算法经验者优先
3. 了解爬虫极其数据处理经验者优先
4. 了解图数据库、向量数据库这优先
5. 因为会与国外同事交流,或有国外出差机会,英语水平流利者为佳。

工作职责


1. 深入理解滴滴海外业务模式、流程和系统架构,和相关产品技术、业务运营高效沟通,设计合理的数据仓库架构。
2. 充分利用滴滴现有的各种数据仓库及反作弊处理平台,设计、开发和维护高效、可扩展的大数据处理系统,以支持安全反作弊业务的数据驱动决策和业务发展。设计并优化离线/实时数仓模型(如 ODS、DWD、DWS、ADS 分层),支持实时报表、监控和风控等场景。
3. 对多源异构数据(日志、事件消息、API、爬虫数据等)进行清洗、解析和结构化处理,提取关键业务信息。解决数据清洗中的 脏数据、格式混乱、缺失值、重复数据 等问题,提升数据质量。与数据开发、算法、业务团队协作,理解需求并构建高效的数据处理流程。
4. 跟踪大数据领域的新技术、新工具,不断探索并引入以提升团队的技术能力和项目效率。优化流式计算任务的 资源利用率(如 Flink 任务调优、Kafka 分区策略调整)。
5. 国际化安全反作弊技术团队其他开发工作。
包括英文材料
学历+
数据仓库+
Spark+
Kafka+
ETL+
MySQL+
Redis+
HBase+
ClickHouse+
Doris+
SQL+
Python+
Java+
Scala+
脚本+
JSON+
XML+
Logstash+
Linux+
Prometheus+
Grafana+
算法+
相关职位

logo of didi
社招3年以上技术

1. 深入理解滴滴海外业务模式、流程和系统架构,和相关产品技术、业务运营高效沟通,设计合理的数据仓库架构。 2. 充分利用滴滴现有的各种数据仓库及反作弊处理平台,设计、开发和维护高效、可扩展的大数据处理系统,以支持安全反作弊业务的数据驱动决策和业务发展。设计并优化离线/实时数仓模型(如 ODS、DWD、DWS、ADS 分层),支持实时报表、监控和风控等场景。 3. 对多源异构数据(日志、事件消息、API、爬虫数据等)进行清洗、解析和结构化处理,提取关键业务信息。解决数据清洗中的 脏数据、格式混乱、缺失值、重复数据 等问题,提升数据质量。与数据开发、算法、业务团队协作,理解需求并构建高效的数据处理流程。 4. 跟踪大数据领域的新技术、新工具,不断探索并引入以提升团队的技术能力和项目效率。优化流式计算任务的 资源利用率(如 Flink 任务调优、Kafka 分区策略调整)。 5. 国际化安全反作弊技术团队其他开发工作。

更新于 2025-06-16
logo of didi
社招技术

岗位职责: 1、参与滴滴网约车业务数据建设,负责某一业务子方向的数据开发工作; 2、能够深入了解负责方向业务特点,结合数仓建模理论,进行具体的模型抽象与设计; 3、数据仓库ETL流程的优化及解决相关技术问题,在稳定性、扩展性、成本等角度有自己的思考与实践; 4、通过深入理解业务特点,通过数据建设为业务赋能,创造业务价值;

更新于 2025-09-03
logo of didi
社招技术

1、参与滴滴网约车业务数据建设,负责某一业务子方向的数据开发工作; 2、能够深入了解负责方向业务特点,结合数仓建模理论,进行具体的模型抽象与设计; 3、数据仓库ETL流程的优化及解决相关技术问题,在稳定性、扩展性、成本等角度有自己的思考与实践; 4、通过深入理解业务特点,通过数据建设为业务赋能,创造业务价值;

更新于 2025-06-09
logo of netease
社招3年以上网易云音乐

1、负责音乐离线数据仓库的研发,通过合理的数据架构,保障内外数据的准确性、一致性和稳定性,包括数据清洗、模型设计、数据治理及稳定性保障; 2、深入理解业务,通过对业务策略的洞察,收敛业务数据需求,提供系统性的解决方案并落地; 3、与数据分析师合作推动数据为产品运营赋能,通过技术创新让数据为业务发展带来价值。

更新于 2024-12-04