滴滴27届秋储-数据研发实习生(国际化-风险数据)
实习兼职数据类地点:北京 | 上海状态:招聘
任职要求
1、2027 届在校生,硕士及以上学历(优秀本科生亦可),计算机、大数据等相关专业优先 2、掌握大数据核心技术栈,熟悉 Hadoop、Hive、Spark、Flink 等至少一种主流大数据框架,了解数据仓库建模理论 3、熟练使用 SQL,具备复杂 SQL 编写与优化能力…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、基于 Spark、Hive、Flink 等大数据组件,参与完成特征数据离线数仓分层设计、数据体系建设与模型效能报表开发,为算法模型提供可靠的数据支持 2、参与数据质量监控体系建设,设计数据校验规则,定位并解决数据异常问题,保障数据准确性与完整性 3、探索大数据技术在业务中的落地应用,参与性能优化、任务调度优化、数据治理等方向的技术攻坚。
包括英文材料
学历+
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Flink+
https://nightlies.apache.org/flink/flink-docs-release-2.0/docs/learn-flink/overview/
This training presents an introduction to Apache Flink that includes just enough to get you started writing scalable streaming ETL, analytics, and event-driven applications, while leaving out a lot of (ultimately important) details.
https://www.youtube.com/watch?v=WajYe9iA2Uk&list=PLa7VYi0yPIH2GTo3vRtX8w9tgNTTyYSux
Today’s businesses are increasingly software-defined, and their business processes are being automated. Whether it’s orders and shipments, or downloads and clicks, business events can always be streamed. Flink can be used to manipulate, process, and react to these streaming events as they occur.
还有更多 •••
相关职位
实习数据类
1、参与滴滴国际金融支付、信贷、信用卡离线、实时数据集市和实时指标开发工作 2、参与滴滴国际金融部门离线、实时相关数据规划、设计以及落地 3、参与风控实时数据计算和服务的性能优化与运维,为业务提供稳定的服务 4、了解数据架构以及实践落地经验。
更新于 2026-04-23北京|杭州
实习产品类
1、参与体验治理运营平台搭建,涵盖通用治理能力建设、特征体系搭建、正负向治理策略挖掘及运营平台、治理数据查询等核心模块,聚焦治理业务提效 2、面对多区域、多品类、多场景的复杂业务环境,理解业务逻辑并抽象为通用能力和模块,协调业务、研发等跨团队资源,推动功能落地 3、基于业务发展动态,持续迭代平台功能与易用性,构建支撑治理业务高效运转的核心基建,成为加速业务增长的关键驱动力。
更新于 2026-04-27北京
实习数据类
1、参与滴滴数据中台的智能化升级与数仓建设工作,对多源数据进行整合、清洗、存储,构建面向BI分析与AI应用的高质量数据资产,满足实时、离线、湖仓一体等多样化场景需求 2、参与面向AI的数据基础设施建设,包括资产标准化、数据湖(Iceberg/Hudi)的探索与应用,驱动业务智能决策等提供高质量数据支持 3、与产品、商分、业务团队紧密协作,深入理解业务需求与智能化产品目标,提供高效、可靠的数据支持,推动数据驱动的产品改进及AI功能落地(如智能归因、个性化推荐) 4、制定和优化数据开发规范与流程,引入AI开发工具(如大模型辅助SQL生成、代码Review、自动化质检),提升团队研发效率与代码质量,建立智能化数据开发心智 5、跟踪业界最新技术动态,重点关注AI与数据技术融合趋势(如Data+AI、数据湖仓的AI增强),将成熟技术引入实际项目,持续提升数据团队的技术先进性与业务竞争力。
更新于 2026-04-15北京