百度大数据研发工程师(J85698)
实习兼职MEG地点:北京状态:招聘
任职要求
-本科及以上学历,计算机、数学或相关专业,3年以上大数据开发经验 -扎实的编程能力,熟悉Java/Scala/Python至少一门语言 -精通Hadoop/Spark/Flink/K…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
-负责百度APP、信息流、及百家号业务的大数据平台建设,支撑亿级用户数据PB级分析与实时计算需求 -参与数据采集、存储、计算、治理全链路研发,优化数据架构与处理性能 -搭建实时/离线数仓,支持精准推荐、用户画像、业务分析等场景 -擅长大数据技术(如Flink/Spark/Hadoop/数据湖等),推动技术落地与效率提升 -解决高并发、海量数据场景下的技术难题,保障系统稳定性和可扩展性
包括英文材料
学历+
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Scala+
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
还有更多 •••
相关职位
社招MEG
-负责用户增长相关的数据仓库建设 -参与用户增长离线特征数据(使用Hadoop/Spark)和实时数据流(使用Flink)的建设 -负责数据指标、常用数据报表的建设和分析 -参与用户增长计算治理、数据治理平台化建设和数据通路性能分析和优化
更新于 2025-06-05北京
社招A140437
1、广告各类在线业务的离线数据加工与在线数据服务开发与维护; 2、数据服务接口及产品需求研发迭代,代码review、bug修复及日常服务运维; 3、针对海量数据处理和查询需求,设计适应业务变化的合理的多维数据分析系统架构,满足多样性的需求; 4、海量日志清洗加工,并抽象出可以多业务复用的数据模型。
更新于 2023-10-20北京
社招3年以上J6NQP
1、负责抖音/抖音火山版等多个业务线的策略算法建设与优化工作; 2、通过海量数据,分析与挖掘各种潜在关联,不断优化策略效果,保障用户体验; 3、负责实时及离线特征抽取、融合,为数据挖掘及策略平台提供特征服务; 4、负责大数据能力在产品功能上的落地,推动产品数据化和智能化。
更新于 2021-01-19北京