百度BMR后端开发高级工程师(J73370)
社招全职3年以上ACG地点:北京状态:招聘
任职要求
-计算机相关专业本科及以上学历,3年以上Spark研发经验 -熟练掌握Spark核心技术,具备丰富的Spark调优经验 -熟悉Hadoop生态圈相关技术,如HDFS、YARN、Hive等 -具备良好的编程习惯和代码规范,熟悉J…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
-负责大数据BMR托管平台的产品研发工作 -对Spark任务进行性能调优,提升数据处理速度和效率 -深入研究Spark技术,跟踪行业动态,为团队提供技术支持和创新思路 -编写相关技术文档,协助团队进行知识共享和技术传承
包括英文材料
学历+
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
HDFS+
https://hadoop.apache.org/docs/r1.2.1/hdfs_design.html
The Hadoop Distributed File System (HDFS) is a distributed file system designed to run on commodity hardware.
https://www.ibm.com/cn-zh/think/topics/hdfs
Hadoop 分布式文件系统 (HDFS) 是一种管理大型数据集的文件系统,可在商用硬件上运行。
还有更多 •••
相关职位
暂无相关职位