小米大数据开发工程师
社招全职5-10年A95445地点:北京状态:招聘
任职要求
1、精通Unix/Linux操作系统下Java或Scala开发,有良好的编码习惯,有扎实的计算机理论基础; 2、熟练掌握大数据处理技术栈,有丰富的Hadoop/Spark的实际项目使用经验,使用过Flink/Doris/Holo等更佳; 3、大数据开发工作至…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责企业级数据仓库设计、建模、规范以及研发工作; 2、深入理解业务需求,规划数据仓库建设的整体方向和技术路线,构建快速、准确、灵活、实用的数据仓库,挖掘发挥数据的价值; 3、保证数据仓库的及时、准确、稳定产出,构建好用的数据仓库; 4、打造行业一流的数据仓库团队; 5、与小伙伴一起调研和实践热门数据仓库组件和技术(数据湖、TiDB、FlinkSql、实时数仓等)。
包括英文材料
Unix+
[英文] The UNIX® Standard
https://www.opengroup.org/membership/forums/platform/unix
https://www.youtube.com/watch?v=IrDUcdpPmdI
UNIX is an operating system which was first developed in the 1970s, and has been under constant development ever since.
Linux+
https://ryanstutorials.net/linuxtutorial/
Ok, so you want to learn how to use the Bash command line interface (terminal) on Unix/Linux.
https://ubuntu.com/tutorials/command-line-for-beginners
The Linux command line is a text interface to your computer.
https://www.youtube.com/watch?v=6WatcfENsOU
In this Linux crash course, you will learn the fundamental skills and tools you need to become a proficient Linux system administrator.
https://www.youtube.com/watch?v=v392lEyM29A
Never fear the command line again, make it fear you.
https://www.youtube.com/watch?v=ZtqBQ68cfJc
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Scala+
编程规范+
[英文] Google Style Guides
https://google.github.io/styleguide/
Every major open-source project has its own style guide: a set of conventions (sometimes arbitrary) about how to write code for that project. It is much easier to understand a large codebase when all the code in it is in a consistent style.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
还有更多 •••
相关职位
社招网易数智
1、负责网易大数据平台的Iceberg等大数据组件迭代研发。 2、负责Iceberg等技术在业务上的实践落地以及问题分析诊断。 3、 参与Hive等组件在大数据元数据服务方面的稳定性建设以及问题诊断。
更新于 2025-04-17杭州
社招A166444A
1、为大规模推荐系统设计和实现合理的离线/实时数据架构; 2、设计和实现灵活可扩展、稳定、高性能的存储系统和计算模型; 3、生产系统的Trouble-shoting,设计和实现必要的机制和工具保障生产系统整体运行的稳定性; 4、打造业界领先的离在线存储、批式流式计算框架等分布式系统,为海量数据和大规模业务系统提供可靠的基础设施。
更新于 2025-02-20北京

社招5年以上技术
1、负责哈啰街猫业务基础数据的建设,包括基础数据模型建立和维护,报表的开发,业务系统的数据开发等; 2、理解哈啰街猫投喂、电商等业务,根据业务需求建立用户画像体系和标签体系,支持推荐和用户运营; 3、参与数据产品及应用的研发工作,挖掘数据业务价值,助力数据化运营;
更新于 2025-02-12上海

社招
团队内80%+都活跃在开源社区,有多名Committer. 欢迎对大数据底层技术有兴趣的小伙伴,一起挑战自我!(非数据仓库方向) 工作base可选:苏州/北京/成都 岗位描述: 基于hadoop/flink/spark/hive/cloud native等开源技术 1. 负责大数据集群规划、运维工作;负责大数据集群技术问题攻关,集群调优,源码解读,Bug fix等; 2. 负责大数据公共组件、中间件的开发工作; 3. 负责存储组件、批处理、流计算、OLAP、ML/DL,通过技术和业务场景的紧密结合,让数据发挥最大业务价值 4. 支撑数据中台建设;支撑业务结合需求设计高扩展、高性能、高可用的大数据业务系统;
更新于 2025-02-26苏州