小米高级数据开发工程师 - 商业化
社招全职5年以上A37728地点:北京状态:招聘
任职要求
1. 计算机相关专业,本科及以上学历, 5年以上生产项目开发经验; 2. 熟练掌握spark/fink、hadoop、paimon、doris、kafka等一种以上大数据开发组件; 3. 熟练掌握java…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 承担商业化场景下PB级数据的业务数仓和算法数仓搭建工作 2. 面向业务分析诊断等复杂场景构建湖仓一体的OLAP查询解决方案,提升数据查询效率 3. 深入钻研大数据底层框架、优化数据架构,提升数据计算和存储效率; 4. 对高度复杂的数据链路进行治理,完善数据质量保障和成本控制能力
包括英文材料
学历+
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Doris+
https://doris.apache.org/docs/gettingStarted/what-is-apache-doris
Kafka+
https://developer.confluent.io/what-is-apache-kafka/
https://www.youtube.com/watch?v=CU44hKLMg7k
https://www.youtube.com/watch?v=j4bqyAMMb7o&list=PLa7VYi0yPIH0KbnJQcMv5N9iW8HkZHztH
In this Apache Kafka fundamentals course, we introduce you to the basic Apache Kafka elements and APIs, as well as the broader Kafka ecosystem.
还有更多 •••
相关职位
社招5年以上A194338
1. 深入理解数据分析需求,负责小米广告海量数据的高性能数据分析平台,帮助广告商业化提效 2. 深入理解广告业务,负责小米广告系统智能诊断与监控,保障系统稳定运行 3. 负责小米广告系统与广告主间投放策略、数据归因等能力交互,承载高并发、低时延的架构需求 4. 负责广告数据平台智能问数、智能诊断Agent相关开发
更新于 2025-08-06北京
社招2年以上技术类
1. 负责公司内部商业化数据的开发和维护,为产品和营销团队提供数据支持和分析服务; 2. 设计和开发商业化数据仓库和数据集市,实现数据的采集、清洗、存储和分析; 3. 负责数据架构的设计和维护,确保数据准确性、完整性和安全性; 4. 参与业务需求分析和数据建模工作,编写SQL语句完成数据提取、转换和加载(ETL); 5. 能够独立完成数据问题的排查和处理,解决数据质量和性能问题; 6. 具有良好的沟通能力和团队协作能力,与不同部门的业务人员和技术人员合作,推进数据项目的进展。
更新于 2025-04-07上海
社招3-5年后端开发
岗位职责: - 参与小红书商业化数据产品开发工作,业务方向包括但不限于销售业绩、客户分析、代理商盯盘等 - 与产品、运营、后端、测试、运维等多角色协同工作,包括业务理解,需求评审,方案沟通,系统维护等 - 设计并实现高效、可扩展的数据架构,确保系统能够支持复杂的业务逻辑和大数据量处理,持续提升交付质量和效率 - 负责复杂数据链路架构、稳定性、成本、性能等方面的优化工作,保障线上服务运行稳定,资源使用合理
更新于 2025-10-16北京