小米高级数据开发工程师 - 商业化
社招全职5年以上A37728地点:北京状态:招聘
任职要求
1. 计算机相关专业,本科及以上学历, 5年以上生产项目开发经验; 2. 熟练掌握spark/fink、hadoop、paimon、doris、kafka等一种以上大数据开发组件; 3. 熟练掌握java、scala、sql等-种以上编程语言; 4. 熟悉doris、clickhouse等OLAP查询引擎,有应用和优化经验优先; 5. 具备出色的编程能力、优秀的逻辑思维能力、良好的沟通能力和团队协作能力。
工作职责
1. 承担商业化场景下PB级数据的业务数仓和算法数仓搭建工作 2. 面向业务分析诊断等复杂场景构建湖仓一体的OLAP查询解决方案,提升数据查询效率 3. 深入钻研大数据底层框架、优化数据架构,提升数据计算和存储效率; 4. 对高度复杂的数据链路进行治理,完善数据质量保障和成本控制能力
包括英文材料
学历+
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Doris+
https://doris.apache.org/docs/gettingStarted/what-is-apache-doris
Kafka+
https://developer.confluent.io/what-is-apache-kafka/
https://www.youtube.com/watch?v=CU44hKLMg7k
https://www.youtube.com/watch?v=j4bqyAMMb7o&list=PLa7VYi0yPIH0KbnJQcMv5N9iW8HkZHztH
In this Apache Kafka fundamentals course, we introduce you to the basic Apache Kafka elements and APIs, as well as the broader Kafka ecosystem.
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Scala+
SQL+
https://liaoxuefeng.com/books/sql/introduction/index.html
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。
https://sqlbolt.com/
Learn SQL with simple, interactive exercises.
https://www.youtube.com/watch?v=p3qvj9hO_Bo
In this video we will cover everything you need to know about SQL in only 60 minutes.
ClickHouse+
[英文] Advanced Tutorial
https://clickhouse.com/docs/tutorial
Learn how to ingest and query data in ClickHouse using the New York City taxi example dataset.
https://www.youtube.com/watch?v=FtoWGT7kS-c
ClickHouse is an open-source column-oriented DBMS for online analytical processing that allows users to generate analytical reports using SQL queries in real-time.
https://www.youtube.com/watch?v=Rhe-kUyrFUE&list=PL0Z2YDlm0b3gcY5R_MUo4fT5bPqUQ66ep
OLAP+
https://www.youtube.com/watch?v=iw-5kFzIdgY
OLAP (for online analytical processing) is software for performing multidimensional analysis at high speeds on large volumes of data from a data warehouse, data mart, or some other unified, centralized data store.
相关职位
社招5年以上A194338
1. 深入理解数据分析需求,负责小米广告海量数据的高性能数据分析平台,帮助广告商业化提效 2. 深入理解广告业务,负责小米广告系统智能诊断与监控,保障系统稳定运行 3. 负责小米广告系统与广告主间投放策略、数据归因等能力交互,承载高并发、低时延的架构需求 4. 负责广告数据平台智能问数、智能诊断Agent相关开发
更新于 2025-08-06
社招2年以上技术类
1. 负责公司内部商业化数据的开发和维护,为产品和营销团队提供数据支持和分析服务; 2. 设计和开发商业化数据仓库和数据集市,实现数据的采集、清洗、存储和分析; 3. 负责数据架构的设计和维护,确保数据准确性、完整性和安全性; 4. 参与业务需求分析和数据建模工作,编写SQL语句完成数据提取、转换和加载(ETL); 5. 能够独立完成数据问题的排查和处理,解决数据质量和性能问题; 6. 具有良好的沟通能力和团队协作能力,与不同部门的业务人员和技术人员合作,推进数据项目的进展。
更新于 2025-04-07
社招3-5年后端开发
岗位职责: - 参与小红书商业化数据产品开发工作,业务方向包括但不限于销售业绩、客户分析、代理商盯盘等 - 与产品、运营、后端、测试、运维等多角色协同工作,包括业务理解,需求评审,方案沟通,系统维护等 - 设计并实现高效、可扩展的数据架构,确保系统能够支持复杂的业务逻辑和大数据量处理,持续提升交付质量和效率 - 负责复杂数据链路架构、稳定性、成本、性能等方面的优化工作,保障线上服务运行稳定,资源使用合理
更新于 2025-10-16