
巨人网络数据开发实习生
实习兼职实习生地点:上海状态:招聘
任职要求
1.计算机、软件工程、数学和统计相关专业的本科或研究生在读学生,能实习半年以上; 2.熟悉数仓体系架构,数据建模方法,可熟练使用SQL开发; 3.熟悉Hadoop生态圈,掌握Hive/Impal…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.分布式数据仓库开发与管理,并参与数仓模型设计和研发; 2.各数据指标的设计和开发,优化交付质量和时效性; 3.参与数仓核心系统开发和数据治理工作; 4.协助开发和维护数据报表、数据可视化工具,支持业务部门的数据分析需求。
包括英文材料
SQL+
https://liaoxuefeng.com/books/sql/introduction/index.html
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。
https://sqlbolt.com/
Learn SQL with simple, interactive exercises.
https://www.youtube.com/watch?v=p3qvj9hO_Bo
In this video we will cover everything you need to know about SQL in only 60 minutes.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
Impala+
[英文] Impala Tutorials
https://impala.apache.org/docs/build/html/topics/impala_tutorial.html
This section includes tutorial scenarios that demonstrate how to begin using Impala.
HBase+
[英文] HBase Tutorial
https://www.tutorialspoint.com/hbase/index.htm
HBase is a data model that is similar to Google's big table designed to provide quick random access to huge amounts of structured data. This tutorial provides an introduction to HBase, the procedures to set up HBase on Hadoop File Systems, and ways to interact with HBase shell.
还有更多 •••
相关职位
实习数据开发
1. 参与车辆数据平台数据仓库及数据应用服务的研发工作; 2. 参与实时、离线、流批一体数据仓库的建设,数据方案设计,模型开发,指标体系的开发和数据治理; 3. 支持业务团队的数据分析工作,负责面向业务的统计报表,数据提取等工作; 4. 参与解决项目中的问题和技术难题,线上疑难问题排查和解决; 5. 理解数据仓库架构,在项目实施的过程中,发现并解决各种维度/粒度的数据问题。
北京
实习车辆控制
1. 参与车控算法的RD和开发项目,负责车控算法数仓建立、数据集成的工作; 2. 设计和开发高效、可扩展的ETL数据管道,优化数据清洗、转换和加载流程; 3. 参与数据仓库(如Hive、ClickHouse)、实时数仓(如Flink、Kafka)的架构设计与开发; 4. 对接业务需求,开发数据服务接口,为数据分析、机器学习等场景提供高质量数据支持; 5. 解决大数据集群的性能瓶颈,调优Hadoop/Spark/Flink等框架的资源利用率与计算效率。
北京
社招软件研发
作为蔚来汽车整车应用软件中心数据算法组的数据开发实习生,你的职责包括: 1. 基于智能网联汽车大数据,建立功能与业务分析框架,定量分析用户行为,推进整车应用软件的持续更新。 2. 参与团队平台化数字化建设,提供数据建模与开发支持。 3. 与产品经理、数据科学家深度合作,打造车-云-算法闭环生态。
更新于 2023-06-28上海
