快手【留用实习】数据研发工程师
实习兼职J1018地点:北京状态:招聘
任职要求
1、本科及以上学历,计算机、数学、统计、数据科学、大数据技术等相关专业; 2、有较强的动手能力和学习能力,熟悉一门数据处理语言,如SQL、Java、Python等; 3、有较强的逻辑思维、解决问题的能力,有较强的沟通和团队协作能力; 4、对Hadoop相关分布式平台及生态有一定的理解,参与过数据处理、挖掘等相关项目的优先。
工作职责
1、参与快手大数据体系的设计与建设,通过数据仓库、元数据、数据管理等体系,管理和建设几千P的数据; 2、参与各类数据专题体系(社交、内容生产/消费、直播、游戏、电商、商业化等)的建设,通过对数据的建设和应用理解,支持各类的业务管理决策和业务运营; 3、参与快手大数据产品的研发,研究洞察分析、效果监控、归因分析、ABTest等数据能力,结合自己的商业sense,发掘数据的业务价值; 4、获得数据领域的各类大牛的指导,徜徉在世界领先的大数据处理和应用技术的海洋中。
包括英文材料
学历+
数据科学+
https://roadmap.sh/ai-data-scientist
Step by step roadmap guide to becoming an AI and Data Scientist
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
SQL+
https://liaoxuefeng.com/books/sql/introduction/index.html
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。
https://sqlbolt.com/
Learn SQL with simple, interactive exercises.
https://www.youtube.com/watch?v=p3qvj9hO_Bo
In this video we will cover everything you need to know about SQL in only 60 minutes.
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
相关职位
实习J1020
1、数据库内核优化及二次开发工作; 2、自研数据库产品开发; 3、数据库智能运维系统开发; 4、数据库Cloud Native开发工作; 5、数据库故障定位、处理及源码bug修复; 6、数据传输服务产品开发。
更新于 2025-04-10
实习J1014
1、参与快手EB级大数据平台分布式计算引擎相关系统的研发与优化工作,解决实际业务需求与性能问题。子系统包括但不限于Hive、Spark,Presto、Flink、Druid、Clickhouse等; 2、接受大数据平台系统设计与实现复杂度的挑战,分析和发现系统的优化点,负责推动系统的合理性、可靠性、可用性的提升; 3、和开源社区保持交流,从社区引入对公司业务场景有帮助的特性与系统,或将内部研发的功能贡献到社区。
更新于 2025-06-23
实习J1020
1、负责白盒交换机系统研发; 2、负责网关系统研发,包括L4层负载均衡网关、VxLan网关、流量调度网关、安全网关等; 3、负责虚拟(容器)网络系统研发; 4、负责高性能网络(RDMA/高性能用户态协议栈)系统研发; 5、负责网络监控、遥测(Telemetry/INT)、故障诊断、可视化、网络大数据平台研发; 6、负责网络SDN控制器、自动化及IBN平台研发; 7、负责光传输网络管控平台及T-SDN研发。
更新于 2025-04-10