夸克数据挖掘工程师
校招全职智能信息秋季2026届应届生招聘地点:北京 | 广州 | 杭州状态:招聘
任职要求
如果你有强的动手能力和学习能力,熟悉一门数据科学语言,如Python、R、SQL、Java、Perl等,或熟悉Unix或者Linux操作; 如果你具备扎实的专业基础和数理逻辑,良好的沟通能力和团队合作,主动积极,乐于面对挑战; 如果你有参与过数据处理、分析、挖掘、算法等相关项目更好; 如果你有大数据操作的实际经验,对Hadoop、Hive、Hbase等分布式平台有一定的理解更好; 那么成为团队的一员吧,这里就是你的舞台。 一段全新、有意思的旅程正待开启!为了更全面的展现你自己,你还可以在简历中附上你认为自己最有意思的爱好、特长、经历,或是对未来有意思的畅想,没有限制,此项非必填。加入我们,一起打开有意思的未来!
工作职责
阿里巴巴智能信息事业群,聚焦AI在信息服务赛道的创新应用,从工具到服务,持续为用户提供高效、智能的AI应用。智能信息事业群核心产品为夸克、通义、UC浏览器、书旗小说、超级汇川等,以多产品矩阵,覆盖横跨各年龄段的7亿+用户人群,服务超10万+客户。 如果你想接触和使用先进的机器学习的框架和统计方法设计方案,解决业务中的从未被解决过的问题; 如果你想通过Python/R等流行的语言编写高效的机器学习算法,参与阿里巴巴集团智能信息事业群大数据体系的模型设计、开发、维护,通过元数据、质量体系有效的管理和组织EB级的数据; 如果你想参与阿里巴巴集团智能信息事业群大数据产品的研发,发挥你的商业Sense,通过数据分析和算法来洞察数据背后的机会,来探索大数据商业化,释放大数据的价值; 如果你想接触世界领先的大数据处理与应用的技术和平台,获得大数据浪潮之巅的各类大牛的指导; 那就加入我们吧!
包括英文材料
数据科学+
https://roadmap.sh/ai-data-scientist
Step by step roadmap guide to becoming an AI and Data Scientist
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
R+
[英文] R Tutorial
https://www.w3schools.com/r/
R is often used for statistical computing and graphical presentation to analyze and visualize data.
SQL+
https://liaoxuefeng.com/books/sql/introduction/index.html
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。
https://sqlbolt.com/
Learn SQL with simple, interactive exercises.
https://www.youtube.com/watch?v=p3qvj9hO_Bo
In this video we will cover everything you need to know about SQL in only 60 minutes.
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Perl+
https://www.perl.org/learn.html
Useful links if you are interested in learning Perl
https://www.runoob.com/perl/perl-tutorial.html
本教程适合想从零开始学习 Perl 编程语言的开发人员。当然本教程也会对一些模块进行深入,让你更好的了解 Perl 的应用。
Unix+
[英文] The UNIX® Standard
https://www.opengroup.org/membership/forums/platform/unix
https://www.youtube.com/watch?v=IrDUcdpPmdI
UNIX is an operating system which was first developed in the 1970s, and has been under constant development ever since.
Linux+
https://ryanstutorials.net/linuxtutorial/
Ok, so you want to learn how to use the Bash command line interface (terminal) on Unix/Linux.
https://ubuntu.com/tutorials/command-line-for-beginners
The Linux command line is a text interface to your computer.
https://www.youtube.com/watch?v=6WatcfENsOU
In this Linux crash course, you will learn the fundamental skills and tools you need to become a proficient Linux system administrator.
https://www.youtube.com/watch?v=v392lEyM29A
Never fear the command line again, make it fear you.
https://www.youtube.com/watch?v=ZtqBQ68cfJc
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
HBase+
[英文] HBase Tutorial
https://www.tutorialspoint.com/hbase/index.htm
HBase is a data model that is similar to Google's big table designed to provide quick random access to huge amounts of structured data. This tutorial provides an introduction to HBase, the procedures to set up HBase on Hadoop File Systems, and ways to interact with HBase shell.
相关职位
社招3年以上算法开发岗
1. 负责零售业务的数据挖掘、分析与洞察,优化用户画像标签体系,支持精准营销和个性化推荐。 2. 参与特征工程开发,从海量数据中提取高价值特征,优化模型效果,提升业务核心指标(如转化率、留存率)。 3. 参与跨团队项目,与产品、运营团队协作,充分理解业务诉求,识别业务机会并推动项目决策。
更新于 2025-06-08
社招3年以下网易游戏(互娱)
1、负责日常的广告数据处理和分析工作,包括但不限于用户标签数据计算、数据清理、数据分析和常规建模; 2、基于海量玩家行为,利用统计分析、机器学习、数据挖掘等方法,负责设计和优化用户数据挖掘模型; 3、负责数据挖掘应用功能的设计和开发,包括结构化数据处理、预测模型建立、用户行为研究和用户属性生成、效果评估、以及功能的后续迭代优化等工作
更新于 2025-08-01

社招
工作职责: 促销敏感增益算法: 开发并优化促销策略中敏感增益算法,通过数据挖掘和分析提高促销活动的效果和客户回报率。 APP高潜人群识别: 利用数据挖掘技术,识别并细分APP用户中的高潜力人群,帮助运营团队实现精准营销和个性化服务。 APP用户特征预测: 构建预测模型,分析和预测APP用户行为特征,包括但不限于购买倾向、使用习惯等,为产品优化和市场营销提供预测性建议。 渠道转化贡献度归因和增量归因算法: 设计和应用归因算法,评估不同渠道对业务转化的贡献度,并实施增量归因算法来识别渠道效果的真实提升。 APP基础数据标签清洗: 负责对APP基础数据进行标签清洗和整理,确保数据的准确性和可靠性,以支持后续的数据挖掘和分析工作。
更新于 2025-03-10