百度数据挖掘工程师(J84539)
社招全职3年以上TPG地点:北京状态:招聘
任职要求
-学历与经验:计算机科学、网络安全、统计学等相关专业硕士及以上学历,3年以上数据挖掘或安全分析经验。有互联网安全领域实战项目经验,熟悉威胁情报分析者优先 -技术要求:精通Python/Scala,熟练使用Spark/Flink进行分布式数据处理,熟悉Hadoop生态及Hive/ES等存储查询工具。深入掌握XGBo…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
-基于海量安全日志、网络流量数据及威胁情报,构建异常检测、入侵识别、恶意行为预测等数据挖掘模型,提升安全防御体系的智能化水平 -设计并优化安全场景下的数据采集、清洗和存储方案,搭建高效的数据分析平台与实时风控系统,支持自动化威胁响应 -主导安全数据标签体系建设,通过用户/IP/设备画像、行为序列分析等手段,挖掘潜在风险点并推动防御策略迭代 -协同安全运营团队完成模型落地与效果验证,输出可解释性分析报告,为安全产品优化提供数据驱动决策支持
包括英文材料
学历+
数据挖掘+
https://www.youtube.com/watch?v=-bSkREem8dM
Database vs Data Warehouse vs Data Lake
https://www.youtube.com/watch?v=7rs0i-9nOjo
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Scala+
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Flink+
https://nightlies.apache.org/flink/flink-docs-release-2.0/docs/learn-flink/overview/
This training presents an introduction to Apache Flink that includes just enough to get you started writing scalable streaming ETL, analytics, and event-driven applications, while leaving out a lot of (ultimately important) details.
https://www.youtube.com/watch?v=WajYe9iA2Uk&list=PLa7VYi0yPIH2GTo3vRtX8w9tgNTTyYSux
Today’s businesses are increasingly software-defined, and their business processes are being automated. Whether it’s orders and shipments, or downloads and clicks, business events can always be streamed. Flink can be used to manipulate, process, and react to these streaming events as they occur.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
还有更多 •••
相关职位
社招3年以上算法开发岗
1. 负责零售业务的数据挖掘、分析与洞察,优化用户画像标签体系,支持精准营销和个性化推荐。 2. 参与特征工程开发,从海量数据中提取高价值特征,优化模型效果,提升业务核心指标(如转化率、留存率)。 3. 参与跨团队项目,与产品、运营团队协作,充分理解业务诉求,识别业务机会并推动项目决策。
更新于 2025-06-08北京
社招3年以下网易游戏(互娱)
1、负责日常的广告数据处理和分析工作,包括但不限于用户标签数据计算、数据清理、数据分析和常规建模; 2、基于海量玩家行为,利用统计分析、机器学习、数据挖掘等方法,负责设计和优化用户数据挖掘模型; 3、负责数据挖掘应用功能的设计和开发,包括结构化数据处理、预测模型建立、用户行为研究和用户属性生成、效果评估、以及功能的后续迭代优化等工作
更新于 2025-08-01广州

社招
工作职责: 促销敏感增益算法: 开发并优化促销策略中敏感增益算法,通过数据挖掘和分析提高促销活动的效果和客户回报率。 APP高潜人群识别: 利用数据挖掘技术,识别并细分APP用户中的高潜力人群,帮助运营团队实现精准营销和个性化服务。 APP用户特征预测: 构建预测模型,分析和预测APP用户行为特征,包括但不限于购买倾向、使用习惯等,为产品优化和市场营销提供预测性建议。 渠道转化贡献度归因和增量归因算法: 设计和应用归因算法,评估不同渠道对业务转化的贡献度,并实施增量归因算法来识别渠道效果的真实提升。 APP基础数据标签清洗: 负责对APP基础数据进行标签清洗和整理,确保数据的准确性和可靠性,以支持后续的数据挖掘和分析工作。
更新于 2025-03-10苏州
