高德地图高德Amap-大数据挖掘专家-数据业务
社招全职3年以上技术类-数据地点:北京状态:招聘
任职要求
人才画像: 1、【技能要求】精通大数据体系,精通实时和离线数据处理flnk/storm/spark/presto/hive等,有平台搭建和开发经验者优先,有大型项目管理经验优先; 2、【过往经验】三年以上实时+离线数据仓库工作经验,有跟算法实际合作经验者优先。 3、【综合能力】熟悉数据仓库模型、业务敏感度高、熟悉ETL流程…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
工作职责: 1、搭建地图数据数据仓库,建设实时和离线数据内容,还原地图数据生产的全过程,并沉淀通用数据资产,服务地图数据的各项数据需求; 2、与算法工程师深度合作,使用实时/离线数仓进行大数据挖掘,从而进行智能生产和调度优化,来生成面向未来的更精准、实时、个性化的地图数据; 3、与数据分析师深度合作,进行深入的业务诊断、抽象分析指标。
包括英文材料
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Apache Storm+
[英文] Tutorial
https://storm.apache.org/releases/2.6.0/Tutorial.html
In this tutorial, you'll learn how to create Storm topologies and deploy them to a Storm cluster.
https://www.baeldung.com/apache-storm
This tutorial will be an introduction to Apache Storm, a distributed real-time computation system.
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Presto+
[英文] What is Presto?
https://prestodb.io/what-is-presto/
https://www.tutorialspoint.com/apache_presto/index.htm
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
还有更多 •••
相关职位
社招3年以上数据科学
1、研究数据挖掘或统计学习领域的前沿技术,整合全站海量多维数据,进行全站数据挖掘; 2、深入业务场景,利用全域数据资产和海量多维数据,运用机器学习和统计分析的方法,探索平台新的业务增长点; 3、根据公司需要寻找和采集相关数据,对原始数据进行清理、甄别、归类和整合,并实现流程自动化。
北京|上海
社招5年以上内容理解
1、 深入业务场景,利用全域数据资产和海量多维数据,挖掘DMP标签和特征体系,提升广告模型推荐效果 2、基于全域数据资产和商业化业务场景,挖掘潜力SPU商品,实现精准投放
北京|上海
社招3-5年内容理解
1、 整合海量多维数据,进行全站数据挖掘,构建用户画像体系、时空知识体系,并参与建设全站核心数据资产管理平台; 2、 深入业务场景,利用全域数据资产和海量多维数据,运用机器学习和统计分析的方法,探索平台新的业务增长点,为各业务系统提供模型和特征支撑;
北京|上海