阿里巴巴阿里国际-高级数据研发工程师(商业化)-杭州
社招全职3年以上技术类-数据地点:杭州状态:招聘
任职要求
岗位要求: 1) 3 年以上相关工作经验; 2) 有从事分布式数据存储与计算平台应用开发经验,有离线计算Hadoop/Spark/ODPS或流计算Storm/Flink的开发经验尤佳; 3) 较为丰富的数据仓库及数据平台的架构经验,精通数据仓库建模及ETL设计开发…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
团队介绍: 我们是一支全球化、多元化、专业化的数据先锋团队,以技术为引擎,以数据为纽带,驱动全球20亿消费者与数千万商家的数字化商业生态。立足中国,服务全球,每天处理覆盖东南亚、欧洲、美洲等多时区的跨境数据洪流,在多语言、多文化、多法规的复杂场景中,打造“数据&AI技术驱动业务”的全球化数据中台。 数据在国际化场景真正成为业务发展的引擎,数据团队成员有数据工程师、研发工程师、数据科学家和算法同学。 团队致力于构建全新的满足安全合规的国际化大数据架构体系;统一的用户/商品/商家资产体系建设,含统一的DMP和选品平台;面向海外商家数据服务的生意参谋及数据银行支撑业务全链路数据驱动闭环,打造从站外竞对机会发现到商品供给和用户增长的数据智能服务Agent平台; 我们秉承简单开放、创新能力、匠心精神的团队文化; 岗位职责: 1) 运用离线批处理与实时流数据技术,建设国际数据体系,包括数据处理、数据采集、数据质量及稳定性保障、数据治理、智能化和自动化建设,搜推广,外投,交易等数据经验; 2) 同数据产品与技术研发协作,为业务方,提供数据洞察和产品化解决方案,与AIDC业务一同成长; 3) 结合业务场景与运营痛点,通过数据+算法+工程化能力,不断完善AIDC的数据化运营能力;
包括英文材料
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Apache Storm+
[英文] Tutorial
https://storm.apache.org/releases/2.6.0/Tutorial.html
In this tutorial, you'll learn how to create Storm topologies and deploy them to a Storm cluster.
https://www.baeldung.com/apache-storm
This tutorial will be an introduction to Apache Storm, a distributed real-time computation system.
Flink+
https://nightlies.apache.org/flink/flink-docs-release-2.0/docs/learn-flink/overview/
This training presents an introduction to Apache Flink that includes just enough to get you started writing scalable streaming ETL, analytics, and event-driven applications, while leaving out a lot of (ultimately important) details.
https://www.youtube.com/watch?v=WajYe9iA2Uk&list=PLa7VYi0yPIH2GTo3vRtX8w9tgNTTyYSux
Today’s businesses are increasingly software-defined, and their business processes are being automated. Whether it’s orders and shipments, or downloads and clicks, business events can always be streamed. Flink can be used to manipulate, process, and react to these streaming events as they occur.
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
还有更多 •••
相关职位
社招3年以上技术类-数据
1.负责阿里巴巴国际事业部数据体系的建设,通过数据+算法+工程化,赋能业务,提供全链路、可分析的业务服务能力;可识别、可洞察的算法服务能力;配置化、可复用的数据技术能力;更直观、更具指导性的产品化能力 2.建设集团核心的数据资产,数据业务与新零售业务深度结合,提供人群运营、商品管理、品类运营、内容运营、线上线下联动运营等数据服务,利用数据、分析、算法、产品化等数据能力,为集团新零售场景提供数据服务化、数据业务化的整套数据及产品解决方案 3.建设数据中台的数据稳定性体系,建设丰富的技术+业务元数据,完善数据引擎和服务,聚焦在保障手段线上化、服务化和保障策略可演练这两个场景的开发;结构化业务场景,抽象通用业务逻辑,沉淀可复用的数据洞察能力,通过模版化和组件化提升数据架构扩展性,从而支持数据产品的快速迭代和横向扩展
更新于 2025-09-30杭州
社招2年以上技术类-数据
1、建设国际数字商业集团商品数据资产体系,构建全网比价、选品、商机发现等核心能力,助力业务高效运转; 2、协同产技,通过数据+算法+工程化能力,提供数据洞察与产品化解决方案,提升业务数据化运营能力。
更新于 2025-05-26杭州
社招
1、负责核心业务域数据体系的规划和建设,通过数据产品和数据服务等方式,高效支撑业务场景的数据需求 2、深度理解业务,通过对业务策略和痛点的分析,制定系统性端到端的数据解决方案并落地 3、负责数据资产建设、数据质量与稳定性管理,构建共享融通的数据平台,让数据标准更规范、数据获取更高效
更新于 2025-05-23杭州