阿里巴巴业务技术-高级数据研发工程师-物流技术
社招全职3年以上地点:杭州状态:招聘
任职要求
1、有较为丰富的数仓设计&开发经验,熟悉ETL分层建设方法、数据、维度建模以及领域驱动设计; 2、熟悉HBase/Hadoop/Spark/Hive/Flink等大数据工具等,具备丰富的海量数据加工处理和优化经验;…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、参与淘天物流数据体系建设,通过实时和离线大数据模型体系的构建和开发,提供统一、可靠的数据服务和产品化能力; 2、参与淘天物流数据架构、技术体系、数据模型的规划建设,包括数据采集、数据治理、数据质量及稳定性保障体系、数据处理智能化和自动化体系的建设; 3、能够针对业务场景探索提供大数据解决方案,并实现数据产品化。
包括英文材料
ETL+
https://www.ibm.com/think/topics/etl
ETL—meaning extract, transform, load—is a data integration process that combines, cleans and organizes data from multiple sources into a single, consistent data set for storage in a data warehouse, data lake or other target system.
https://www.youtube.com/watch?v=OW5OgsLpDCQ
It explains what ETL is and what it can do for you to improve your data analysis and productivity.
DDD+
https://ddd-crew.github.io/ddd-starter-modelling-process/
This process gives you a step-by-step guide for learning and practically applying each aspect of Domain-Driven Design (DDD) - from orienting around an organisation’s business model to coding a domain model.
[英文] Domain Driven Design
https://medium.com/@matteopampana/list/domain-driven-design-c1efaabe287e
Everyone talks about DDD, but how many understand and correctly apply Domain-Driven Design? I want to be one of them.
https://redis.io/glossary/domain-driven-design-ddd/
Domain-Driven Design (DDD) is a software development philosophy that emphasizes the importance of understanding and modeling the business domain.
HBase+
[英文] HBase Tutorial
https://www.tutorialspoint.com/hbase/index.htm
HBase is a data model that is similar to Google's big table designed to provide quick random access to huge amounts of structured data. This tutorial provides an introduction to HBase, the procedures to set up HBase on Hadoop File Systems, and ways to interact with HBase shell.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
还有更多 •••
相关职位
社招3年以上技术类-开发
业务技术平台-基础链路-会员&营销团队,作为阿里巴巴重要战略-国际化先锋战队之一,承担着集团实现全球化的艰巨任务。我们依托于强大的底层技术能力,服务于国际化几乎所有的电商业务,助力国际化业务快速发展。希望你加入我们,同我们一道通过技术驱动全球贸易模式的升级,引领中国电子商务、履约供应链等全球化方向,让天下没有难做的生意。 作为团队核心开发,参与相关系统架构设计、领域能力设计、业务产品需求,以及技术研发和产品上线工作。 工作描述: 1. 面向国际化【电商&金融&物流】,为买家、卖家、供应商、ISV等提供端到端的基础链路会员、地址、营销服务,包括注册/登录/用户中心/认证授权/地址管理/营销设计/营销计算等基础功能; 2. 负责Lazada/AliExpress/Daraz/Miravia等电商业务的业务支撑,包括但不局限于业务架构优化、业务需求编码、工具平台开发,SAAS化产品能力打造、日常/大促稳定性保障等工作。
更新于 2025-06-12杭州
社招3年以上技术类-数据
1、负责物流部财务域的数据模型设计,实现大规模数据处理和分析的解决方案 2、优化数据架构,提升数据加工性能,确保数据及时产出;构建数据质量监控体系,保障业务数据质量 3、协同产技团队做好财务出账和对账工作,同时支撑好财务领域的数据产品和数据解决方案建设 4、与业务团队紧密合作,理解业务需求,提供数据支持和提升用数体验
更新于 2025-05-26杭州
社招3年以上软件开发岗
1、参与京东物流新客户引入、中小客户增长、散单业务、B端权益和大模型相关智能系统的需求调研和需求分析,撰写相关专业的技术文档; 2、搭建系统开发环境,完成系统框架和核心代码的实现; 3、项目概要设计、详细设计、开发计划等的编制并实施; 4、系统开发测试、部署和集成; 5、负责解决开发过程中的技术问题。
更新于 2025-06-08北京