阿里云诚云科技-资深后端开发工程师-CIO线-数据技术部
社招全职诚云科技地点:杭州状态:招聘
任职要求
1、技术能力: 熟练Python/Java,熟悉SQL及大数据处理框架(Hadoop、Spark、Flink)。 熟悉数据资产管理相关技术栈及数据治理方法论。 了解AI模型开发与部署,能结合业务需求设计智能应用。 2、数据安全与质量能力 掌握数据质量管理工具,能定义数据质量规则并实现自动化监控。 有告警系统开发经验,熟悉阿里云dataworks质量管理工具,能设计实时告警与自动化响应流程。 3、业务理解与协作能力 能理解业务部门的数据需求,将抽象需求转化为可落地的技术方案。 具备跨团队协作能力,与产品、算法、业务团队紧密配合,推动项目高效交付。 4、加分项 有数据中台/数据湖/数据仓库建设经验。 熟悉数据资产管理工具,有数据治理经验。 熟悉阿里云相关技术,具备云原生架构设计能力。
工作职责
1、数据资产管理平台开发与治理 构建企业级数据资产管理平台,构建数据清晰的血缘,支持高效溯源。 建立元数据管理、数据血缘追踪、质量监控与安全合规体系。 2、知识图谱构建与优化 从结构化/非结构化数据中提取实体与关系,构建行业知识图谱(如客户关系图谱)。 通过规则引擎、NLP模型持续优化图谱质量。 3、AI助理系统开发 集成大语言模型(LLM)与垂直知识库,开发智能问答、自然语言查询及自动化报表功能。 设计API/Web接口,支持业务用户通过自然语言调用数据服务(如“查询某产品的销售趋势”)。 搭建模型训练与部署框架,实现AI能力快速迭代。 4、数据安全合规与质量管理 建立数据质量指标(完整性、一致性、准确性),开发自动化检测与修复工具。 实现异常数据实时告警(如延迟、权限越权),并通过邮件/SMS/企业微信通知责任人。 5、平台性能与稳定性保障 优化Spark/Flink任务性能,提升高并发场景下的平台稳定性。 监控系统运行状态,设计容灾机制与自动化运维工具,降低故障率。
包括英文材料
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
SQL+
https://liaoxuefeng.com/books/sql/introduction/index.html
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。
https://sqlbolt.com/
Learn SQL with simple, interactive exercises.
https://www.youtube.com/watch?v=p3qvj9hO_Bo
In this video we will cover everything you need to know about SQL in only 60 minutes.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Flink+
https://nightlies.apache.org/flink/flink-docs-release-2.0/docs/learn-flink/overview/
This training presents an introduction to Apache Flink that includes just enough to get you started writing scalable streaming ETL, analytics, and event-driven applications, while leaving out a lot of (ultimately important) details.
https://www.youtube.com/watch?v=WajYe9iA2Uk&list=PLa7VYi0yPIH2GTo3vRtX8w9tgNTTyYSux
Today’s businesses are increasingly software-defined, and their business processes are being automated. Whether it’s orders and shipments, or downloads and clicks, business events can always be streamed. Flink can be used to manipulate, process, and react to these streaming events as they occur.
数据治理+
https://www.ibm.com/think/topics/data-governance
Data governance is the data management discipline that focuses on the quality, security and availability of an organization’s data.
https://www.youtube.com/watch?v=uPsUjKLHLAg
Building data fabric eliminates the technological complexities of data governance so users can connect to the right data at the right time, regardless of where it resides.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
系统设计+
https://roadmap.sh/system-design
Everything you need to know about designing large scale systems.
https://www.youtube.com/watch?v=F2FmTdLtb_4
This complete system design tutorial covers scalability, reliability, data handling, and high-level architecture with clear explanations, real-world examples, and practical strategies.
相关职位

社招5年以上
1. 主导平台增长业务系统的开发与优化,包括但不限于:私域运营管理中台、用户增长与活动系统、触达与用户召回平台。 2. 负责系统架构设计、性能优化和技术升级,确保系统高可用性、可扩展性和安全性。

社招5年以上平台类
1. 基于Python(少量 Go),负责中台服务的核心功能开发与架构设计; 2. 设计并实现高可用的服务接口,支撑多类Web产品的业务需求; 3. 执行代码审查(Code Review),完善技术文档,保障服务稳定性与可扩展性; 4. 与前端、算法团队协作,解决服务端与客户端交互中的技术问题; 5. 参与服务性能优化、负载均衡及分布式部署方案设计; 6. 协助规划开发任务,合理分配资源,推动项目高效落地。
更新于 2025-08-13
社招旅游业务开发
用车用户订单业务线产品需求分析与评审,提出有建设性的技术解决方案,帮助业务实现业绩目标; 负责订单支付、状态流转、快照等域的业务开发和维护; 根据所负责的需求进行技术方案设计,文档输出,并进行代码的编写、优化及单元测试;
更新于 2025-03-31