
智能互联阿里云智能-产品专家-大数据&AI产品
社招全职3年以上地点:北京 | 杭州 | 上海状态:招聘
任职要求
1、具备数据湖、大数据平台或云计算基础设施领域的产品或项目经验,熟悉主流湖格式(Paimon、Iceberg、Hudi、Delta Lake)及元数据管理(Hive Metastore、Glue Catalog、Unity Catalog)技术体系,了解分布式存储与计算引擎(Flink、Spark、Ray)的基本原理与适用场景,有数据湖或湖仓一体相关产品经验者优先。 2、具备 AI 与大数据融合领域的知识储备,理解向量索引(DiskANN/HNSW)、全文检索、语义检索等信息检索技术,了解 AI Agent、RAG、Embedding 等应用范式对底层数据基座的需求,能够将 AI 场景需求转化为数据平台产品能力定义。 3、具备深厚的技术理解力与产品架构能力,能够定义多模态数据的统一管理模型…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、产品规划与架构设计:深入理解企业级数据湖与 AI Agent 数据基座的市场需求,跟踪 Lakehouse 向 Agentic Lake 的演进趋势,围绕统一元数据治理、全模态数据管理(结构化/半结构化/非结构化/向量/Agent Context)、五级索引体系等核心能力,完成产品规划、功能定义与架构设计,构建面向 AI Agent 的 Agent-Ready 数据湖产品体系。 2、产品管理与跨团队协同:负责 DLF 产品全生命周期管理,协调 Data+AI 等多引擎协同团队,联动技术研发、测试、解决方案架构师、销售及运营等多职能团队,确保产品从设计到上市的高效交付。 3、开源生态与市场竞争力建设:深度参与 Apache Paimon、Apache Fluss、Apache Iceberg、Lance 等开源项目的产品化策略制定,持续跟踪国际头部竞品及业界主流云厂商在统一 Catalog、湖仓一体领域的产品动态,结合湖流一体(Lake-Streaming)、全模态湖仓存储、全模态索引等差异化能力,制定竞争策略并推动产品市场优势持续扩大。 4、客户价值交付与场景落地:面向汽车(自动驾驶数据管理)、金融(实时风控)、零售(多媒体数据治理)、互联网(推荐/电商)等重点行业,梳理客户数据湖建设与 AI 应用的核心场景需求,设计 Tables 接口与 Files 接口的双层服务能力,推动 Agent 检索召回 API、Context API 等新型接口的场景化落地,提升客户转化与留存。 5、产品体验迭代与技术趋势洞察:持续追踪用户反馈,围绕行列级权限管控、数据生命周期管理、数据质量、湖格式性能等维度优化产品体验;紧跟 AI Agent、RAG、向量检索、流批一体等前沿技术发展,将技术趋势转化为产品创新机会,驱动产品持续迭代升级。
包括英文材料
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Iceberg+
https://iceberg.apache.org/spark-quickstart/
This guide will get you up and running with Apache Iceberg™ using Apache Spark™, including sample code to highlight some powerful features.
https://www.baeldung.com/apache-iceberg-intro
This tutorial will discuss Apache Iceberg, a popular open table format in today’s big data landscape.
https://www.youtube.com/watch?v=TsmhRZElPvM
You’ve probably heard about Apache Iceberg™—after all, it’s been getting a lot of buzz.
Hudi+
[英文] Spark Quick Start
https://hudi.apache.org/docs/quick-start-guide
we will walk through code snippets that allows you to insert, update, delete and query a Hudi table.
https://www.oreilly.com/library/view/apache-hudi-the/9781098173821/
Overcome challenges in building transactional guarantees on rapidly changing data by using Apache Hudi.
https://www.youtube.com/watch?v=pyK18sDYnS0
In this video, I'll introduce you to one of the most popular Data Lake solutions out there, Apache Hudi!
Delta Lake+
https://delta.io/learn/getting-started/
This guide helps you quickly explore the main features of Delta Lake.
[英文] Delta Lake Tutorials
https://delta.io/learn/tutorials/
Try out the latest tutorials for the open-source Delta Lake project.
[英文] Tutorial: Delta Lake
https://docs.databricks.com/aws/en/delta/tutorial
This tutorial introduces common Delta Lake operations on Databricks.
https://www.youtube.com/watch?v=fkWxiesfrgk
In this Delta Lake course, we will go though all the important concepts of Delta Lake.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
Unity+
https://www.youtube.com/watch?v=XtQMytORBmM
Unity is an amazingly powerful game engine - but it can be hard to learn. Especially if you find tutorials hard to follow and prefer to learn by doing. If that sounds like you then this tutorial will get you acquainted with the basics - and then give you some goals to learn the rest by yourself.
还有更多 •••
相关职位
社招8年以上技术类-开发
1、承担MaxCompute管控系统架构师角色,负责产品技术架构演进方向 2、面向全球不同客户设计合理的产品方案,梳理存储、计算、售卖、控制台、运维体系架构,确定技术方案选型 3、承担MaxCompute管控系统设计、研发、测试、发布与运维 4、与MaxCompute各研发团队+SRE中台团队+阿里云售卖平台配合,共同推进技术项目按要求落地
更新于 2025-04-02杭州
社招5年以上云智能集团
1、负责阿里云专有云IAAS/大模型/PAAS/大数据/中间件等产品的运维专家支持、整体解决方案服务及优化建议,使客户的IT架构、性能等层面得到更好的优化与提升,制定相关的技术方案并予以支持落地。 2、负责对事件、故障的跟踪、剖析、总结与知识库沉淀,出具技术方案并推动相关产品团队解决落地,同时赋能一线运维团队自运维能力; 3、负责产品巡检工具与问题诊断分析工具开发,提升客户云平台的预警与异常自发现能力,提升用户的满意度。 4、直面AI智能运维、云原生Serverless架构、全业务容灾、系统自治等巅峰挑战,提供技术底盘及业务能力支持。 5、完成核心技术攻关,识别和解决潜在的技术风险
更新于 2025-08-27杭州|西安
社招5年以上技术类-开发
1. 参与 PB 级分布式引擎设计与开发,包括存储、索引等的功能实现与性能和成本优化; 2. 参与稳定性建设,优化分片调度与负载均衡机制,研发不同高可用产品形态,包括:同城多可用区、异地容灾、全球多活等; 3. 跟踪业界前沿动态,学习和吸纳开源的大数据计算和存储技术,帮助产品探索和实现更多的玩法。
更新于 2025-04-15北京|杭州|上海