米哈游AI数据湖产品经理
校招全职产品策划类地点:上海状态:招聘
任职要求
任职要求: 1. 教育背景:本科及以上学历,计算机、软件工程、信息管理、人工智能、数据科学等相关专业优先。 2. 具备互联网、大数据或人工智能相关领域产品经理经验。 3. 熟悉产品开发流程,能够与技术、设计、测试、运营等多方团队高效协作,推动产品按时、高质量落地。 4. 数据分析能力强,能基于用户使用数据和业务需求快速输出可行性解决方案。 5. 具备良好的业务视野、项目管理能力和沟通协调能力,能够独立管理跨部门及跨团队合作项目。 6. 强烈的责任心和自驱力,能在高速变化和竞争激烈的环境中高效推进工作。 7. 热爱AI和大数据领域,对行业动态、技术前沿有很强的敏感度。 加分项 加分项: 1. 有构建或运营过数据管理平台/数据标注平台/AI训练平台等相关经验者优先。 2. 了解数据库、大数据、数据湖、数据仓库等相关技术,了解数据管道与数据处理流程(例如 Spark、Flink、Hadoop、Delta Lake、LakeHouse 等)。 3. 对多模态数据(音视频、文本、图像等)的处理和检索有一定知识和实践储备,熟悉相关AI算法或开发框架更佳。 4. 对大规模数据存储与管理、AI模型训练或多模态数据处理有实际的项目经验
工作职责
工作职责: 1. 负责 AI 数据湖平台的整体规划与迭代,包括但不限于: • 多模态数据集管理功能(音视频、文本、图像等)。 • 数据预览和数据质量监控机制,支持大规模音视频和文本数据的批量预览和快速查询。 • 跨模态数据检索与分析能力的设计与优化,探索更高效的数据索引和复合检索方式。 2. 与技术团队协同,设计并推行数据存储、数据处理、元数据管理等核心功能模块的产品方案,确保平台稳定性与易用性。 3. 进行用户需求调研与竞品分析,洞察行业趋势,及时调整产品路线图,保证平台对内对外的竞争力。 4. 与研发、架构、AI算法团队和测试团队紧密合作,跟进产品功能开发与上线,对质量和进度负责。 5. 制定并优化平台的使用流程和用户体验,持续收集用户反馈,制定改进方案以提升用户满意度。 6. 负责平台的性能指标和数据指标追踪,对产品策略进行持续评估和迭代,并向管理层汇报产品进度与成果。
包括英文材料
学历+
数据科学+
https://roadmap.sh/ai-data-scientist
Step by step roadmap guide to becoming an AI and Data Scientist
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
数据分析+
[英文] Data Analyst Roadmap
https://roadmap.sh/data-analyst
Step by step guide to becoming an Data Analyst in 2025
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Flink+
https://nightlies.apache.org/flink/flink-docs-release-2.0/docs/learn-flink/overview/
This training presents an introduction to Apache Flink that includes just enough to get you started writing scalable streaming ETL, analytics, and event-driven applications, while leaving out a lot of (ultimately important) details.
https://www.youtube.com/watch?v=WajYe9iA2Uk&list=PLa7VYi0yPIH2GTo3vRtX8w9tgNTTyYSux
Today’s businesses are increasingly software-defined, and their business processes are being automated. Whether it’s orders and shipments, or downloads and clicks, business events can always be streamed. Flink can be used to manipulate, process, and react to these streaming events as they occur.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Delta Lake+
https://delta.io/learn/getting-started/
This guide helps you quickly explore the main features of Delta Lake.
[英文] Delta Lake Tutorials
https://delta.io/learn/tutorials/
Try out the latest tutorials for the open-source Delta Lake project.
[英文] Tutorial: Delta Lake
https://docs.databricks.com/aws/en/delta/tutorial
This tutorial introduces common Delta Lake operations on Databricks.
https://www.youtube.com/watch?v=fkWxiesfrgk
In this Delta Lake course, we will go though all the important concepts of Delta Lake.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
开发框架+
[英文] Understanding Modern Development Frameworks: A Guide for Developers and Technical Decision-makers
https://www.freecodecamp.org/news/understanding-modern-development-frameworks-guide-for-devs/
相关职位
社招产品策划类
工作职责: 1. 负责 AI 数据湖平台的整体规划与迭代,包括但不限于: • 多模态数据集管理功能(音视频、文本、图像等)。 • 数据预览和数据质量监控机制,支持大规模音视频和文本数据的批量预览和快速查询。 • 跨模态数据检索与分析能力的设计与优化,探索更高效的数据索引和复合检索方式。 2. 与技术团队协同,设计并推行数据存储、数据处理、元数据管理等核心功能模块的产品方案,确保平台稳定性与易用性。 3. 进行用户需求调研与竞品分析,洞察行业趋势,及时调整产品路线图,保证平台对内对外的竞争力。 4. 与研发、架构、AI算法团队和测试团队紧密合作,跟进产品功能开发与上线,对质量和进度负责。 5. 制定并优化平台的使用流程和用户体验,持续收集用户反馈,制定改进方案以提升用户满意度。 6. 负责平台的性能指标和数据指标追踪,对产品策略进行持续评估和迭代,并向管理层汇报产品进度与成果。
社招3年以上F0738
1、负责建设多模态数据湖管理产品,向客户提供新一代大模型数据新基建; 2、面向大语言模型、多模态模型、AI Agent提供数据处理、存储和管理能力; 3、进行市场调研,梳理B端客户需求,分析市场空间和机会,提供商业化产品设计方案; 4、负责产品功能设计和规划,推动研发完成产品功能交付,并推荐给解决方案和销售团队,完成商业闭环。
更新于 2025-04-29
社招3年以上A01659
1、打造多模态数据湖计算引擎,向客户提供新一代AI数据算力新基建; 2、负责E-MapReduce产品的设计和规划,提供多模态数据处理和加工能力; 3、挖掘B端客户需求,分析市场空间和机会,给出商业化产品设计方案; 4、负责产品功能设计和规划,推动研发完成产品功能交付,并推荐给解决方案和销售团队,完成商业闭环。
更新于 2025-04-29