百度数据产品经理(J84890)
社招全职3年以上MEG地点:北京状态:招聘
任职要求
1、硕士及以上学历,计算机、统计学、人工智能相关专业,3年以上数据产品经验,大厂数据挖掘/数据科学背景(如BAT/TMD等)优先。 2、精通Hadoop/Spark/Flink等大数据技术栈,熟悉CNN/Transformer等模型的数据需求,主导过亿级规模数据项目。 …
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、主导数据产品规划,构建支持大模型训练的高质量数据体系,包括数据采集、清洗、标注、特征工程等全链路方案设计,确保数据与业务目标对齐。 2、深入理解大模型(如NLP/CV多模态)技术原理,设计数据驱动的模型优化策略,提升训练效率及效果。 3、协同算法团队,制定数据标注标准、评估指标及迭代策略,解决数据偏差、长尾分布等问题,设计数据增强、合成及自动化标注方案,优化大规模预训练与微调数据的供给效率。 4、联动业务、算法、工程团队,推动数据闭环落地,支撑推荐、搜索、AIGC等场景的模型迭代,提炼数据产品通用化能力。
包括英文材料
学历+
数据挖掘+
https://www.youtube.com/watch?v=-bSkREem8dM
Database vs Data Warehouse vs Data Lake
https://www.youtube.com/watch?v=7rs0i-9nOjo
数据科学+
https://roadmap.sh/ai-data-scientist
Step by step roadmap guide to becoming an AI and Data Scientist
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Flink+
https://nightlies.apache.org/flink/flink-docs-release-2.0/docs/learn-flink/overview/
This training presents an introduction to Apache Flink that includes just enough to get you started writing scalable streaming ETL, analytics, and event-driven applications, while leaving out a lot of (ultimately important) details.
https://www.youtube.com/watch?v=WajYe9iA2Uk&list=PLa7VYi0yPIH2GTo3vRtX8w9tgNTTyYSux
Today’s businesses are increasingly software-defined, and their business processes are being automated. Whether it’s orders and shipments, or downloads and clicks, business events can always be streamed. Flink can be used to manipulate, process, and react to these streaming events as they occur.
还有更多 •••
相关职位
社招3年以上MEG
-负责制定并执行用户增长策略,通过数据分析、市场调研等手段,识别并挖掘潜在用户群体 -优化用户增长渠道,提升用户覆盖度,制定并执行用户激活、留存和召回计划 -分析用户行为数据,洞察用户需求,为产品迭代和功能优化提供数据支持和决策依据 -跨部门协作,与中台、运营、市场、技术等团队紧密合作,推动用户增长相关项目的落地和执行
更新于 2025-08-14北京
社招3年以上全球运营类
1. 统筹营销各业务域(外投、达人、联盟、CRM、归因等)数据工作; 2. 对营销数据进行治理,统一数据口径、字段、应用; 3. 针对外投各环节数据漏斗,挖掘各环节数据提升机会并落地;
更新于 2026-04-07南京|上海
社招5年以上产品经理岗
根据公司整体战略,制定数据产品的长期发展方向和落地策略。 制定并落实产品路线图,根据市场趋势、用户反馈和公司战略,确定产品功能和优化优先级。 主导数据产品的需求分析、架构设计、功能定义,并推动产品研发、测试和上线。 与研发、算法团队合作,构建高效的数据采集、处理和分析平台,支持业务数据的全面获取和深度挖掘。 结合跨境电商业务场景,开发精准的用户画像、行为分析、商品推荐等模型和工具,为运营决策提供数据支持。 构建数据指标体系,监控数据变化,分析运营效果,为业务优化提供数据洞察和建议。 建立完善的数据安全管理体系,确保用户隐私数据的安全合规使用。 制定数据分类分级标准,建立数据访问控制机制,防范数据泄露风险。 关注国内外数据安全法律法规,确保数据产品符合合规要求。
更新于 2025-06-19北京