饿了么饿了么-数据研发专家-算法数据
社招全职3年以上技术类-数据地点:杭州 | 上海状态:招聘
任职要求
1. 计算机、数学、统计等相关专业本科及以上学历,3年以上互联网大数据研发相关工作经验,需有较强的逻辑思维能力和业务sense; 2. 需熟练掌握Flink实时技术,有丰富开发、排查、调优经验;熟练掌握 SQL、Java 语言,具有较强的编码能力; 3. 熟悉大数据生态体系,包括不限于 Hive、HDFS、Spark…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 主要参与搜索推荐、用户增长、零售等业务算法数据建设,通过实时、离线数据技术,支持算法样本、特征等开发工作; 2. 参与实时、离线数据链路治理,通过数据治理与质量优化,支持算法系统性能提升与成本优化; 3. 基于对业务理解和产品诉求的抽象,参与到面向业务应用的流批一体数据湖仓架构设计和研发落地; 4. 深入理解电商平台的算法超算业务,通过过程性数据分析,持续定位挖掘潜在问题,助力业务发展;
包括英文材料
学历+
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Flink+
https://nightlies.apache.org/flink/flink-docs-release-2.0/docs/learn-flink/overview/
This training presents an introduction to Apache Flink that includes just enough to get you started writing scalable streaming ETL, analytics, and event-driven applications, while leaving out a lot of (ultimately important) details.
https://www.youtube.com/watch?v=WajYe9iA2Uk&list=PLa7VYi0yPIH2GTo3vRtX8w9tgNTTyYSux
Today’s businesses are increasingly software-defined, and their business processes are being automated. Whether it’s orders and shipments, or downloads and clicks, business events can always be streamed. Flink can be used to manipulate, process, and react to these streaming events as they occur.
SQL+
https://liaoxuefeng.com/books/sql/introduction/index.html
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。
https://sqlbolt.com/
Learn SQL with simple, interactive exercises.
https://www.youtube.com/watch?v=p3qvj9hO_Bo
In this video we will cover everything you need to know about SQL in only 60 minutes.
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
HDFS+
https://hadoop.apache.org/docs/r1.2.1/hdfs_design.html
The Hadoop Distributed File System (HDFS) is a distributed file system designed to run on commodity hardware.
https://www.ibm.com/cn-zh/think/topics/hdfs
Hadoop 分布式文件系统 (HDFS) 是一种管理大型数据集的文件系统,可在商用硬件上运行。
还有更多 •••
相关职位
社招3年以上技术类-数据
1、主导团队的湖仓一体、流批一体的数据技术架构的落地,并沉淀多模态的数据处理技术框架,推进整体数据架构体系的升级; 2、参与构建企业级 Data Agent,融合 LLM 与业务数据打造智能决策大脑; 3、参与供应链平台数据资产体系的建设,包括数据领域模型的规划建设以及领域知识资产化的建设,通过数据+算法+工程化+大模型的相关能力,赋能业务与产品的自动化、智能化;
更新于 2025-08-04杭州
社招2年以上技术类-数据
1、负责支付宝内容业务体系的数据规划设计和数据资产建设,为业务构建稳定、可持续和安全生产态的数据基建,整体保障业务数据支持与数据稳定性 2、面向业务决策支持、短视频用增投放、内容分成激励等关键业务场景,提供端到端的业务数据服务与数据解决方案,灵活支撑业务数据化运营工作,助力业务增长 3、负责业务域内的算法数据资产化建设(离在线的序列、特征、样本、实验等),深度支撑算法数据基建的迭代优化,有效促进算法效率的提升
更新于 2025-06-03杭州
社招6年以上
1、负责淘系各类决策数据体系(用户、营销、供应链、搜推、价格力等)的建设,通过数据+工程化,联合BI赋能管理决策,提供高质、稳定的1+N+N决策数据产品; 2、建设淘系核心的数据资产(用户画像、商品资产等),利用数据、分析、算法、产品化等数据能力,联合数据科学,赋能集团新零售场景数据化运营转型; 3、构建淘系模型、稳定性、质量、成本等治理体系,建设丰富的技术+业务元数据,通过工程化能力,打造先进的淘宝数据治理平台,服务前台业务; 4、引入AIGC大模型能力,通过数据+算法+工程化,打磨智能化的数据取数工具,实现数据普惠。
更新于 2025-07-11杭州