优酷优酷-数据研发工程师-北京/杭州
社招全职3年以上地点:北京 | 杭州状态:招聘
任职要求
1、本科及以上学历,计算机相关专业,3年以上数据研发相关工作经验; 2、熟练掌握Hadoop、Hive、Spark等大数据分布式计算框架,具备一定的Java/Python开发经验优先; 3、熟悉常用的数据挖掘算法,对机器学习算法有比较深入的理解,同时…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责优酷数据平台的数据架构设计和落地实施工作,建设面向多业态、多元域的数据中台; 2、负责数据资产的数据建设,建设通用数据标准,完善数据治理能力,推进各板块数据标准化建设,提升数据使用效率; 3、负责各业务域的数据模型搭建,推进数据在业务场景中的应用,并进行沉淀优化; 4、负责构建基于大模型能力的数据应用场景,赋能业务实现价值。
包括英文材料
学历+
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
还有更多 •••
相关职位
社招
1. 参与在线营销的设计、执行、衡量与效果改进,分析设计营销价值衡量指标,验证营销动作和后续效果的因果关系 2. 洞察行业市场趋势和消费者价值,将数据洞察转化为行动推荐,驱动品牌定位、消费者管理与营销效率,提升营销人员决策质量。
更新于 2025-06-17北京|杭州
社招3年以上技术类-开发
蚂蚁集团图计算团队致力于构建面向AI时代的数据底座,打造支持万亿级图数据处理的高性能图数据库系统。该系统将深度服务于搜索推荐特征管理、大模型训练数据治理、图神经网络(GNN)推理加速、实时决策图谱等前沿场景,为蚂蚁集团及外部客户提供统一的数据基础设施。 该职位职责描述如下: 1、负责图数据库内核功能研发,包括查询引擎、计算引擎、分布式架构的研发; 2、负责使用图数据库解决业务的实际问题;
更新于 2025-06-17北京|杭州
社招技术
1.参与国际化出行核心业务系统的相关研发工作 2.参与服务端业务架构设计、模块划分和开发 3.完成系统优化和重构,提供系统可用性和稳定性 4.积极跟其他团队沟通和配合,推动项目进展,讨论并提出有建设性的意见
更新于 2025-04-17杭州