百度大数据架构工程师(J83246)
社招全职IDG地点:北京状态:招聘
任职要求
-数据敏感度强,逻辑思维能力出色,商业理解能力强,有足够的好奇心和自驱力 -扎实的数据处理和分析能力,能够熟练使用SQL、R/Python等语言,熟悉常用大数据技术…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
-设计和实施高性能的大数据架构,满足业务需求,领导数据平台的技术方向,推动技术创新和最佳实践 -对现有的数据处理流程进行分析和优化,提高系统稳定性、性能和可扩展性,提高需求交付效率 -监控和调优大数据系统的性能,解决技术瓶颈 -开展全生命周期的数据治理,设计和实现工具化体系,并推进落地,确保可持续的数据质量 -负责业务模块的指标体系搭建,能描述业务现状、快速定位拆解问题。 -日常业务数据解读,对短期异常进行归因,通过探索性的数据分析,迅速定位业务问题或者发现机会,指引业务策略和产品迭代方向 -与运营、产研、数据分析工程师及其他部门完成高质量沟通,保证推动数据分析结论的落地和持续优化
包括英文材料
SQL+
https://liaoxuefeng.com/books/sql/introduction/index.html
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。
https://sqlbolt.com/
Learn SQL with simple, interactive exercises.
https://www.youtube.com/watch?v=p3qvj9hO_Bo
In this video we will cover everything you need to know about SQL in only 60 minutes.
R+
[英文] R Tutorial
https://www.w3schools.com/r/
R is often used for statistical computing and graphical presentation to analyze and visualize data.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
还有更多 •••
相关职位
社招3年以上ACG
-负责大数据管理开发平台的研究、设计和开发,包括数据采集、存储、开发、处理、作业调度等工作 -负责大数据管理开发平台的设计和优化,提高产品的实用性和用户体验 -持续优化平台的稳定性和性能,维护系统的稳定运行 -深入理解业务系统,理解项目客户需求,设计和实现符合用户需求的大数据平台系统,确保项目顺利验收
更新于 2025-06-09北京
社招A206708
字节跳动推荐架构团队企业服务方向,负责字节跳动旗下国内和海外的推荐系统 toB 产品架构设计、开发与演进,打造敏捷高效的推荐数据架构能力。 1、负责火山引擎智能推荐平台和海外推荐产品的数据架构持续演进; 2、建设领先的索引、特征和样本生产回溯与存储方案,支持算法高效迭代; 3、建设灵活稳固合规的大数据底座,满足云化、私有化、全球化的严苛挑战; 4、建设体系化的流程与工具,优化系统成本提升整体的稳定性与效率。
更新于 2024-01-03上海
社招A202598
1、为抖音集团广告算法模型的流式训练、批式训练、生成式训练提供数据支持(用户行为序列/用户行为表征/候选标的表征); 2、针对广告业务全链路的数据需求,从数据全生命周期视角设计并实现高性能、高可用、低延迟的数据生产/加工/存储/消费为一体的通用解决方案; 3、参与探索内容理解能力、复杂前沿模型在广告业务中的应用与架构平台化,构建并优化商业化商品解决方案; 4、负责建设数据平台与架构,针对不同类型的数据制定研发标准和规范,支持各类数据的探查和发现,支持海量业务需求,保障业务的可持续迭代。
更新于 2025-04-02上海