logo of baidu

百度大数据平台研发工程师(J85756)

社招全职1年以上ACG地点:北京状态:招聘

任职要求


-本科及以上学历,计算机专业优先
-熟悉Hadoop/Spark/Flink/Hive/Doris等任一项主流开源技术,具备类似技术的引擎研发经验
-有1年以上大规模系统软件的研发经验,如操作系统、存储系统、数据库系统、计算系统等,熟悉网络编程多线程编程、操作系统原理
-对分布式数据计算或数据分析的原理、架构及使用调优有一定经验和深入见解者优先,熟悉SparkDorisFlink优先
-具备扎实的编程能力,良好的工程素养,团队合作能力和沟通能力强,抗压能力强,具有较强的自我驱动力

工作职责


-研发大规模分布式计算系统,包括高吞吐的批量计算、高时效的流式计算、高效能的OLAP等
-为全百度提供高性能、高可用、低成本的大数据计算服务
-探索新架构、新技术、新硬件,设计面向大模型的数据处理引擎和服务
-深入理解业务系统,理解项目客户需求,设计和实现符合用户需求的大数据平台系统,确保项目顺利验收
包括英文材料
学历+
Hadoop+
Spark+
Hive+
Doris+
网络编程+
多线程+
数据分析+
相关职位

logo of baidu
社招3年以上ACG

-负责大数据管理开发平台的研究、设计和开发,包括数据采集、存储、开发、处理、作业调度等工作 -负责大数据管理开发平台的设计和优化,提高产品的实用性和用户体验 -持续优化平台的稳定性和性能,维护系统的稳定运行 -深入理解业务系统,理解项目客户需求,设计和实现符合用户需求的大数据平台系统,确保项目顺利验收

更新于 2025-06-09
logo of bytedance
社招A118197

团队介绍:BABI平台是通过内部商业化/市场化的方式,以商品化为主要核心手段,围绕IT基础设施和人力成本提供一站式的平台支持,服务公司看清楚各业务部门从预算到成本到收入的经营过程,结合数据化、智能化的方式帮助业务线做好成本经营。 1、参与字节跳动技术团队及火山引擎业务等经营分析系统的大数据研发工作,包括但不限于BI可视化、OLAP分析、数据流调度、数据智能化服务等核心模块; 2、参与FinOps数据治理工作,持续提升数据易用性及数据质量,为经营分析提效赋能; 3、深入了解业务和系统痛点,给出优质的解决方案,并持续提升系统稳定性、可靠性、可扩展性,解决技术难题。

更新于 2024-12-03
logo of sf
社招3-5年

负责大数据DataPaaS计算、存储组件相关开发,如:mpp引擎、spark native、统一资源调度,计算云原生混部,分布式计算、存储多机房融合等等

更新于 2025-07-07
logo of tongyi
校招通义2026届秋

1. 负责AI平台大数据架构演进以及推进落地:根据不同领域场景大模型落地需求,与算法团队和IT基础设施团队紧密合作,提出大模型训练和优化数据规模、数据类型、数据结构等建议,确保架构有效实施。 2. 负责搭建大模型数据平台:支撑大模型数据的存储、预处理(去重、相似度计算、脱敏等)诉求,针对大模型场景、数据类型、数据规模具有高扩展性,以支持大模型数据集持续迭代,实现高质量数据集沉淀,确保数据安全和隐私保护。 3. 与算法团队紧密协作,抽象研发诉求,落地为便捷实用的的平台能力,提升整个团队的工作效率和数据处理能力。

更新于 2025-08-13