logo of bytedance

字节跳动开源大数据引擎资深专家 - EMR/大数据云平台

社招全职3年以上A35623地点:北京状态:招聘

任职要求


1、计算机相关专业,3年以上大数据或数据库内核研发经验;
2、熟练使用 C/C++/Java/Rust 一种或多种编程语言;
3、熟悉开源大数据开源生态组件或同类商业化的分析型数据库;
4、熟悉大数据应用场景与架构,有超大规模Hadoop/Hive/Spark/Flink/Presto等引擎集群运维使用经验者优先;
5、有源码级优化经验或深入研究者优先,有开源社区贡献者优先。

工作职责


1、参与字节跳动EMR 开源大数据内核研发,打造极速数据分析新范式;
2、深度参与相关开源社区,助力大数据产品提升开源影响力;
3、协助客户处理生产业务中的海量数据,解决疑难问题,发挥数据价值;
4、构建EMR大数据引擎技术竞争力,打造业界领先的引擎生态平台。
包括英文材料
大数据+
内核+
C+
C+++
Java+
Rust+
Hadoop+
Hive+
Spark+
Presto+
相关职位

logo of bytedance
社招3年以上A96870A

1、负责Data+AI方向的ToB产品的演进规划、竞争力建设和研发,打造业内领先的产品; 2、负责计算和存储引擎内核的深度优化,领先开源社区和行业,给客户提供增量价值; 3、负责大模型数据处理框架的研发、数据处理算子的研发,引领市场需求; 4、与火山引擎方舟、机器学习平台等产品深度生态对接,打造AI全链路组合竞争力; 5、支撑客户的预训练、后训练、模型蒸馏、AI搜索、RAG、Agent等场景的数据需求。

更新于 2025-03-10
logo of bytedance
社招3年以上Y3055

1、负责面向客户建设有市场竞争力的大数据开发治理套件、EMR、LAS等大数据平台类产品,丰富火山引擎数据中台产品矩阵,洞察行业的机会点,持续挖掘产品的商业化潜力; 2、能够抽象各行业客户需求,并将需求转化为高品质的产品设计或解决方案; 3、与商业化销售/解决方案配合,对外部客户进行产品推介和宣讲; 4、制定产品的GTM策略和定价,保障产品在行业中的竞争力。

更新于 2022-05-13
logo of aliyun
社招3年以上诚云科技

1、负责阿里云开源大数据平台(Flink/EMR/Spark/StarRocks/ES/Hadoop/K8S)运维工作,包括可观测性链路、监控报警,故障应急及处置、SLA可用率度量提升等 2、研发大数据运维管控平台,通过自动化提升运维效率,包括交付&变更CICD、智能诊断定界等 3、落地AIOps智能运维,通过AI算法提升稳定性,包括异常检测、根因定位及基于大模型&智能体Agent运维落地等 4、负责稳定性架构设计及项目组织推动落地,包括基础架构云原生化、跨AZ高可用架构、产品可运维性架构演进等

更新于 2025-09-25
logo of kuaishou
社招D12135

1、负责流量平台建设,为业务提供可靠的数据支撑,包括行为分析、埋点管理、NEO等平台产品; 2、通过极致的架构优化,结合大数据引擎打造埋点从生产到分析的一站式流量数据产品; 3、通过攻克万亿级数据量下的数据生产和查询加速等挑战及负责关键方案选型提升分析效率。

更新于 2024-10-30