logo of xiaohongshu

小红书Spark数据引擎研发专家

社招全职3-5年数据引擎地点:上海 | 北京 | 杭州状态:招聘

任职要求


1、至少熟悉一款主流大数据框架及源码,比如SparkStarRocksClickHouseImpalaDorisMySQL等;
2、熟悉Spark生态系统,如RSS,Kuybbi, HMS等,有实际的Spark 代码编写、调优部署和问题排查经验。
3、熟悉主流的OLAP引擎的技术优势,如向量化执行、SIMD编程、列式存储、并行编程、异步编程、查询编译等;
4、精通C++/Java编程语言,对K8S,元数据有一定的了解和使用经验。
加分项:a. 熟悉Velox、CK等任意一项向量化算子实现者可加分  b. 熟悉Spark on K8S 并有实际部署经验者可加分 c. 了解包括推广搜在内的算法数据工程链路,并有实际治理经验者可加分

工作职责


1、参与小红书Spark离线引擎的研发工作,支撑小红书云原生大规模离线数据处理场景,包括数据仓库、机器学习等场景,提升离线处理引擎的性能和稳定性
2、参与小红书Spark Native Engine 和 Serverless Spark 架构的研发工作,提升任务时效性,同时利用离在线混部降低资源成本
3、参与统一元数据工作,为小红书算法AI团队管理非结构化数据,提供统一访问方式,简化算法数据开发链路,并进行数据治理
包括英文材料
大数据+
Spark+
StarRocks+
ClickHouse+
Impala+
Doris+
MySQL+
OLAP+
C+++
Java+
Kubernetes+
C+
算法+
相关职位

logo of dewu
社招2年以上技术类

1、【引擎研发】负责Spark、Presto、Hive 为基础的大数据查询引擎内核研发,跟进社区版本,改进性能,提升稳定性,研发新功能,修复内核BUG; 2、【业务支撑】负责排查、定位、解决生产集群问题,与运维同学一起维护生产集群的稳定性,协助业务方一起使用好大数据平台; 3、【平台规划】参与规划公司计算平台的技术演技,提升计算平台湖仓能力,基于云IAAS或者自建IAAS,打造高稳定性、高性能、低成本的计算平台。

更新于 2023-12-26
logo of kuaishou
社招D7195

1、参与快手EB级大数据平台计算引擎相关系统的研发与优化工作,解决实际业务需求与性能问题; 2、接受大数据平台系统设计与实现复杂度的挑战,分析和发现系统的优化点,负责推动系统的合理性、可靠性、可用性的提升; 3、和开源社区保持交流,从社区引入对公司业务场景有帮助的特性与系统,或将内部研发的功能贡献到社区。

更新于 2025-03-07
logo of kuaishou
社招D7195

1、参与快手EB级大数据平台计算引擎相关系统的研发与优化工作,解决实际业务需求与性能问题; 2、接受大数据平台系统设计与实现复杂度的挑战,分析和发现系统的优化点,负责推动系统的合理性、可靠性、可用性的提升; 3、和开源社区保持交流,从社区引入对公司业务场景有帮助的特性与系统,或将内部研发的功能贡献到社区。

更新于 2025-03-07
logo of aliyun
社招5年以上云智能集团

1. 负责SQL引擎核心优化,深入理解线上业务SQL使用方式,关注业界通用Benchmark,分析性能瓶颈并针对性改进等。 2. 负责SQL引擎增量计算能力演进,打造业界领先的增量计算产品 3. 负责MC智能数仓的开发和能力建设,提升MC整体的性价比和易用性 4. 支持SQL引擎线上业务,包括疑难问题答疑、线上稳定性改进、提升系统可观测性及用户使用体验等。

更新于 2025-09-15