logo of kuaishou

快手大数据计算引擎SRE实习生

实习兼职D7209地点:北京状态:招聘

任职要求


1、2026年及以后毕业,本科及以上学历;
2、熟悉Flink、yarn、CK、Do…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责大数据成本白盒化治理数据建设,对接Finops平台实现大数据资源治理白盒化;
2、负责大数据实时计算、离线计算、CK资源水位治理,帮助业务更好的管理资源使用以及提高平台资源规划效率;
3、探索资源水位预估模型,提高资源管理效率。
包括英文材料
学历+
还有更多 •••
相关职位

logo of bytedance
实习A136120

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:数据平台是字节跳动数据中台部门,横向支持公司多业务线(包括抖音、电商、直播和生活服务等)提供一站式大数据解决方案,涵盖数据的生产、清洗、传输、建模、分析等全流程链路,提供数据开发、实验评估、画像标签、增强分析等多元场景解决能力。同时,数据平台部门也在致力于把字节跳动积累沉淀的数据中台解决方案做商业化输出,让更多行业能够应用我们的产品能力构建自己的数据中台。在火山引擎上,我们提供了营销增长套件,数据中台等相关产品解决方案,为泛互联网、金融、汽车、新零售等行业提供了行业解决方案。 1、负责字节跳动线上大数据产品的SLA体系,容灾体系的建设,故障的自愈等,保障业务的持续可用; 2、为字节跳动集团的数据分析基础设施负责,持续提升服务质量,提升用户体验;和产品、研发团队直接合作,推进客户问题的解决,以及数据产品的持续优化; 3、负责字节跳动大数据产品的SRE平台的研发、自动化建设与持续迭代、引导产品的运维模式向数字化,智能化方向发展演进; 4、参与数据服务产品体系的建设,核心客户交付,项目POC等。

更新于 2025-02-21北京
logo of antgroup
社招3-5年技术类-质量保证

● 负责分布式存储引擎的全生命周期测试管理,制定测试计划、风险评估及资源协调,确保测试覆盖功能、性能、稳定性等核心目标 ● 分析并解决分布式存储引擎中的复杂问题,如分布式事务一致性、引擎性能瓶颈、元数据管理及容灾恢复等 ● 设计并主导存储系统(如分布式存储、文件系统、数据库存储等)的稳定性测试框架,提升测试效率与覆盖率 ● 协同质量、SRE、研发、高可用,主导并跟进落地数智域稳定性专项Action落地,识别关键极端风险并产出预防措施 人员要求: ● 6年以上分布式存储测试开发经验,熟悉存储引擎(如Ceph、HBase、RocksDB)的设计与实现 ● 扎实的代码能力,精通Python/Shell/Go/C++中至少一种语言,能够独立开发测试工具、脚本及自动化框架 ● 能够主导大型项目的整体测试工作,包括测试分析、测试用例落地、测试流程规范、测试进度管理、测试风险发现等 ● 良好的沟通与团队协作能力,能够跨部门推动问题解决 ● 具备大规模分布式存储系统(如PB级数据规模)的测试经验

更新于 2025-07-25北京|杭州
logo of xiaohongshu
社招数据引擎

1、主导大数据PaaS平台建设,以平台产品化和体系化的方式,支撑上述引擎和数据业务方的稳定性、成本和效率的需求。 2、负责大数据实时、离线计算存储引擎的稳定性、成本和效率方向工作,包括风险管理、变更管控、成本治理、性能优化、运维运营效率提升等方向。 3、深入理解上述平台的架构及其支撑的业务(搜推、广告、风控、AI等),帮助业务在稳定性、成本、效率等方向上做更好的架构设计,对生产问题进行诊断和优化,帮助不断提升数据+AI业务的价值。

上海|北京
logo of aliyun
社招8年以上技术类-开发

1、承担MaxCompute管控系统架构师角色,负责产品技术架构演进方向 2、面向全球不同客户设计合理的产品方案,梳理存储、计算、售卖、控制台、运维体系架构,确定技术方案选型 3、承担MaxCompute管控系统设计、研发、测试、发布与运维 4、与MaxCompute各研发团队+SRE中台团队+阿里云售卖平台配合,共同推进技术项目按要求落地

更新于 2025-04-02杭州