logo of bytedance

字节跳动数据仓库开发工程师-火山引擎

社招全职J1U22地点:北京状态:招聘

任职要求


1、本科及以上学历,计算机等相关专业毕业;
2、具备丰富的数仓建模知识和数据治理经验;
3、熟悉 Hadoop/Yarn/Hive大数据体系,理解其实现原理,能够进行性能调优;
4、具备良好的沟通能力,对业务敏感,能够快速理解业务背景,具备优秀的技术与业务结合能力。

工作职责


1、负责火山引擎数据仓库构建,理解并合理抽象业务需求,沉淀高质量体系化的数据资产;
2、参与数据治理工作,提升数据易用性、数据安全及数据质量;
3、参与大数据解决方案规划,为数仓建设、数据产品、数据应用提供指导。
包括英文材料
学历+
数据治理+
Hadoop+
Yarn+
Hive+
大数据+
性能调优+
相关职位

logo of bytedance
社招3年以上A195052

1、负责视频架构数据团队的后端研发工作,包括服务端架构优化、组件容灾、数据链路重构等; 2、为大数据的全生命周期提供平台化服务,覆盖数据产生、存储、查询、统计分析、可视化的全流程; 3、参与火山引擎视频云产品(视频点播/视频直播/实时通信)的数据服务方案设计与研发工作。

更新于 2024-11-11
logo of xpeng
社招3年以上

1. 负责小鹏汽车“扶摇”AI平台数据处理相关的软件开发工作,包括数据加载工具(XDataLoader)和数据集管理平台(XDataset),提供统一的数据加载、转换、缓存与预取能力;目标解决大规模数据加载过程中出现的性能瓶颈、数据一致性、系统稳定性等问题,服务AI大模型的训练和推理; 2. 开发并维护高性能 DataLoader SDK,支持自定义采样、并行读取、缓存预取与数据增强等功能,优化多线程/进程流水线,降低I/O与预处理延迟,简化算法团队接入并提升加载效率; 3. 搭建通用Dataset管理系统,实现多源异构数据(图片、视频、点云、传感器等)的统一接入、解析与格式化; 4. 协同算法团队及其他技术团队,深入理解业务需求,快速响应并落地实现。

更新于 2025-07-22
logo of kuaishou
社招3年以上D6254

1、负责流量公共数据团队下离线数仓建设 或 实时数据体系的架构设计与开发落地; 2、对数据系统和数据服务的性能和稳定性进行持续优化迭代; 3、深入业务,理解并合理抽象业务诉求,发挥数据价值,与业务团队紧密合作; 4、打造行业领先的流量领域数据仓库体系,发挥数据价值。

更新于 2025-03-07
logo of bytedance
社招3年以上JKYE1

1、主导或参与财经业务分布式数据仓库的搭建与运营; 2、主导或参与企业数据资产公共层建设,从工具和效果上实现敏捷智能的目标; 3、深入了解业务,从数据治理层面发现业务和系统方面的问题,实现数据治理闭环,保障数据质效。

更新于 2020-11-30