logo of bytedance

字节跳动大数据平台高级工程师 — 数据流方向

社招全职RQ221地点:北京状态:招聘

任职要求


1、有至少TB以上级大数据处理经验,编码能力强悍,具备生产系统快速 trouble-shooting 的经验和能力;
2、熟悉大数据处理工具/框架中的一项或多项,包括但不限于Hadoo…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、面向字节跳动旗下相关产品线,负责数据流和相关数据服务;
2、面向超大规模数据问题,每天处理千亿增量的用户行为数据;
3、负责流式数据的实时传递,清洗,转换,计算,并对外提供查询服务;
4、负责相同数据集的批处理功能。
包括英文材料
Hadoop+
Hive+
还有更多 •••
相关职位

logo of alibaba
社招3年以上技术类-开发

团队介绍: 依托阿里巴巴集团强大的技术生态,基于多年的物流供应链产品技术中后台,搭建具备跨境出口业务特色的小包裹物流履约产品技术体系。 通过对接全链路各环节的物流资源,搭建C2G全球网络。基于信息流高效协同“揽收、调拨、集运、组包、配舱、清关、卡班运输、未端派送、逆向退回等”各物流环节,提供“优先、标准、简易、经济等”各样时效等级的物流产品与解决方案,完成前台电商供应链的物流需求履约。 通过工程、数据、算法的结合,对包裹可达计算、线路路由、订单分配、大包配舱、时效预测、异常管理等环节进行辅助与优化,助力提供具备一定成本、时效优势,服务稳定的物流服务。 1. 面向AIDC 跨境物流场景,设计并实现合适的物流业财解决方案,覆盖合同订购、价格管理、计量、计费、折扣、账单、发票、资金收付、核算、管报分析等一个或多个模块,确保在高并发、大数据量、超大资金规模下的资金安全,以及对物流履行系统的服务高可用性,满足财务业务日常运营工作的SLA时效和数据质量要求。 2. 和团队一起产出物流业财平台的演进方向,并按路线图进行迭代,确保系统架构的先进性,并兼顾技术成本以及业务支撑效率。 3. 承担物流业财领域的技术方案设计和业务研发,对业务需求进行合理的抽象和设计,并参与编码工作,确保项目的进度和质量,驱动业务快速健康发展。

更新于 2025-12-04杭州
logo of 58
社招1年以上技术类

岗位职责: 负责数据接入、数据清洗、数据转换,参与金融数仓搭建和数据报表开发; 参与风控特征开发和数据挖掘工作,支撑金融风控和营销应用,保障数据质量; 关注大数据类技术方向,进行持续跟踪和学习,以及技术攻关工作;

更新于 2025-08-15北京
logo of alibaba
社招1年以上产品类-平台型

团队介绍: 平台技术是阿里国际集团技术创新和业务支撑的核心团队,以构建全球领先的数据+智能+跨云一体化数字化技术基础设施为目标,倾力打造合规、稳定、高效且用户体验卓越的技术服务平台。 我们基于全球化架构与数字智能技术,构建坚实合规的全球化商业底座。采用先进的微服务架构、混合云最佳实践以及智能模块化设计,有效提升业务响应速度和灵活性。通过技术创新驱动研发模式的代际演进,聚焦敏捷开发、先进生产工具、自动化运维流程,践行AI和云原生时代的DevOps文化。打造技术产品和研发规范,构筑起全方位的安全防护屏障。依托数据平台,基于大数据分析、机器学习等先进技术手段,构建强大的数据中台和智能决策支持系统。我们的终端技术专注于提升用户的数字化交互体验,结合智能时代的人机交互范式和网络技术,为全球用户提供极致流畅、个性智能的产品体验 职位描述 1. 产品规划与落地: 负责基于海量电商数据,规划并设计数据智能 Agent 产品(如:商机挖掘,用户洞察,智能取数助手、Text-to-SQL 工具、自动化数据分析报告)。 2. 技术转化与应用: 深入最新AI领域的技术最新在数据分析领域的应用(如 Agent 框架、RAG 检索增强、Text-to-SQL 准确率优化、Code Interpreter 等),将前沿技术转化为可落地的产品功能,解决传统的痛点。 3. 跨部门协作: 与 ETL 工程师、数据分析师、算法团队紧密配合,业务 多部门合作,梳理电商业务“语义层”或“知识库”和工作流程。 4. 场景挖掘与运营: 深入业务一线,挖掘运营、采销、管理层的数据使用场景,推广 AI 数据工具。通过用户行为数据分析,优化 Agent 的交互体验,提升内部或外部客户的数据获取效率。

更新于 2025-11-27杭州
logo of jd
社招3年以上软件开发岗

职位描述: 1. 负责设计与开发公司级高性能、高可用的实时计算平台,基于Apache Flink构建和优化核心实时数据管道,支撑关键业务场景。 2. 深入钻研Flink内核机制(如内存管理、任务调度、容错恢复),具备源码级调试、性能优化与定制开发能力,攻克生产环境中复杂技术挑战。 3. 主导实时任务的深度优化,包括但不限于反压调控、数据倾斜处理、状态管理及Checkpoint机制调优,保障实时服务的高吞吐、低延迟与稳定运行。 4. 结合业务需求,负责重大实时数据项目的技术方案选型、架构设计及评审,并输出清晰、规范的技术文档。 5. 跟踪流计算领域前沿技术(如Flink CDC、Apache Paimon、流批一体等),推动创新技术在公司落地,赋能团队成员,提升整体技术水平。

更新于 2025-10-20北京