字节跳动资深后端工程师-大数据应用方向
社招全职HNU2地点:上海状态:招聘
任职要求
1. 熟悉互联网产品和服务的开发过程,熟悉后端技术架构,具备良好的系统设计能力; 2. 扎实的计算机基础,对技术有热情,愿意不断尝试新技术和业务挑战; 3. 善于沟通,对业务敏感,能快速理解业务背景,具备优秀的技术与业务结合能力; 4. 熟悉golang语言优先; 5. 熟练使用clickhouse、presto、doris等mpp查询引擎,具备数据组件化开发的能力; 6. 具备较好的数据分析sense,有良好的协作能力。
工作职责
1. 负责生活服务业务大数据平台产品的落地,包括数据参谋、行业360、管理驾驶舱等系列数据平台产品; 2. 负责数据产品架构设计和后端开发,设计和实现Web后端和关键数据服务; 3. 负责数据产品的功能迭代和性能优化,提高效率,优化流程。
包括英文材料
系统设计+
https://roadmap.sh/system-design
Everything you need to know about designing large scale systems.
https://www.youtube.com/watch?v=F2FmTdLtb_4
This complete system design tutorial covers scalability, reliability, data handling, and high-level architecture with clear explanations, real-world examples, and practical strategies.
ClickHouse+
[英文] Advanced Tutorial
https://clickhouse.com/docs/tutorial
Learn how to ingest and query data in ClickHouse using the New York City taxi example dataset.
https://www.youtube.com/watch?v=FtoWGT7kS-c
ClickHouse is an open-source column-oriented DBMS for online analytical processing that allows users to generate analytical reports using SQL queries in real-time.
https://www.youtube.com/watch?v=Rhe-kUyrFUE&list=PL0Z2YDlm0b3gcY5R_MUo4fT5bPqUQ66ep
Presto+
[英文] What is Presto?
https://prestodb.io/what-is-presto/
https://www.tutorialspoint.com/apache_presto/index.htm
Doris+
https://doris.apache.org/docs/gettingStarted/what-is-apache-doris
数据分析+
[英文] Data Analyst Roadmap
https://roadmap.sh/data-analyst
Step by step guide to becoming an Data Analyst in 2025
相关职位
社招D12135
1、负责流量平台建设,为业务提供可靠的数据支撑,包括行为分析、埋点管理、NEO等平台产品; 2、通过极致的架构优化,结合大数据引擎打造埋点从生产到分析的一站式流量数据产品; 3、通过攻克万亿级数据量下的数据生产和查询加速等挑战及负责关键方案选型提升分析效率。
更新于 2024-10-30
社招5年以上程序&技术类
1. 负责用增各业务场景下AI应用落地(包括不限于构建用增知识库、广告投放策略优化、社区个性化推荐等),通过技术创新突破现有业务天花板; 2. 完善AI基建,打造AI开发-测试-调优-部署-监控全链路工具链(如模型版本管理、性能诊断工具),提升团队AI迭代效率和AI工程稳定性,可观测性; 3. 追踪AI工程领域前沿技术(向量数据库、模型压缩、推理加速框架),推动团队技术升级。
社招程序&技术类
1、负责企业数据计算平台的后端研发工作,支撑批处理、流处理、实时计算、交互式查询等多场景需求;设计并实现任务调度、资源管理、权限管控、计算作业编排等核心模块; 2、数据处理引擎集成并优化 Flink、Spark、Doris、StarRocks、Paimon 等计算与存储引擎;设计统一作业提交与执行框架,提升平台计算效率与稳定性。 3、提供对外 API/SDK,支持数据研发、指标体系、报表分析、机器学习等上层应用;打造自助式计算服务能力,降低业务方使用门槛; 4、负责大规模数据任务的性能优化与故障排查,确保 SLA;建设监控、告警、审计、任务追踪与成本管理体系; 5、平台架构演进,参与计算平台的架构规划工作,推动计算平台向云原生、湖仓一体化方向演进;调研新技术并推动落地,如 Kubernetes、存算分离、向量化计算、流批一体。