
微店实时计算开发工程师(J10657)
任职要求
任职要求: 1. 本科以上,计算机相关专业;两年以上大数据研发经验 2. 熟悉主流大数据技术,如Flink,Kafka,Hadoop、Spark、Hive、Tez、Presto、Hbase等 3. Java编程背景,有丰富的进程间通信\高并发\多线程研等研发经验 4. 熟悉Linux底层操作系统,能独立管理并快速搭建大数据相关运行环境 5. 对于K8S等容器化技术了解者优先 6. 有大规模集群管理、运维、优化迁移经验的优先 7. 参与Apche开源社区技术攻坚,有源码贡献者优先 8. 有使用VUE等框架进行前端开发经验加分
工作职责
职责描述: 1. 负责实时数据中台融合建设,参与实时离线混部项目, 负责相关系统架构设计,资源环境规划 2. 负责大规模集群管理,架构优化,资源深化 3. 负责平台服务接口设计&研发,标准&规范制定
1、负责电商搜索、广告、推荐等核心业务数据体系及相关工具平台的规划、建设与持续优化,高效支持算法、分析、工程等团队的数据需求; 2、深入理解业务逻辑,抽象业务需求并设计可扩展、高性能的数据技术架构,快速响应业务变化,构建高效、可靠的数据互通与共享机制; 3、负责数据处理链路(离线/实时)的日常运维、监控与保障,确保数据稳定、高效产出,及时解决数据问题。
字节跳动推荐架构团队,负责字节跳动旗下相关产品的推荐系统架构的设计和开发,保障系统稳定和高可用;负责在线服务、离线数据流性能优化,解决系统瓶颈,降低成本开销;抽象系统通用组件和服务,建设推荐中台、数据中台,支撑新产品快速孵化以及为ToB赋能。 1、为大规模推荐系统设计和实现合理的实时(流式计算)数据系统; 2、设计和实现灵活可扩展、稳定、高性能的存储系统和计算模型; 3、生产系统的trouble-shooting,设计和实现必要的机制和工具保障生产系统整体运行的稳定性; 4、打造业界领先的流式计算框架等分布式系统,为海量数据和大规模业务系统提供可靠的基础设施。
1、为大规模推荐系统设计和实现合理的实时(流式计算)数据系统; 2、设计和实现灵活可扩展、稳定、高性能的存储系统和计算模型; 3、生产系统的Trouble-shooting,设计和实现必要的机制和工具保障生产系统整体运行的稳定性; 4、打造业界领先的流式计算框架等分布式系统,为海量数据和大规模业务系统提供可靠的基础设施。
团队介绍: 小鹏汽车自动驾驶的大数据方向,负责所有自动驾驶数据的云端处理,为自动驾驶业务提供高性能,高质量的数据加工,保证整个数据生产的稳定性,及时性,高可用。 1. 负责自动驾驶大数据多模态(如视频、图像、雷达信号等)湖仓平台的架构设计、开发与建设,包括数据处理、资源调度、算子管理、部署服务等;负责数据采集、清洗、转换和加载(ETL)流程的开发,处理多源异构数据 2. 基于大数据多模态湖仓平台,协助客户处理生产业务中的海量数据,解决疑难问题,支持百亿级自动驾驶感知和全栈数据的快速定位和分析,赋能上层业务发展。 3. 协助设计和优化数据仓库模型,参与数据治理工作(如数据质量核查、元数据管理等) 4. 负责自动驾驶离线和实时数据仓库的构建和性能优化;负责车端信号数据仓库体系和数据指标体系的架构设计与开发,为算法和数据闭环提供框架支持; 5. 调优分布式计算引擎(Spark/Flink/Presto)及存储系统(HDFS/OSS),构建OLAP引擎(Doris/StarRocks),解决海量数据场景下的资源瓶颈。 6. 跟踪Iceberg、Paimon、Flink、Spark、Lance等开源技术演进,主导关键组件二次开发或源码级优化;负责前沿技术的跟踪研究,工具链的选型测试,解决、攻克数据平台的核心技术难题。 7. 建立监控和反馈指标,持续优化改进产品的架构及性能,保证PB级数仓的数据质量和平台稳定性。