logo of xpeng

小鹏汽车大数据后端开发工程师 - 平台方向

社招全职地点:广州状态:招聘

任职要求


1. 本科及以上学历,计算机类相关专业,有不错的后端开发经验;
2. 优秀的编程和调试能力,精通至少一种主流编程语言, 如JavaPythonGo;
3. 熟悉大数据生态环境,掌握HadoopHiveKafkaSparkFlinkRedisElasticSearch大数据技术栈;
4. 对实时框驾有深入了解,在生产环境有TB级别Flink实时计算系统开发经验,深入掌握Flink DataStream、FlinkSQL、Flink Checkpoint、Flink State等模块,有Flink源码阅读经验优先;
5. 熟练使用MySQL/PostgreSQL/Redis/Kafka/Elasticsearch等常用存储技术,并熟悉其使用方式和实现原理;
6. 熟练使用doris/clickhouse/druid/presto/hbaseOLAP工具,并且掌握其原理;
7. 熟悉Paimon/Iceberg等数据湖技术的实时湖仓构建,ACID事务支持、增量更新和Time Travel查询,了解小文件合并和Schema演化等问题的解决
8. 有快速学习能力,能快速理解业务背景,善于沟通,主动性强,有责任心,具备优秀的技术与业务结合能力。

加分项:
9. 有数据质量、元数据管理等相关数据组件的实际经验
10. 熟悉基于StarRocks/Doris开发高性能OLAP查询,设计物化视图和分区分桶策略提升查询效率
11. 熟悉数据仓库各类模型建模理论,了解数据仓库数据分层架构、维度模型设计
12. 有基于DockerKubernetes微服务的应用开发设计经验优先;
13. 有自动驾驶或大型互联网公司相关从业经验优先

工作职责


团队介绍:
小鹏汽车自动驾驶的大数据方向,负责所有自动驾驶数据的云端处理,为自动驾驶业务提供高性能,高质量的数据加工,保证整个数据生产的稳定性,及时性,高可用。


1. 负责自动驾驶大数据多模态(如视频、图像、雷达信号等)湖仓平台的架构设计、开发与建设,包括数据处理、资源调度、算子管理、部署服务等;负责数据采集、清洗、转换和加载(ETL)流程的开发,处理多源异构数据
2. 基于大数据多模态湖仓平台,协助客户处理生产业务中的海量数据,解决疑难问题,支持百亿级自动驾驶感知和全栈数据的快速定位和分析,赋能上层业务发展。
3. 协助设计和优化数据仓库模型,参与数据治理工作(如数据质量核查、元数据管理等)
4. 负责自动驾驶离线和实时数据仓库的构建和性能优化;负责车端信号数据仓库体系和数据指标体系的架构设计与开发,为算法和数据闭环提供框架支持;
5. 调优分布式计算引擎(Spark/Flink/Presto)及存储系统(HDFS/OSS),构建OLAP引擎(Doris/StarRocks),解决海量数据场景下的资源瓶颈。
6. 跟踪Iceberg、Paimon、Flink、Spark、Lance等开源技术演进,主导关键组件二次开发或源码级优化;负责前沿技术的跟踪研究,工具链的选型测试,解决、攻克数据平台的核心技术难题。
7. 建立监控和反馈指标,持续优化改进产品的架构及性能,保证PB级数仓的数据质量和平台稳定性。
包括英文材料
学历+
后端开发+
Java+
Python+
Go+
大数据+
Hadoop+
Hive+
Kafka+
Spark+
Redis+
ElasticSearch+
MySQL+
PostgreSQL+
Doris+
ClickHouse+
Presto+
HBase+
OLAP+
Iceberg+
StarRocks+
数据仓库+
Docker+
Kubernetes+
微服务+
自动驾驶+
相关职位

logo of bytedance
社招3年以上A43408

1、负责设计、开发数据平台与后端服务的架构,确保系统在高并发、大数据场景下具备良好的可用性、高性能及扩展性,满足业务增长需求; 2、设计数据库规划存储方案,实现高效存储与快速检索,搭建后端服务,实现业务逻辑; 3、遵循微服务架构,拆分业务为独立模块,优化系统;协同前端团队,定义、维护API接口,保障数据交互流畅,提升用户体验。

更新于 2025-06-23
logo of bytedance
社招JMT32

1、负责字节跳动数据平台-流量平台后端开发和架构设计工作,支持公司二十万埋点和每日万亿数据处理; 2、负责数据产品架构设计和后端开发,设计和实现后端和关键数据服务; 3、负责数据产品的功能迭代和性能优化,提高效率,优化流程; 4、保障技术系统稳定可靠,熟练运用合适技术对复杂场景做出合理技术设计,保障和提升海量数据平台相关系统的性能和稳定性。

更新于 2021-08-24
logo of tcl
校招研发技术类

1. 负责互联网基础架构(大数据、运维、安全等)相关效能平台的设计和开发工作,面向AI原生时代的基建效能平台开发,通过大模型技术重构传统运维、数据、安全体系,打造具备自进化能力的智能基础设施中台; 2. 智能平台开发:基于大模型开发AIOps工具,实现日志分析/故障预测自动化;构建Prompt工程框架,优化LLM在运维场景的落地效率; 3. DataOps体系建设:搭建自动化数据流水线,集成质量监控与版本控制功能;开发DataAgent实现自然语言交互式数据查询; 4. 安全架构优化:设计AI驱动的威胁感知系统,实现攻击模式预测;开发敏感数据自动识别与合规审计工具; 5. 云原生运维:优化K8s资源调度算法与智能扩缩容策略。

更新于 2025-10-14
logo of kuaishou
社招3年以上D2863

1、负责大模型相关的评测和标注平台研发,协同产品、QA、算法做好模型评测相关的工作; 2、参与模型评测方案的制定和评测数据集建设,搭建自动化的评测链路; 3、建设高效率、易使用的平台,不断优化系统架构,支撑业务规模增长,保障业务稳定。

更新于 2025-02-12