logo of xpeng

小鹏汽车【26校招】大数据开发工程师

校招全职地点:广州状态:招聘

任职要求


必需项:
- 掌握SQL与至少一种编程语言(Python/Java/Scala);
- 理解数据库基本原理(索引/事务/数据分区);
- 熟悉Linux开发环境与脚本编写;
- 理解机器学习基本概念(监督学习/表征学习/评估指标)。
加分项:
- 了解Hadoop生态,包括HadoopHiveSparkESKafka、Doris、Flink等;
- 有数据仓库建模或ETL开发项目经验…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 自动驾驶数据建模
  - 设计多源异构数据的数仓分层模型(ODS/DWD/DWS/ADS),支撑感知、预测等算法训练;
  - 设计支持相似性检索的数仓分层(ADS层集成VectorDB特性);
  - 构建数据血缘与元数据管理体系,保障数据可追溯性;
  - 构建多模态数据的统一向量化标准(图像/点云/文本的Embedding规范)。
2. 大规模数据处理开发
  - 开发高可靠ETL流程,处理车载传感器原始数据(摄像头/LiDAR/GPS等);
  - 基于Spark/Flink优化数据清洗、转换、聚合任务,提升云端处理效能;
  - 开发多模态Embedding流水线(CV/NLP模型的分布式特征提取);
  - 基于VLM(视觉语言模型)​自动生成数据标签​(替代人工标注);
  - 构建驾驶场景语义索引系统​(支持“极端天气”“危险变道”等语义检索)。
3. 分析平台建设
  - 搭建数据湖仓一体架构(Paimon/Iceberg + Doris/StarRocks);
  - 搭建海量特征向量数据库(Milvus/Pinecone/自研引擎);
  - 开发BI可视化看板,监控数据质量及自动驾驶关键指标(生产折损率,感知准确率、干预率等);
  - 开发多模态检索接口(如根据文本描述搜索关联驾驶场景视频)。
4. 效率优化
  - 持续优化数据存储成本与计算性能(分区策略/压缩算法/计算资源调度);
  - 探索弹性伸缩,流批一体,存算分离等架构在实时数据处理场景的应用。
包括英文材料
SQL+
Python+
Java+
Scala+
Linux+
脚本+
机器学习+
Hadoop+
Hive+
Spark+
ElasticSearch+
Kafka+
还有更多 •••
相关职位

logo of xpeng
校招

1、参与数据需求的分析,开发及交付工作,协助客户优化业务,提升效率,驱动增长; 2、参与公司统一数仓平台的模型设计, 研发及优化工作,助力企业数据价值挖掘与数据资产变现; 3、落实公司数据治理的相关流程与规范要求,为平台数据产出及时性、准确性、一致性提供支持与保障。

更新于 2025-07-31广州
logo of alibaba
实习淘天集团2026

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 如果你,渴望深入探索视频生成技术,开发文本到视频(T2V)基础模型的前沿技术,致力于提升生成视频的画质,真实性,一致性,以及视频生产的效率; 如果你,热衷于AIGC驱动的视频增强与处理技术,专注于将通用大模型架构优化并迁移到垂直领域,推动下游应用性能的突破; 如果你,专注于基于AIGC的可控性编辑,探索如何精准实现内容生成与修改,满足多样化的业务需求; 如果你,对基于AIGC的人脸,人体生成编辑技术充满热情,致力于打造具有高度交互性和真实性的数字形象; 如果你,期望在多模态视频理解领域取得突破,通过技术创新提升视频内容的理解与分析能力; 如果你,期望与一群聪明、皮实、乐观、追求卓越的优秀伙伴并肩作战,共同开创音视频技术的新篇章; 那还在等待什么,赶紧加入我们吧! T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。

更新于 2025-05-07北京|杭州
logo of alibaba
实习淘天集团2026

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 在这里,你将紧跟业界最新自然语言处理技术动态,深入研发并努力创新自然语言处理相关的知识库、词法、句法、语义、文档分析、深度学习、机器翻译、智能对话等技术,包括新颖的算法/模型的提出,模块的实际开发,对接自然语言处理平台的接入以及把高水平研发成果以论文/专利等形式进行发布; 在这里,你需要理解自然语言处理技术应用的相关的业务场景及需求,在自然语言处理技术内核的基础上考虑业务场景的特殊性进而适当适配业务需求; 在这里,你除了在核心技术研发之外,也有机会参与到具体的NLP相关业务中,例如文本内容的理解,商业场景的多语言多模态翻译和沟通,搜索Query分析、智能对话的语义解析及意图理解、商品评价的语义理解、内容搜索推荐的结构化分析、商品搜索推荐的标签体系、社会化问答的文本分析、智能客服的场景定制等。 加入我们,起来夯实基础、赋能商业,实现技术与商业的完美结合,共同推进自然语言处理技术赋能平台化、服务化策略,不断追求技术的深度以及技术与业务的适当解耦。来吧,我们等你加入! T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。

更新于 2025-05-07北京|杭州
logo of alibaba
实习淘天集团2026

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 在这里,你将参与机器学习、深度学习领域的技术研发工作,包括但不限于神经元网络模型设计与优化、强化学习、迁移学习、主动学习、维度降低、核方法、谱方法、特征提取与稀疏学习、等级学习、推荐、随机优化等的算法和系统研发等; 在这里,你将进行机器学习尤其是深度学习前沿问题的探索与研究,结合未来实际应用场景,提供全面的技术解决方案; 在这里,你将有机会负责提供分布式的算法实现的解决方案,大幅提升算法计算规模和性能; 在这里,你将参与提供大数据分析建模方案,沉淀行业解决方案,协助拓展业务边界。 加入我们,共同专注于大数据之上的机器学习算法研究与应用。将对人工智能的极大热情投入到挑战各种实际应用难题中。来吧,我们等你加入! T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。

更新于 2025-05-07北京|杭州