蔚来校招-数据开发工程师
任职要求
1. 计算机科学与技术、软件工程、数据科学与大数据技术、统计学等相关专业本科及以上学历的应届毕业生。 2. 具有较强的学习能力和好奇心,能够快速掌握新技术、新知识,适应不断变化的技术环境。具备良好的问题解决能力和逻辑思维能力。拥有良好的沟通能力和团队合作精神,责任心强 3. 熟练掌握常用编程语言,如 Java、Python、Scala 等。具备良好的编程习惯和代码编写能力,能够运用所学语言进行数据处理和程序开发 4. 精通 SQL 语言,能够熟练编写复杂的查询语句,进行数据的查询、筛选、统计等操作。能够根据业务需求,优化 SQL 查询性能。 5. 熟悉大数据处理框架,如 Hadoop、Spark、Flink 等。掌握其基本原理和使用方法,能够运用这些框架进行分布式数据处理和分析。 6. 具备数据结构和算法的基础知识,理解常见的数据结构(如数组、链表、树、图等)和算法(如排序算法、搜索算法等),并能在实际工作中运用算法解决数据处理问题,优化程序性能。 【加分项】 1. 参与过实际的数据处理、数据分析或大数据项目,有项目实践经验者优先。 2. 掌握机器学习、深度学习以及大模型的基础知识,了解相关算法和框架(如 TensorFlow、PyTorch),能够将其应用于数据处理和分析工作中的优先。 3. 有开源项目贡献经验,或者在技术社区(如 CSDN、GitHub 等)积极分享技术文章和经验者优先。
工作职责
1. 参与公司大数据平台的设计与开发工作,运用先进技术优化平台架构,提升平台性能与稳定性,确保能够高效处理海量数据; 2. 负责数据仓库的建设,包括数据模型的设计与构建。深入理解业务需求,运用维度建模等方法,构建科学合理的数据模型,为数据分析和决策提供坚实的数据基础; 3. 承担数据集成数据开发和数据运维工作。从多种数据源获取数据,运用数据清洗算法和工具,去除噪声数据和重复数据,将数据转换为适合分析的格式,并高效加载到数据仓库中; 4. 与数据分析师、算法工程师等团队紧密合作,为数据分析和算法模型提供高质量的数据支持。理解需求,提供定制化的数据服务,助力挖掘数据价值,推动业务发展; 5. 参与数据治理工作,制定并执行数据质量标准,保障数据的准确性、完整性和一致性。通过元数据、质量体系有效管理和组织PB级别数据
1.负责公司级核心数据资产开发和建设,支撑核心业务场景设计和开发落地,实现业务价值 2.参与数据产品与应用的数据研发,发掘数据商业价值,和产品技术团队一起打造极致体验的数据产品 3.结合业务方向,深度挖掘数据需求,形成技术方案,探索行业前沿技术
1. 自动驾驶数据建模 - 设计多源异构数据的数仓分层模型(ODS/DWD/DWS/ADS),支撑感知、预测等算法训练; - 设计支持相似性检索的数仓分层(ADS层集成VectorDB特性); - 构建数据血缘与元数据管理体系,保障数据可追溯性; - 构建多模态数据的统一向量化标准(图像/点云/文本的Embedding规范)。 2. 大规模数据处理开发 - 开发高可靠ETL流程,处理车载传感器原始数据(摄像头/LiDAR/GPS等); - 基于Spark/Flink优化数据清洗、转换、聚合任务,提升云端处理效能; - 开发多模态Embedding流水线(CV/NLP模型的分布式特征提取); - 基于VLM(视觉语言模型)自动生成数据标签(替代人工标注); - 构建驾驶场景语义索引系统(支持“极端天气”“危险变道”等语义检索)。 3. 分析平台建设 - 搭建数据湖仓一体架构(Paimon/Iceberg + Doris/StarRocks); - 搭建海量特征向量数据库(Milvus/Pinecone/自研引擎); - 开发BI可视化看板,监控数据质量及自动驾驶关键指标(生产折损率,感知准确率、干预率等); - 开发多模态检索接口(如根据文本描述搜索关联驾驶场景视频)。 4. 效率优化 - 持续优化数据存储成本与计算性能(分区策略/压缩算法/计算资源调度); - 探索弹性伸缩,流批一体,存算分离等架构在实时数据处理场景的应用。
1、参与数据需求的分析,开发及交付工作,协助客户优化业务,提升效率,驱动增长; 2、参与公司统一数仓平台的模型设计, 研发及优化工作,助力企业数据价值挖掘与数据资产变现; 3、落实公司数据治理的相关流程与规范要求,为平台数据产出及时性、准确性、一致性提供支持与保障。