小鹏汽车大数据开发工程师-数仓方向-广州
任职要求
职位要求 - 计算机相关专业本科及以上学历,能写高质量SQL代码,至少熟练掌握Python,Java,scala等语言中的一种; - 熟悉Hadoop生态相关技术,如Hive、HBase、Spark、Flink、Elasticsearch、Trino、Doris等,有基于分布式数据存储与计算平台应用开发经验; - 熟悉数据仓库模型设计,熟悉数据治理流程与方法,有实际模型设计及ETL开发经验,熟悉Kimball维度建模方法论,有自己的数据治理方法论; - 熟悉开放表格式Delta lake/Iceberg/Hudi/Paimon其中任意一种; - 熟悉至少一种主流湖仓一体平台(如dataworks等)的使用与优化,包括平台的部署,配置,监控和调优等操作; - 熟悉报表工具(如PowerBI/Superset等)的使用,能够独立设计和开发交互式的数据产品; - 有良好的汽车业务Sense,对数据业务场景非常敏感,能够横向协同,跨界整合资源,有效结合业务和技术创新,形成完整的数据解决方案,全局地规划或完善数据服务体系以解决业务/产品的问题; - 掌握常用的数据分析工具、数据挖掘、机器学习算法是加分项; - 具有良好的逻辑思维能力、分析能力、表达呈现能力,主动性强,能与他人合作,共同完成目标; - 有自动驾驶或大型互联网公司相关从业经验,具有大型跨部门的复杂数据项目实施经验优先。
工作职责
1. 数据指标体系搭建:深挖数据价值,构建和维护车端信号数据仓库体系和数据指标体系,为算法和数据闭环提供PB级共享平台和框架支持;负责核心数据指标体系(包括业务分类、生产状态、功能指标等)的搭建、监控与运营;快速输出并不断沉淀标准化的产品数据体系,让业务的数据化运营更加高效、便捷; 2. 数据治理:梳理上下游的数据资产,制定及推广数据标准(如研发规范、质量规范、保障规范)和治理流程,确保数据准 确性、完整性和一致性。 3. 数据管理:负责元数据管理、数据质量检查、数据分级管理等系统的设计、开发及应用,提升数据易用性、可用性及稳定性; 4. 业务团队数据需求的研发支撑:如日志埋点、车联网数据、内部与外部数据的采集、数据同步、数据清洗与标准化、数据模型设计、离线数据处理、实时数据处理、数据服务化、数据可视化等;
团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok研发团队,旨在实现TikTok业务的研发工作,搭建及维护业界领先的产品。加入我们,你能接触到包括用户增长、社交、直播、电商C端、内容创造、内容消费等核心业务场景,支持产品在全球赛道上高速发展;也能接触到包括服务架构、基础技术等方向上的技术挑战,保障业务持续高质量、高效率、且安全地为用户服务;同时还能为不同业务场景提供全面的技术解决方案,优化各项产品指标及用户体验。 在这里, 有大牛带队与大家一同不断探索前沿, 突破想象空间。 在这里,你的每一行代码都将服务亿万用户。在这里,团队专业且纯粹,合作氛围平等且轻松。目前在北京,上海,杭州、广州、深圳分别开放多个岗位机会。 1、构建全面的隐私数据质量挖掘及隐私质量的度量指标体系、沉淀隐私数据质量分析方法与监控框架, 提炼隐私数据产品需求,与相关团队(质量,数据平台引擎,数据平台化开发等) 协作完成隐私风险监控的体系搭建; 2、参与大数据组件技术应用,国际化短视频数据保护的质量建设、改造和技术攻关; 3、工作范围涉及包括但不限于:任务和资源调度系统,分布式高并发系统,据资产管理,实时质量监控,流批一体技术等领域。
团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok研发团队,旨在实现TikTok业务的研发工作,搭建及维护业界领先的产品。加入我们,你能接触到包括用户增长、社交、直播、电商C端、内容创造、内容消费等核心业务场景,支持产品在全球赛道上高速发展;也能接触到包括服务架构、基础技术等方向上的技术挑战,保障业务持续高质量、高效率、且安全地为用户服务;同时还能为不同业务场景提供全面的技术解决方案,优化各项产品指标及用户体验。 在这里, 有大牛带队与大家一同不断探索前沿, 突破想象空间。 在这里,你的每一行代码都将服务亿万用户。在这里,团队专业且纯粹,合作氛围平等且轻松。目前在北京,上海,杭州、广州、深圳分别开放多个岗位机会。 1、负责TikTok架构团队的数仓研发与建设,为稳定性、成本、性能、效能、建站等多个场景提供完整、准确、易用的数据支持; 2、负责日常TikTok数据需求支持,包括:数据需求对接、需求研发与交付; 3、积极深入了解业务,逐步实现数据驱动业务的价值输出; 4、负责架构数仓的数据清洗策略制定,保证数据准确性、完整性与易用性; 5、协助完成数仓的各项治理规范与方案的落地,确保低成本、高效率的完成数据生产与交付; 6、协助完成数仓的各项技术探索与调研,完成数仓的可持续技术沉淀与演进。
职位描述: 1. 负责Flink/Iceberg/Kafka/Pulsar等实时计算核心组件的开发,持续提升功能,性能与稳定性。 2. 基于实时计算组件与平台,为业务提供高质量的流计算服务。并主动分析持续针对下游业务进行稳定性,性能与成本方面的优化工作。 3. 负责一定的运维开发工作,为实时计算组件提供完善的指标/告警体系,容量管理等功能。 4. 参与数据湖相关平台与业务的开发。