高德地图高德-离线数据开发工程师-信息研发
任职要求
硬性条件: 1、计算机/数学相关专业本科及以上学历,3年以上大数据开发经验 2、精通Hadoop生态体系(Hive/Spark/Fl…
工作职责
1、负责离线数据仓库的架构设计与ETL流程开发,保障数据加工链路稳定性 2、开发高效的数据清洗、聚合、特征计算模块,优化Hive/flink任务执行效率 3、支撑搜索、用户画像、推荐系统等业务的数据需求,确保输出时效性与准确性
1、负责高德广告业务的离线与实时数据仓库的构建和数据设计,包括数据模型设计、ETL研发、ETL性能优化。 2、负责高德广告业务流量、供给、客资、运营、结算等数据主题建设;能够深入理解业务并合理抽象,解决业务痛点问题,不断提升用数能力和数据分析能力,发挥数据价值。 3、负责高德全域数据的广告归因建设,持续优化归因策略,确保平台流量价值。 4、提升高德数仓团队数据架构能力和数据治理能力,持续提升需求支持效率、数据研发效率、提升数据质量、降低数据使用成本。
1、负责自动驾驶数据闭环相关的平台研发工作,制定数据挖掘方案,计划并实施,保证数据质量和闭环效果,为线上模型迭代提供数据支持; 2、负责数据闭环的标定平台、模型部署平台研发工作,通过数据及算法挖掘传感器标定异常,提前发现问题以及风险前置; 3、基于海量自动驾驶场景和行为,科学地管理自动驾驶用户数据和已挖掘的算法问题,研究和设计自动驾驶各算法高效发现问题和利用数据的方案。与算法研发工程师合作,通过数据驱动的方式挖掘自动驾驶算法需要关注的关键场景和高价值数据,参与算法迭代; 4、负责自动驾驶数据闭环相关的策略研发工作,制定项目挖掘方案,计划并实施,保证数据质量和闭环效果。设计和开发挖掘策略/算法/工具,为感知算法任务提供研发迭代需要的数据,支持数据转化为驾驶能力; 5、综合车端的感知、规控、地图、车辆状态等信息,利用大数据技术(如 Flink、Spark)对各种异常 case 进行识别和自动化归因算法开发; 6.负责推进自动驾驶用户数据闭环平台构建、优化,确保闭环科学地、稳定地、高效地运转。基于数据湖技术(如 Hadoop、HDFS、Delta Lake 等)构建高效的数据存储、处理和分析平台。
1、负责高德广告业务的离线与实时数据仓库的构建和数据设计,包括数据模型设计、ETL研发、ETL性能优化。 2、负责高德广告业务流量、供给、客资、运营、结算等数据主题建设;能够深入理解业务并合理抽象,解决业务痛点问题,不断提升用数能力和数据分析能力,发挥数据价值。 3、负责高德全域数据的广告归因建设,持续优化归因策略,确保平台流量价值。 4、提升高德数仓团队数据架构能力和数据治理能力,持续提升需求支持效率、数据研发效率、提升数据质量、降低数据使用成本。