阿里巴巴淘天算法技术-高级数据开发工程师-杭州
任职要求
1.大数据或者计算机相关专业本科以上学历。 2.精通SQL,熟悉数仓建模领域知识,包括但不局限于: 数据集市设计、流数据计算,数据管理、数据质量、数据服务。熟悉Flink/Spark/Hive/Hbase/Hadoop等大数据工具,有实际业务的实时大数据研发经验优先。 3.有ClickHouse/Hologres等OLAP研发经验优先,有电商领域数据建设经验优先。 4.对数据敏感,具有优秀的业务理解,数据分析和解决问题能力,对于把算法和数据结果能够应用到实际业务场景产生商业价值具有强烈的热情。 5.具备一定的Python/JAVA语言的开发能力,具备非结构化处理、知识图谱、数据挖掘等能力优先考虑。
工作职责
1..负责淘宝商品库基础数据相关的实时、离线数据仓库设计、开发、性能优化 以及 相关业务指标的开发;参与淘宝商品基础数据架构、技术体系、数据模型的规划建设,包括数据采集、数据治理、数据质量及稳定性保障体系、数据处理智能化和自动化体系的建设; 2.负责商品、用户等维度数据的挖掘和数据资产沉淀,为业务的交互式即席分析、AB实验效果分析提供统一、可靠、高效的实时+离线的数据服务和丰富的维度下钻支持。 3.能够针对业务场景探索提供大数据解决方案,并实现数据产品化。
1、主导财经业务相关主题的分布式数据仓库规划、设计、落地及运营; 2、主导财经数据资产公共层建设,从工具和效果上实现敏捷智能的目标; 3、深入了解业务,主动优化数据仓库实现数据治理与迭代闭环,不断提升数据质效。
1、负责飞猪核算平台的设计与建设; 2、负责飞猪系统、财务系统中涉及结算模块的数据标准化和数据质量建设; 3、根据业务场景的需求设计合理的结算流程、结算规则、结算表单,进行数据挖掘分析; 4、通过数据分析,对业务运行情况进行监控和预测,并提出合理化的改进建议。 5、参与飞猪内部结算平台对接工作,进行系统对接方案设计、系统接口开发及测试验证。
1.负责蚂蚁财富、保险业务线数据体系和解决方案建设,赋能业务数字化运营,提升运营效率,保障数据的质量和稳定性; 2.负责业务领域核心数据体系的规划,以数据为核心生产要素制定数据解决方案,解决业务开展过程中遇到的痛点,包括但不限于用户标签体系、数据智能化和自动化体系和实时数据体系的建设; 3.负责建设高质量的领域数据资产,包括但不限于外部数据引入、数据标注、特征挖掘等,为业务智能化营销、大模型等智能化场景,提供必要的模型训练、迭代、部署等方面的支持,确保业务智能化升级目标能够顺利推进、落地; 4.负责主导或参与数据治理工作,实现持续、低成本的产出高质量的数据;建设数据内部共享融通的数据平台,保障数据的合规使用,避免数据泄漏及违规使用。
阿里资产技术团队负责建设全球领先的网络资产处置平台,承载司法拍卖、破产处置、珍品交易等多个市场体量巨大的业务,挑战海量用户和数据、巨量资金带来的复杂大型互联网系统架构。 1. 负责阿里资产数据体系的规划设计和建设,通过数据产品和数据服务等方式,实现数据驱动业务增长; 2. 负责阿里资产相关的离线数仓、实时数仓,数据服务化的设计、开发、性能优化,为上层分析和挖掘提供可靠、统一的离线+实时数据服务; 3. 负责离线/实时的ETL工作,为各业务提供定制化的数据支持,并优化计算任务性能; 4. 沉淀分析思路与框架,提炼数据产品需求,与算法、工程团队合作,实现数据精细化运营。