阿里巴巴1688-数据研发专家-杭州
任职要求
1.有从事数据仓库领域经验,熟悉数据仓库模型设计&ETL,有海量数据处理经验,有电商领域数据建设经验优先 2.熟悉大数据技术,包括但不局限于:数据集市设计、实时计算、数据管理、数据质量、数据服务等; 3.对数据敏感,具备良好的业务理解、数据分析和解决方…
工作职责
1、负责核心业务域数据体系的规划和建设,通过数据产品和数据服务等方式,高效支撑业务场景的数据需求 2、深度理解业务,通过对业务策略和痛点的分析,制定系统性端到端的数据解决方案并落地 3、负责数据资产建设、数据质量与稳定性管理,构建共享融通的数据平台,让数据标准更规范、数据获取更高效 4、探索Data for AI以及AI数据产品,利用大模型提升全链路数据应用效率
1、大规模预训练数据处理链路设计与开发,涵盖多源数据自动化采集抓取和解析,为基座模型预训练筑牢高质量数据根基。 2、深入探索前沿模型,构建先进的数据合成方案与框架,融合大模型与创新算法,生成海量、高质量且多样化的合成数据,有效拓展数据规模与维度,满足大模型训练对数据的需求。 3、深度剖析大模型训练数据特性,提高模型训练数据的可解释性,提升大模型算法工程师的数据处理消费效率,加速模型研发迭代进程。 4、建设基于业务体系的数据资产模型,通过合理高效全面的数据资产储备来提升运营迭代和算法迭代效率。 5、搭建数据质量监控体系,保障数据真实、准确、合规。 6、跟踪行业前沿技术,推动数据处理技术在大模型研发中的深度应用与创新落地。
1)熟悉隐私安全法律法规,制定数据风险管理领域的解决方案。让蚂蚁业务数据安全、合规、高效流动.; 2)负责风险领域相关数据资产建设,数据化指引/落地风险管理治理工作; 3)能够主动推动安全合规技术以及产品平台的不断迭代优化,主导能力在业务侧的推广运营落地。
1.负责消费信贷贷后数据架构和指标体系建设,基于业务理解完成数据建模及数据指标体系设计开发,发现洞察业务问题和机会,沉淀精品数据资产和抽象数据产品提升业务效能 2.深入理解业务的策略打法,敏锐洞察业务痛点,利用数据技术和数据科学手段为业务决策、增长策略提供专业化的离在线数据解决方案,助力万亿级规模的信贷业务高速且稳健的发展 3.负责数据质量、稳定性、计存治理等数据治理工作,让数据标准更规范、数据获取更高效、数据链路具备更好的可扩展性和可维护性
1. 负责千问智能硬件业务的数据资产建设;联合BI赋能管理决策,共建1+N+N决策数据产品,服务销售,市场,运营,体验,工程,算法等业务场景; 2. 深入理解业务架构和需求,参与智能硬件业务软硬一体的端到端的数据架构设计与建设,包括统一采集、数据资产建设与管理和数据质量及稳定性保障体系等; 3. 深度理解业务,通过对业务策略和痛点的分析,利用数据监控、分析和挖掘等能力,在用户增长、内容运营、商业化运营等业务场景中提供系统性的解决方案并落地 4. 面向智能互联业务场景构建AI数据取数产品,提升组织经营决策效率。 5. 主导或参与湖仓一体的数据架构演进,推动数据采集、治理、质量保障、自动化运维体系的持续优化。