logo of alibaba

阿里巴巴业务技术-AI数据应用工程师-湖仓&Agent方向

社招全职2年以上地点:杭州状态:招聘

任职要求


1、有较为丰富的数仓设计&开发经验,熟悉ETL分层建设方法、数据、维度建模以及领域驱动设计;
2、熟悉HBase/Hadoop/Spark/Hive/Flink等大数据工具等,具备丰富的海量数据加工处…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责淘天行业、商家平台等业务场景数据应用的规划和建设,通过数据产品和数据服务等方式,高效支撑业务场景的数据需求;
2、通过实时数据、湖仓建设,提升数据应用时效性并且优化计存成本;
3、基于集团成熟AI基础平台之上,建设垂直场景下的AI数据应用;
包括英文材料
ETL+
DDD+
HBase+
Hadoop+
Spark+
还有更多 •••
相关职位

logo of alibaba
社招2年以上

1、参与淘天物流全域数据体系的规划与建设,构建高一致性、高复用的实时与离线融合数据资产底座,打造统一、可靠、可产品化的数据服务能力; 2、面向AI原生时代,设计并落地面向大模型与智能Agent消费的数据资产与知识库体系,重构数据的组织、语义表达与服务方式,支撑AI系统的高效理解、推理与决策; 3、深度洞察物流业务场景,探索大数据与AI融合的创新路径,通过数据Agent、RAG、任务编排等技术手段,推动数据从“被动响应”向“主动建议”演进,实现智能化运营闭环; 4、主导或参与湖仓一体的数据架构演进,推动数据采集、治理、质量保障、智能加工与自动化运维体系的持续优化,夯实物流业务高效运转的数据基石。

更新于 2026-01-05杭州
logo of alibaba
实习淘天集团日常实习

1. 参与构建淘天全域营销知识AI基础设施,负责将海量、多源的营销业务知识(如商品信息、权益规则、活动策略、用户行为等)进行结构化、体系化的组织与沉淀; 2. 设计并开发高效、鲁棒的知识处理工作流,包括但不限于:多模态(文本、图像、结构化数据)营销数据的清洗、融合、加工与向量化,为上层AI应用提供高质量的“燃料”; 3. 探索并实践知识检索增强(RAG)架构,参与设计面向营销场景的语义检索、混合检索方案,提升AI模型在复杂营销问答、策略生成等任务中的准确性与可解释性; 4. 参与营销领域本体(Ontology)的构建与迭代,将业务专家的经验和逻辑转化为机器可理解的知识图谱,推动营销知识的标准化和智能化应用; 5. 紧密协同算法、产品及业务团队,深入理解营销业务痛点,将业务需求转化为可落地的数据与AI解决方案。

更新于 2026-02-05杭州
logo of alibaba
社招2年以上技术类-数据

1,负责电商数据仓库的ETL流程设计、开发与优化,尤其关注招商、营销活动(含大促)等核心业务场景的数据集成,确保数据的准确性、实时性和为业务决策和AI应用提供高质量数据基础。 2,主导电商领域的数据建模工作,构建满足用户画像、商品分析、营销效果评估等业务需求的多维数据模型,支持精细化运营、个性化推荐和智能决策。 3,与电商业务、招商、营销业务和数据科学等组紧密合作,深入理解业务痛点和增长目标,提供创新的数据解决方案,优化数据处理流程,提升数据赋能业务的能力。 4,参与大数据平台的优化和扩展,探索并应用AI技术(如机器学习、自然语言处理等)提升数据处理效率、数据质量和数据洞察能力,例如智能数据清洗、异常检测、特征工程自动化等。 5,编写高质量的代码和技术文档,确保代码的可维护性、可扩展性和可理解性,并积极参与技术分享和知识沉淀。 1,Responsible for the design, development, and optimization of ETL processes for the e-commerce data warehouse, with a focus on core business scenarios such as merchant acquisition, marketing campaigns (including major promotions), ensuring accurate, real-time, and efficient data transmission, and providing high-quality data foundation for business decisions and AI applications. 2,Lead data modeling efforts in the e-commerce domain, building multi-dimensional data models that meet the business needs of user profiling, product analysis, marketing performance evaluation, etc., supporting refined operations, personalized recommendations, and intelligent decision-making. 3,Collaborate closely with e-commerce business, merchant acquisition, marketing, and other teams to deeply understand business pain points and growth objectives, provide innovative data solutions, optimize data processing workflows, and enhance the ability of data to empower business. 4,Participate in the optimization and expansion of big data platforms, explore and apply AI technologies (such as machine learning, natural language processing, etc.) to improve data processing efficiency, data quality, and data insight capabilities, such as intelligent data cleaning, anomaly detection, and automated feature engineering. 5,Produce high-quality code and technical documentation to ensure code maintainability, scalability, and understandability, and actively participate in technical sharing and knowledge accumulation.

更新于 2025-05-26杭州
logo of aliyun
社招诚云科技

1、数据资产管理平台开发与治理 构建企业级数据资产管理平台,构建数据清晰的血缘,支持高效溯源。 建立元数据管理、数据血缘追踪、质量监控与安全合规体系。 2、知识图谱构建与优化 从结构化/非结构化数据中提取实体与关系,构建行业知识图谱(如客户关系图谱)。 通过规则引擎、NLP模型持续优化图谱质量。 3、AI助理系统开发 集成大语言模型(LLM)与垂直知识库,开发智能问答、自然语言查询及自动化报表功能。 设计API/Web接口,支持业务用户通过自然语言调用数据服务(如“查询某产品的销售趋势”)。 搭建模型训练与部署框架,实现AI能力快速迭代。 4、数据安全合规与质量管理 建立数据质量指标(完整性、一致性、准确性),开发自动化检测与修复工具。 实现异常数据实时告警(如延迟、权限越权),并通过邮件/SMS/企业微信通知责任人。 5、平台性能与稳定性保障 优化Spark/Flink任务性能,提升高并发场景下的平台稳定性。 监控系统运行状态,设计容灾机制与自动化运维工具,降低故障率。

更新于 2025-05-28杭州