阿里云阿里云智能-数据产品专家-DataWorks
任职要求
1. 本科及以上学历,计算机相关专业,拥有5年以上工作经验,有技术研发背景和B端数据产品经理经验。具备良好的责任心、自驱力,良好的数据敏感性和洞察力,具备产品力驱动的思考能力; 2. 了解云计算基础架构和技术体系,熟悉数据仓库、数据湖、湖仓一体等产品架构,有云厂商大数据引擎及服务(如MaxCompute、Spark、Hive、Flink等)、数据ETL工具类产品(如数据集成、数据开发、任务调度与运维等)以及数据ETL研发方面工作经验者优先。 3. 熟悉大模型和RAG基本原理,对大模型应用、AI技术发展相关方向有强烈的兴趣和热情,有AI和数据产品结合的实际工作经验者优先。 4. 熟悉国内外相关行业产品,具有开源或商业数据平台产品的商业化经验者优先; 5. 善于沟通、跨团队协作和项目管理,具备良好的文字及英文表达能力者优先。
工作职责
1. 负责阿里云大数据开发治理平台DataWorks的产品规划、设计以及落地,重点在数据ETL产品工具链及“Data+AI”方向; 2. 调研各行业用户需求和国内外同类产品,提炼和规划产品迭代计划; 3. 负责产品商业模式设计与GTM,支持业务团队完成业务目标; 4. 负责产品布道,包括内外部培训,市场活动,数据分析等。关注用户反馈,分析用户行为,进行产品用户体验的持续优化。

1. 电商数据的深入了解,数据模型设计、开发、保障,做好数据资产沉淀 2. 细致了解电商产品的业务模型,更好将数据服务融入产品,强化data insides的能力 3. 理解业务、熟悉产品,为团队内的工作做好合理规划和总结,根据业务价值判断团队工作优先级
1、参与针对企业数据安全治理领域的数据安全中心相关研发工作,实现大数据/AI一体化的数据安全治理,实现统一的数据安全性以及风险与合规性管理; 2、参与解决企业数据安全治理领域面临的痛点,设计并实现相关安全解决方案,解决客户在数据集成、数据开发分析等大数据治理过程中的安全问题; 3、参与数据安全中心的系统架构设计与演进迭代,持续优化系统安全性、稳定性、可扩展性、性能,以及使用体验,满足大数据/AI持续发展的业务形态与规模对数据安全的需求; 4、参与企业数据安全治理领域的技术动向研究,实现与业务贴合的安全能力技术攻坚,进行技术上的前瞻探索,实现面向未来的数据安全中心的规划、设计和落地,保持在企业数据安全治理领域的技术先进性。
职位概述: 我们正在寻找一位对系统稳定性和高可用性有着极致追求的高级运维工程师。您将成为我们电商及资讯平台基础设施的“守护者”,核心职责是确保生产环境7x24小时高可用,并高效管理从故障发现到恢复的全生命周期。您需要具备深厚的技术功底、冷静的应急心态和强大的复盘能力,通过自动化、流程化和系统化的方法,不断提升我们系统的韧性与可观测性,为亿万用户的顺畅体验保驾护航。 核心职责: 1. 系统高可用性保障: o 负责公司核心业务(电商、资讯)生产环境及基础设施(服务器、网络、数据库、中间件等)的稳定运行,确保服务SLA达到或超过既定目标(如99.99%)。 o 设计、实施和维护高可用和容灾架构,包括同城双活、异地灾备等方案的落地与演练。 2. 监控与应急响应: o 主导建设和优化集中式监控、日志分析与告警系统(如Prometheus/Grafana, ELK, Zabbix, Datadog等),确保能提前预警、快速发现问题。 o 作为主要事故处理指挥官(Incident Commander),负责7x24小时应急响应,领导并协调相关团队对线上事故进行快速定位、止损和恢复,最大限度降低影响。 3. 事故全生命周期管理: o 严格遵循ITIL等最佳实践,管理事故(Incident)和处理工单(Ticket)。 o 主导重大事故复盘(Post-mortem),编写详尽的复盘报告,深入分析根因,并推动落实改进措施(如代码修复、流程优化、架构调整等),避免同类问题重复发生。 4. 运维自动化与效率提升: o 通过编写脚本(Shell/Python/Go等)和利用自动化工具(Ansible/Terraform等),自动化日常运维操作和故障处理流程,提升效率,减少人为失误。 o 践行SRE(Site Reliability Engineering)理念,通过代码管理基础设施(IaC)。 5. 容量规划与性能优化: o 定期进行系统容量评估和规划,确保系统有能力应对业务增长和突发流量(如大促活动)。 o 分析系统性能瓶颈,协同开发团队进行调优,提升系统效率和资源利用率。 6. 系统组件的安全升级及维护: o 常规维护能力:具备使用安全扫描工具进行安全漏洞扫描额能力。 能全程跟进系统组件安全管理,做好版本监控、漏洞扫描与风险评估,按计划升级部署补丁、更新配置,快速应对突发安全事件,降低业务受影响程度。 o 借助工具强化能力:熟练使用安全卫士等工具,将其融入维护流程。实现自动化漏洞检测与修复建议输出,实时监控异常与潜在威胁并预警阻断,利用日志分析优化安全策略,构建闭环安全管理体系。