阿里云阿里云智能-高级技术专家-云安全数据&AI工程研发-杭州
任职要求
1、计算机相关专业,熟练掌握Python、Java等编程语言,能够高效开发数据处理与AI应用程序。 2、熟悉机器学习、深度学习等 AI 技术,掌握 TensorFlow、PyTorch 等主流框架,熟悉大模型工程化流程,有实际的模型开发、部署与优化经验。 3、具备丰富的数据仓库建设与优化经验,熟悉主流数据仓库架构(如 …
工作职责
1、数仓管理:负责云安全数仓的整体技术规划和建设,优化数仓架构,提升性能和降低成本。 2、威胁情报建设:负责内部威胁情报体系的建设与完善,为安全产品提供有力支持。 3、AI工程化:负责云安全大模型工程平台的建设与维护,负责多智能体的系统架构和实现,解决其中的技术难点,优化AI工程流程,提高模型开发、测试、上线全链路的效率与质量。 4、代领团队探索AIGC前沿技术在安全场景中的创新应用,关注和研究业界前沿的AI平台,确保团队的技术先进性和竞争力。
负责核心业务领域的整体技术架构设计、关键技术创新与落地,驱动技术战略与业务目标的深度结合。需要具备卓越的系统架构能力、深刻的业务洞察力、前瞻性的技术视野以及领导复杂技术项目的能力,能够解决重大技术难题,并引领技术团队提升整体效能。具体包括: 1、技术方案设计 · 收集、识别、分析客户需求,深入理解业务本质,进行领域建模和业务抽象,确保技术方案精准支撑业务目标与发展; · 基于需求分析和业务建模,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、设计并决策高扩展性、高可靠、面向未来的数据架构和开发流程等。 2、技术实现 · 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现; · 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等; · 主导或指导复杂数据平台、数据管道、数据服务的设计、研发与优化,确保数据链路的高效、稳定、可扩展,并能有效支持数据分析、决策和智能化应用。 3、稳定性和性能优化 · 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠; · 探索产品优化技术和方法,进行性能优化,提高产品稳定性和性能。 4、技术预研 · 跟踪和了解产品技术和趋势,根据业务需要提供技术支持和建议,评估新技术在业务场景的落地可行性及价值。 5、技术规划 · 基于业务需求和技术趋势,主导制定并推动落地支撑业务长期发展的技术架构,确保其具备高可用、高可靠、高拓展性,并能有效沉淀数据资产、驱动业务持续改进。
1. 参与大规模分布式存储系统、高性能单机数据存储引擎的架构设计、功能开发、性能优化等; 2. 参与高可靠、高可用 存储系统的设计研发与演进,确保用户数据安全和服务可用性; 3. 为蚂蚁区块链提供高性能、扩展性好、友好的存储服务。
作为 阿里云费用与分账研发 TL,你将负责阿里云费用明细&分账系统的整体研发与架构规划,确保系统的稳定性、可扩展性和长期演进能力。你需要在架构顶层设计、核心系统建设、跨团队协作等方面发挥领导力,保障费用与分账系统在全球范围内稳定、高效运行,并支撑阿里云多云、多 Region的业务布局。 岗位职责: 1、技术洞察和问题定义 •洞察云计算和AI技术领域发展方向,熟悉技术标准和前沿进展,跟踪关键竞对的技术和方法。 •结合AI与费用与分账领域业务现状提出待解决的问题,理解业务目标并分解到技术产品待解决问题中。 2、技术架构规划与设计 •主导费用与分账链路的业务架构、数据架构、技术架构设计与演进路线图制定; •确定关键技术选型,推动架构治理与技术债务消除; •保障系统的高可用、可扩展、安全、合规性;在此基础上带领团队做出先进系统。 3、核心系统研发与落地 •负责费用加工系统、分账计算引擎等核心模块的设计、实现与优化; •牵头高性能、高可靠性设计,确保费用明细等核心数据及时通过各端按SLA友好传递给客户。 4、架构治理和演进 •推动制定费用领域依赖的跨领域的技术架构原则和规范,建立持续治理机制,推动架构一致性演进,并且落实到具体的项目研发中。 •识别不合理业务和架构设计,推进链路中技术债务的解决,带领团队识别脏数据,推动全链路治理,定期评估全链路数据质量。 5、跨团队业务协同与推进 •深度参与并推动商业化链条中业务/技术协同; •高效对齐业务目标与技术实现路径,解决多方需求冲突。 6、稳定性与合规管控 •建立费用与分账系统的可观测性、容灾、数据一致性保障体系; •确保系统满足财务审计与国际合规要求。 7、团队建设与赋能 •带领研发团队持续提升技术能力、架构意识和交付质量; •进行技术分享与经验沉淀,培养潜力骨干。
1、技术方案设计 • 收集、识别、分析DCN, AI infra 需求,并确定技术方案的目标、范围和交付成果 • 基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、数据架构和开发流程等 2、技术实现 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现 • 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等 • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署 • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等 3、稳定性和性能优化 • 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠 • 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能 4、技术预研 • 跟踪和了解新的DCN, AI infra 的发展趋势,参与UEC, SONiC等开源社区的工作, 并根据业务需要提供新的技术支持和建议, 让阿里的发展方向和业界的发展方向吻合。 5、技术规划 • 理解AI infra的战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。