阿里云阿里云智能-研发高级专家-自动化平台-北京
任职要求
- 计算机相关专业本科及以上学历; - 8年及以上的后端研发经验、其中至少3年以上是IaC相关的经验(Terraform、CDK、Pulumi、Crossplan、CloudFormation、ARM template等); - 5年及以上领导技术团队的经验,能够培养团队成员、吸纳更多人才、带领团队突破技术难点、领导团队技术…
工作职责
我们希望用户以最高的效率和质量集成阿里云。但云服务和业务的复杂性让手动编排上万个API变得困难、易错。借助Infrastructure as Code(IaC),通过声明式、代码化的方式管理云上资源,可以极大提升用户集成阿里云的效率和质量。 作为阿里云开放平台 - 自动化平台团队的研发高级专家,你将通过技术的手段不断提升用户集成阿里云的效率和质量,让每个用户都享受到自动化带来的便捷,让IaC变成用户集成阿里云的首选。你的职责包括: ● 规划阿里云的自动化平台和工具体系,洞察用户的痛点和使用路径,在云控制台、在线调试、在线服务托管、本地客户端等多种形态中建设出一套体系化的方案; ● 定义内部标准、搭建框架、推动云产品改造。通过标准化、自动化的方式生成高质量的IaC工具; ● 整体把控团队的技术设计和架构,关注工程质量、关注系统的稳定性和安全性; ● 与云产品团队高效协作,深入理解他们的场景和需求,推动阿里云统一的IaC质量提升; ● 深入理解用户的场景,以开发者的视角亲自动手实践、dogfood自己的产品。积极进行内外布道,让IaC的理念深入人心。 我们希望寻找一名志同道合、热爱开发、充满激情的候选人加入我们的团队!我们的愿景是赋能开发者,使他们能够更轻松、更高效的集成阿里云。我们相信,随着云计算技术的不断发展,它将会像水电煤一样成为社会的基础设施,为人们带来更多的便利和创新。作为开放平台的一员,你将加入到一个充满使命感、热情激昂、不畏艰难的团队。诚挚期待你的加入,跟我们一起并肩作战,为用户提供无法计算的价值!
1. 主导并参入蜂鸟配送算法平台业务后端服务架构、设计、核心功能开发、系统优化等工作; 2. 管理算法特征。构建算法模型自动化平台,建立算法模型训练、部署、预测流水线。支持算法快速迭代; 3. 负责技术难点调研和攻关,解决系统中关键的设计、性能等问题; 4. 制定团队目标,参入平台方向演进规划,拆解排期,规划人力和落地执行;
ꔷ 深入理解云安全业务场景(如攻击检测、异常行为分析、数据隐私保护、风险画像等),设计算法解决方案并实现规模化落地; ꔷ 参与设计安全大模型的规划、研发和技术迭代,构建高精度、低时延、可解释的AI模型,解决安全场景特有的技术挑战; ꔷ 负责云安全中心安全助手相关算法研究、开发、架构相关工作,提升安全助手的智能化能力和产品竞争力; ꔷ 负责算法工具链与自动化平台建设,提升算法研发效率,降低业务团队使用门槛; ꔷ 追踪AI与安全交叉领域的前沿技术(如AIGC安全、大模型对抗攻防),推动创新技术在业务场景中的预研与应用。
1、稳定性保障与体系建设:负责大模型服务平台及人工智能产品的稳定性保障工作,通过指标建设、预案设计、容量规划、监控完善、建立SOP等手段提升业务可用性与可靠性。 2、高并发流量治理:主导大规模分布式系统及高并发场景下的流量治理方案设计与实施,包括弹性扩缩容以及熔断、限流、降级等容灾策略,确保业务连续性与鲁棒性。 3、新环境部署:在新环境上进行一整套推理系统及其上下游依赖的部署和运维,负责日常模型的上架、性能监测、中间件和底层基建性能监测等。 4、Oncall与应急响应:参与OnCall值班,快速定位并解决生产环境故障,主导重大事件应急响应与复盘;建立故障快速恢复机制,推动根因分析及长效改进措施落地。 5、运维自动化:优化现有部署、监控及维护流程,推动运维自动化与平台化建设,提升研发效率与系统可观测性。负责监控/日志/网络/存储等原生基础设施的保障和工具开发。