阿里云阿里云智能-网络研发通信库技术专家-北京/杭州
任职要求
1、对新技术有强烈的求知欲望,能够理论结合实践快速的上手新知识; 2、具备严谨的工作态度,在面对实验和测试数据和理论分析时,始终保持批判性思维,消除实验误差,保证实验和理论相符; 3、具备良好的对外沟通能力,可以和上下游团队形成良好的协作关系,共同解决技术问题并推动项目落地; 4、具备5年以上coding经验,有规模化应用经验,能够负责跨团队协作的复杂项目; 5、通过建立信息搜集和分享体系确保团队持续获得高质量的技术领域前沿信息; 6、深入了解竞对对标产品的核心技术指标、优劣势对比,通过建立对标机制保障团队对竞对的持续高质量跟进和追赶; 7、面对技术领域的不确定…
工作职责
1、技术方案设计 • 调研AI大模型训练及推理的前沿技术发展,分析前沿技术和网络的关联以及优化方向; • 分析客户需求,帮助客户使用我们的产品和解决方案,帮忙客户进行性能优化; 2、技术实现 • 负责AI计算系统的通信库的设计研发、以优化 • 对技术方案进行分析拆解,制定任务目标和产出规范,完成关键模块的设计、编码开发和系统功能实现 • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署 • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等 3、稳定性和性能优化 • 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠 • 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能 4、技术预研 • 跟踪和了解新的产品技术和趋势,根据业务需要提供新的技术支持和建议。 5、技术规划 • 理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。
1. 技术方案设计 • 与PD紧密合作,收集、识别、分析客户需求,结合自身行业经验分析并论证需求合理性;在需求明确后,确定技术方案的目标、范围和交付成果; • 完成客户需求的技术方案设计,结合需求场景选择合理的技术架构,满足性能与稳定性要求,并保持足够的可扩展性,同时确保ROI(投入产出比)合理。 2. 技术实现 • 基于DDD(领域驱动设计)开发方法,按时完成弹性网卡(ENI)、安全组(Security Group)业务需求的开发,高质量交付; • 对编码进行阶段性讨论和Code Review,并通过调试优化,推动代码成功部署; • 在Code Review过程中,能够保持热情,及时给予年轻工程师经验指导,帮助其快速成长; • 对开发中和部署后的程序进行维护和迭代,包括值班on-call、升级工单处理、缺陷排查、问题诊断、产品体验改善、性能和成本优化等。 3. 稳定性和性能优化 • 与架构和SRE团队紧密合作,针对负责的功能制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,处理线上疑难杂症问题,确保系统的安全可靠; • 使用DDD(领域驱动设计)开发方法对存量代码进行重构,持续改善系统设计、提升系统性能并消除稳定性隐患。 4. 技术预研 • 定期调研业界对标产品的产品形态并结合客户反馈的业务诉求,分析并转化为ECS弹性网卡、ECS安全组等平台产品的需求;协同PD保持上述产品能力的先进性。 5. 技术规划 • 定期跟踪系统在性能和稳定性相关指标方面的变化趋势,及时分析原因,发现弹性能力演进的机会点,并提前设定技术架构演进的前瞻性目标,开展POC验证; • 对分布式技术、高性能通信技术、数据库技术等保持好奇心和敏锐性,结合业务实际做好技术预研、分享和应用。
1、负责面向海量终端多场景融合的云DNS系统的架构设计、核心代码开发与建设维护。 2、从自身系统稳定性基础上推进系统高并发、安全性等优化。 3、解决潜在系统技术风险,保障系统的安全、稳定、快速运行。 4、推进DNS云生态建设,包括但不限于DNS标准的创新与推广等。 1、技术方案设计 • 收集、识别、分析客户需求,并确定技术方案的目标、范围和交付成果。 • 基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、数据架构和开发流程等。 2、技术实现 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现。 • 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等。 • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署。 • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等。 3、稳定性和性能优化 • 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠。 • 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能。 4、技术预研 • 跟踪和了解新的产品技术和趋势,根据业务需要提供新的技术支持和建议。 5、技术规划 • 理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。
我们是蚂蚁集团网络技术团队,为蚂蚁集团全站提供通智一体、稳定高效的网络基础设施产品、平台和服务。 ● 负责集合通信库的设计和研发; ● 通过稳定性建设和通信优化提升大模型训练效率和减少推理成本;