logo of aliyun

阿里云阿里云智能-网络研发通信库技术专家-北京/杭州

社招全职5年以上云智能集团地点:北京 | 杭州状态:招聘

任职要求


1、对新技术有强烈的求知欲望,能够理论结合实践快速的上手新知识;
2、具备严谨的工作态度,在面对实验和测试数据和理论分析时,始终保持批判性思维,消除实验误差,保证实验和理论相符;
3、具备良好的对外沟通能力,可以和上下游团队形成良好的协作关系,共同解决技术问题并推动项目落地;
4、具备5年以上coding经验,有规模化应用经验,能够负责跨团队协作的复杂项目;
5、通过建立信息搜集和分享体系确保团队持续获得高质量的技术领域前沿信息;
6、深入了解竞对对标产品的核心技术指标、优劣势对比,通过建立对标机制保障团队对竞对的持续高质量跟进和追赶;
7、面对技术领域的不确定性,通过对本技术领域的公司内外及业界相关资源及水平的深入了解,具备较好的判断力;
8、深入理解客户痛点和需求,能够给出精准的技术洞见,确保在理解客户诉求的前提下开展工作;
9、能够合理地针对 1-2 年的系统演进和技术选型做出决策,能够识别技术复用的机会;
10、推动团队实现系统、架构的顺利落地;能治理、完成历史系统&架构的下线流程;有效提升现有系统的稳定性、可靠性、易维护性;
11、针对负责的研发模块具备快速上线、响应、应急处理能力,并具备定位到根因的能力;
12、具有较好的行业/业务判断能力,对行业/业务发展方向有一定预判能力,理解其对所负责产品、系统的影响。

工作职责


1、技术方案设计
• 调研AI大模型训练及推理的前沿技术发展,分析前沿技术和网络的关联以及优化方向;
• 分析客户需求,帮助客户使用我们的产品和解决方案,帮忙客户进行性能优化;
2、技术实现
• 负责AI计算系统的通信库的设计研发、以优化
• 对技术方案进行分析拆解,制定任务目标和产出规范,完成关键模块的设计、编码开发和系统功能实现
• 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署
• 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等
3、稳定性和性能优化
• 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠
• 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能
4、技术预研
• 跟踪和了解新的产品技术和趋势,根据业务需要提供新的技术支持和建议。
5、技术规划
• 理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。
包括英文材料
相关职位

logo of aliyun
社招8年以上云智能集团

1、负责面向海量终端多场景融合的云DNS系统的架构设计、核心代码开发与建设维护。 2、从自身系统稳定性基础上推进系统高并发、安全性等优化。 3、解决潜在系统技术风险,保障系统的安全、稳定、快速运行。 4、推进DNS云生态建设,包括但不限于DNS标准的创新与推广等。 1、技术方案设计 • 收集、识别、分析客户需求,并确定技术方案的目标、范围和交付成果。 • 基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、数据架构和开发流程等。 2、技术实现 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现。 • 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等。 • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署。 • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等。 3、稳定性和性能优化 • 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠。 • 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能。 4、技术预研 • 跟踪和了解新的产品技术和趋势,根据业务需要提供新的技术支持和建议。 5、技术规划 • 理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。

更新于 2025-09-08
logo of antgroup
社招3年以上技术类-开发

我们是蚂蚁集团网络技术团队,为蚂蚁集团全站提供通智一体、稳定高效的网络基础设施产品、平台和服务。 ● 负责集合通信库的设计和研发; ● 通过稳定性建设和通信优化提升大模型训练效率和减少推理成本;

更新于 2025-04-03
logo of aliyun
社招5年以上云智能集团

1、作为云原生技术领域专家,为客户提供云产品的专家服务支持,负责疑难升级问题的快速定位、分析解决。 2、与研发团队对接,根据客户反馈的问题推动云产品Bug修复、架构方案优化。推进后台诊断工具、用户侧自主化诊断工具的落地。 3、整理输出官方技术文档与解决方案,指导用户合理使用云产品。 4、为客户提供企业级服务中云产品相关场景的的解决方案,协助客户完成云环境上的业务技术落地。

更新于 2025-10-03
logo of aliyun
社招5年以上云智能集团

1、作为云产品技术领域专家,为客户提供云产品的专家服务支持,负责疑难升级问题的快速定位、分析解决。 2、与研发团队对接,根据客户反馈的问题推动云产品Bug修复、架构方案优化。推进后台诊断工具、用户侧自主化诊断工具的落地。 3、整理输出官方技术文档与解决方案,指导用户合理使用云产品。 4、为客户提供企业级服务中云产品相关场景的的解决方案,协助客户完成云环境上的业务技术落地。

更新于 2025-09-24