平头哥平头哥-技术支持专家(智能网卡芯片)-杭州
任职要求
1. 计算机相关专业本科及以上学历,数据中心芯片行业工作8年以上,其中包含3年以上hands-on实操,能熟练配置主流智能网卡(如Nvidia、Intel、Broadcom、Huawei等),掌握其测试方法,并参与过头部互联网公司、运营商等客户网卡项目的成功落地;
2. 理解RDMA技术原理,熟悉拥塞控制、Lossy-RDMA、VPC、QoS、SR-IOV、VirtIO、DPD…工作职责
1. 负责为客户提供平头哥智能网卡和DPU芯片产品技术推广,为客户提供智能网卡芯片应用技术支持; 2. 负责平头哥智能网卡和DPU各种网络及数据加速方案在用户的导入和产品化,配合研发使能整体解决方案和测试验收; 3. 与市场营销团队合作,支持智能网卡芯片在市场推广; 4. 收集并分析客户需求,关注客户价值,与Markting配合规划;
你将在以下三个领域: 1. 大型分布式系统软件的高可用性设计开发,自动化故障分析定位能力建设; 2. 高带宽高性能交换路由转发平面的定义、研发、测试和创新; 3. 大规模分布式路由协议的研发、测试和创新。 从事以下工作: 1、技术方案设计 • 收集、识别、分析网络架构和运维侧需求,并确定技术方案的目标、范围和交付成果; • 基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、数据架构和开发流程等。 2、技术实现 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现; • 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等; • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署; • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等。 3、稳定性和性能优化 • 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠; • 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能。 4、技术预研 • 跟踪和了解新的产品技术和趋势,根据业务需要提供新的技术支持和建议。 5、技术规划 • 理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。
1. 负责为客户提供平头哥智能网卡和DPU芯片产品技术推广,为客户提供智能网卡芯片应用技术支持; 2. 负责平头哥智能网卡和DPU各种网络及数据加速方案在用户的导入和产品化,配合研发使能整体解决方案和测试验收; 3. 与市场营销团队合作,支持智能网卡芯片在市场推广; 4. 收集并分析客户需求,关注客户价值,与Markting配合规划;
1、技术方案设计 • 收集、识别、分析客户需求,并确定技术方案的目标、范围和交付成果 • 基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、数据架构和开发流程等 2、技术实现 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现 • 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等 • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署 • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等 3、稳定性和性能优化 • 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠 • 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能 4、技术预研 • 跟踪和了解新的产品技术和趋势,根据业务需要提供新的技术支持和建议。 5、技术规划 • 理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。
在2022阿里云峰会上,阿里云正式发布了其自主研发的云基础设施处理器CIPU(Cloud infrastructure Procrssing Units),作为一款为新型云数据中心设计的专用处理器,它将在未来取代CPU成为新一代云计算的管控和加速中心。了解CIPU: https://mp.weixin.qq.com/s/VEco9XaX0eQtZy-pAVS6ug 系统设计与研发 • 负责云平台系统CIPU 的存储云化加速 架构设计和优化工作 • 负责CIPU存储云化加速 新技术和方案的研发以及在云产品推广应用的工作 • 基于业务需求和设计方案完成UT用例设计开发,对系统的稳定性负责 • 负责系统设计与研发文档的编写、改进与维护 系统性能优化 • 对软件系统进行性能数据分析,通过软件系统重构,实现软件系统稳定性/性能的提升 • 沉淀、输出相关案例/工具 系统测试与维护 • 负责软件系统的技术支持与运维工作,分析软件系统中可能存在的问题,全局视角分析问题根因,定位并解决问题,保证系统符合性能、稳定性等指标要求 • 负责CIPU存储软件和系统的测试工作,设计、搭建与管理测试平台,通过性能测试,推动产品不断演进迭代 技术规划 • 基于业务需求和技术洞察,制定本领域内的技术团队的中长期发展规划和技术路线图 • 体系性地设计各类配套规划,包括技术人员规划、技术基础设施规划、技术质量规划、技术安全规划等 项目管理 • 确定项目目标和范围,并拟定项目计划、预算和资源需求计划、项目风险评估、交付成果等 • 按项目计划进行落地实施,并对项目进度、数据、质量进行监控,确保项目保质保量实施 • 总结项目经验和教训,反馈项目成果和绩效,为之后的项目管理沉淀经验总结