字节跳动RDMA架构师(北京/上海/杭州/深圳)
任职要求
1、微电子、计算机等相关专业本科及以上学历,对芯片前端设计有深入理解; 2、有2年以上的RDMA芯片架构设计和开发经验,有多路径、选择重传、PCC等特性的设计经验; 3、有丰富的软硬件性能调优经验; 4、熟悉计算机体系结构,熟悉MAC、PCIe、AMBA、DDR等。 加分项: 1、有网卡芯片、交换芯片等网络芯片的设计开发、流片经验; 2、熟悉业界的高速网络协议; 3、熟悉AI训练的并行策略,熟悉AI硬件加速器架构或者GPU架构; 4、有高速网络组网经验和线上运维经验,熟悉拥塞控制; 5、熟悉RDMA内核态用户态驱动,熟悉集合通信软件。
工作职责
1、负责RDMA协议的演进和调研; 2、负责RDMA芯片的需求分析、架构设计、IP选型; 3、支持ASIC验证和集成。
参与小红书基础设施网络架构设计、规划及稳定性保障工作,持续提升网络性能: 1、负责数据中心网络架构设计、网络规划、建设交付; 2、负责数据中心交换机、路由器、负载均衡等网络设备的运维管理、事件响应和应急处理工作,对网络带宽使用进行分析调优; 3、负责网络设备(路由器/交换机)的选型、测试、RMA等工作; 4、负责网络前沿技术研究,根据业务发展的需求,完成技术方案设计与项目落地。
网络工程师-数据中心方向 1、负责数据中心网络架构设计、网络规划、建设交付,并结合公司业务发展持续优化网络性能; 2、负责数据中心交换机、路由器、负载均衡等网络设备的运维管理、事件响应和应急处理工作,对网络带宽使用进行分析调优; 3、负责网络设备(路由器/交换机)的选型、测试、RMA等工作; 4、负责网络前沿技术研究,根据业务发展的需求,完成技术方案设计与项目落地。
1、Kubernetes架构设计与开发: 深入理解Kubernetes原生架构的设计理念,参与并主导Kubernetes核心组件的开发和实现。 2、性能调优与优化: 通过监控工具(如Prometheus、Grafana)对Kubernetes集群进行全面性能分析,并优化关键节点、组件和流程,以提升整体系统的稳定性和响应速度。 3、集群部署与运维: 独立负责Kubernetes集群的稳定部署、监控与维护工作,确保集群在高负载环境下的可靠运行。 4、平台化能力建设: 研究并实施Kubernetes平台化的能力建设,提升平台的扩展性、可用性和可管理性。 5、跟踪云原生生态的最新发展趋势,研究并应用新技术以提升底座的稳定性、可扩展性、可维护性。
1.技术支撑:为行业客户提供腾讯云通用计算和异构计算产品相关的技术咨询服务,充分理解客户需求及行业特点,提供公有云基础设施的方案设计和产品支持; 2.项目落地:针对特定行业客户输出需求说明、技术方案、落地推进、最终交付,以及过程中的问题处理,满足客户在iaas/paas产品上的需求跟进; 3.需求反馈:通过自身的专业技术能力,洞察行业发展趋势,对客户的需求进行洞察和挖掘,并形成产品的后续能力补充; 4.方案沉淀:对腾讯云本身以及结合云各类产品(容器/网络/存储/机器学习平台等)为客户进行具体解决方案文案的输出和持续更新; 5.产品宣导:对不同行业的其他架构师进行AI Infra解决方案和最佳实践宣导,并在过程中进行方案和文案的优化和更新。