logo of mihoyo

米哈游高性能网络工程师-内核开发

社招全职5年以上程序&技术类地点:上海状态:招聘

任职要求


任职要求:
1.具备扎实的网络基础知识,熟悉TCP/IP协议和网络安全技术;
2.深入了解InfiniBand网络运维和相关协议栈;
3.深入了解RoCE、RDMA、以太网和TCP/IP协议;
4.深入了解局域网交换技术以及常用路由协议,如 OSPF/IS-IS/BGP 等,能够对复杂路…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


岗位职责:
1.负责IDC网络、高性能网络(InfiniBand、RoCE 等)的规划、建设、维护;
2.负责网络的秒级、毫秒级监控、相关其他网络运维工具的开发、维护、运维;
3.负责对突发事件的快速响应和处理,快速进行故障定位与排查,保障业务稳定运行;
4.负责对现有网络系统的架构设计与迭代优化,根据业务需求持续改进网络性能与可靠性;
包括英文材料
TCP/IP+
HPC+
还有更多 •••
相关职位

logo of aliyun
社招5年以上技术类-开发

打造稳定、安全、高效的阿里云网络安全防护系统,直接参与核心代码开发与高性能,高可靠性系统架构演进。 1、技术方案设计 • 收集、识别、分析客户需求,并确定技术方案的目标、范围和交付成果 • 基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、数据架构和开发流程等 2、技术实现 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现 • 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等 • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署 • 对开发中和部署后的程序进行必要的维护和迭代,包括Bug排查、问题诊断、体验改善、性能和成本优化等 3、稳定性和性能优化 • 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠 • 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能 4、技术预研 • 跟踪和了解最新的产品技术和趋势,根据业务需要提供最新的技术支持和建议。 5、技术规划 • 理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。 6、该职位涉及值班响应的职责,在服务级别协议(SLA)时间内做出对客响应,推动客户问题的解决,改善客户体验

更新于 2025-06-06杭州
logo of aliyun
社招3年以上云智能集团

1. 面向 AI 业务的网络架构设计与演进 ○ 负责支持大规模 AI 训练/推理集群的网络架构规划与方案设计,覆盖 AI access 网络、frontend 网络、AI scale up 网络等关键环节。 ○ 结合业务场景识别网络接入、流量调度、数据分发链路中的性能和可靠性瓶颈,提出系统级优化方案。 2. 高性能多路径传输与 RDMA 方向创新 ○ 深入调研业界前沿应用层多路径传输、RDMA 及相关协议栈优化技术,系统性分析其优缺点与适用场景。 ○ 基于阿里云大规模生产环境,设计并落地面向 AI 流量的多路径传输优化机制,实现端到端的高带宽、低时延和高稳定性。 3. 网络系统研发与产品化落地 ○ 将整体技术方案拆解为可实施的技术点,完成可行性分析、技术规范制定与验收标准设计。 ○ 主导关键模块的架构设计与核心代码开发,构建可快速迭代的原型系统,验证技术路线。 ○ 在验证基础上持续进行性能优化与工程化改造,推动方案产品化落地,并支撑大规模部署和运营。 4. 稳定性与性能优化 ○ 制定并实施面向超大规模集群的稳定性保障策略,从架构设计、协议栈实现、流控/调度策略等多层面建设高可用能力。 ○ 在真实业务环境中开展端到端性能剖析与容量规划,识别热点与瓶颈,落地针对性优化措施,保障高负载下的稳定性能表现。 5. 数智一体的网络分析与智能运维 ○ 利用大数据与大语言模型,设计并研发超大规模网络分析与智能运维系统,提升网络研发、运营、运维、测试效率。 ○ 探索 AI for Network 的创新场景,如异常检测、故障根因定位、智能调度策略优化等。 6. 学术前沿跟踪与技术影响力建设 ○ 持续跟踪计算机网络、AI infra、可编程网络硬件等领域的前沿研究与产业趋势,并评估其在阿里云场景中的落地价值。 ○ 鼓励/支持在 SIGCOMM、NSDI、ATC 等顶会发表论文或输出技术分享,增强团队和个人在业界的技术影响力。

更新于 2025-12-24杭州
logo of meituan
社招3年以上无人车业务部

1、参与自动车配送系统的车端分布式系统的迭代设计开发、系统移植和定制、以及深度性能优化,交付高可靠性、高性能的车载分布式系统。 2、参与车载综合业务网关(TBU)设备的系统软件和底层软件设计与开发,保障系统稳定性与性能。 3、负责BootLoader、Linux Kernel配置与裁剪、外设驱动(Audio、Ethernet、PCIe、CAN、SPI、I2C等)的开发与调试,以及锁、调度、IO等系统级优化。 4、参与Android内核(Kernel)的BSP开发、调试与维护,解决Android与Linux双系统间的设备共享、与性能问题。

更新于 2025-11-18深圳
logo of meituan
社招3年以上无人车业务部

1、参与自动车配送系统的车端分布式系统的迭代设计开发、系统移植和定制、以及深度性能优化,交付高可靠性、高性能的车载分布式系统。 2、参与自动车车载综合业务网关设备的系统软件和底层软件的设计和开发,交付高性能、高质量、高可靠性的综合业务网关设备。 3、开发各种维度的性能监测和评测工具,建立系统性能评测平台,持续提升自动驾驶系统的系统性能指标和核心业务性能指标。 4、根据自动车配送业务的需求,持续优化自动车配送系统的整体性能和可靠性等,推动自动车配送系统的研发迭代和大规模落地运营。

更新于 2025-11-18深圳