腾讯腾讯云-虚拟化高级研发工程师-北京/深圳/上海
任职要求
1.熟悉 Linux 内核,对内核网络、存储、文件系统、内存、调度器,Cgroup 等模块之一有过相关实践; 2.3 年以上 Linux 内核或 QEMU 开发经验; 对 KVM/Xen 等虚拟化技术有过实际的开发和优化经验;了解 KVM CPU,内存,IO 的处理流程和代码; 3.熟练使用 Linux 底层工具链,了解其原理,熟悉某一 CPU 体系结构,熟悉底层性能调优,对网络/存储等协议栈以及协议非常精通;有丰富内核故障调试经验者优先; 4.了解硬件 RAS 相关经验者优先,对硬件可靠性和硬件监控方面与项目经验者优先; 5.熟悉 Windows 内核和逆向调试,能熟练使用调试工具和逆向工具,熟悉常见 Windows 问题定位,了解常见问题定位工具,有相关项目实践经验者优先; 6.了解 virtio 规范,有 Windows virtio 驱动或者 Linux virtio 驱动项目经验者优先; 7.了解 SPDK,有 SPDK 相关项目经验者优先; 8.在社区长期活跃贡献者,有内核补丁社区以及虚拟化社区提交经验者优先。 加分项 1.在同等条件下,通过腾讯云认证或取得同等资格认证的候选人,我们会优先考虑。
工作职责
1.负责 Linux 内核,虚拟化,容器方面的研发工作; 2.负责 Linux 内核、虚拟化定制化研发工作,提升产品竞争力; 3.负责宿主机和客户机上Linux内核的性能优化和问题定位方面的工作。
1.负责腾讯云网络虚拟化产品业务需求开发及架构设计; 2.负责客户业务上云的解决方案及问题排查、优化; 3.负责优化提升腾讯云网络产品的性能与可靠性。
1.负责腾讯云网络虚拟化产品业务需求开发及架构设计; 2.负责客户业务上云的解决方案及问题排查、优化; 3.负责优化提升腾讯云网络产品的性能与可靠性。
1、负责字节跳动虚拟网络产品的研发,包括但不局限于网络VPC、NAT、LB负载均衡等; 2、负责字节跳动网络络基础平台的研发,包括但不局限于网络控制面系统、容器网络、网络NFV等; 3、负责字节跳动网络虚拟化性能加速和offload的研发,包括但不局限于DPDK、智能网卡、P4等; 4、负责字节跳动物理/虚拟化网络的稳定性、高可用和高性能,持续提升用户体验。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、负责大模型平台的架构设计和核心功能研发,构建云原生架构,设计高可用、高性能的微服务体系; 2、负责构建面向大模型全流程的DevOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地; 3、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、GPU虚拟化、存储&网络加速等手段,提升GPU集群使用效率; 4、将平台和框架结合,通过任务调度、弹性容灾、性能优化等措施端到端提升AI生产效率,涉及k8s/kubeflow、网络通信、分布式训练等; 5、优化各AI平台性能,提升系统稳定性和可扩展性,保障大规模并发场景下的服务质量与用户体验; 6、持续研究分析业内创新AI平台产品,优化技术方案,改进产品功能,提升创新能力与产品体验。