快手数据库研发工程师(Go/Python)
任职要求
1、熟悉Python/Golang语言中的一种; 2、熟悉任意一种语言的多线程、网络编程、分布式开发; 3、熟悉gRPC、etcd、Kubernets等开源项目优先; 4、熟悉MySQL、Innodb、Rocksd…
工作职责
1、从事数据库周边生态相关研发工作,负责数据库多活和proxy等的研发; 2、包括但不限于proxy、flashback、backup、结转; 3、运维管理线上大规模分布式数据库集群; 4、为研发同事提供数据库解决方案。
【业务介绍】 我们是小红书内稠密类模型(LLM/MLLM/SD/CV/NLP)统一的AI平台QuickSilver,负责调度公司内所有稠密类模型训练与推理资源,基于自建的训推引擎,为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务;包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力。 工作职责: 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程,包括模型fine-tuning、推理服务化等 3、构建云原生架构,设计高可用、高性能的微服务体系 4、优化平台性能,提升系统稳定性和可扩展性
-参与私有化部署平台的后端架构设计、开发和优化,主要使用 Go 语言 -设计并开发企业级操作系统自动化部署平台,支持大规模服务器环境的高效安装和配置 -优化操作系统定制和部署流程,提高硬件适配性和部署效率,简化安装过程 -负责操作系统的安装工具链研发(如PXE、Tinkerbell等),并进行定制化开发。 -深入研究并解决复杂的系统安装和启动问题,包括网络引导、硬件初始化、文件系统挂载等关键环节 -根据不同硬件架构的需求(x86、ARM、DPU等),定制化开发操作系统内核和驱动支持 -深入理解 Kubernetes (K8s) 的核心概念,并将其与业务需求紧密结合,具备封装 K8s 的接口和服务的能力 -可独立设计并完成子系统的开发,编写高质量的代码,确保代码的可维护性和高效性能 -参与系统的性能优化、故障排查及技术难题攻关,保证平台的高可用性和稳定性
-负责百度旗下内容生态智慧运营以及生态治理方向的研发工作 -对现有系统不足进行分析,找到目前系统瓶颈,改进相关架构,提高系统性能 -负责核心技术的研究、实现和优化 -快速学习互联网相关领域的新产品与新技术,并运用到相关产品研发中