logo of bytedance

字节跳动高级软件工程师(云原生)

社招全职5年以上RN3P地点:杭州状态:招聘

任职要求


1、本科及以上学历,计算机相关专业,5年以上开发经验;
2、有K8s周边开发经验,有PaaSIaaS领域相关经验;
3、熟悉Golang,或至少一类后端编程语言且具备快速转向Golang的能力;
4、熟悉Linux网络、存储等基本知识,熟悉容器网络、存储相关原理;
5、熟悉云计算架构体系和技术解决方案,有大规模集群架构设计、性能优化相关经验。

【加分项】
1、有KubernetesDocker、Containerd、Katacontainer等相关项目经验;
2、有CNI、CSI、Cluster API等相关项目经验;
3、有开源社区贡献。

工作职责


1、负责容器云平台后端系统的架构设计、产品开发;
2、负责优化大规模容器云平台下性能和高可用性等问题;
3、负责云原生产品架构演进;
4、参与基于Kubernetes的云原生AI工作,包括任务管理、异构资源管理、性能优化、模型推理、工作流等;
5、参与云原生方向新技术和AI应用工程的调研,例如AI Agent,CoT,模型微调等;
6、与计算网络存储团队深度合作,提升大模型训练和推理下的稳定性、可观测和性能等。
包括英文材料
学历+
Kubernetes+
PaaS+
IaaS+
Go+
Linux+
系统设计+
Docker+
相关职位

logo of bytedance
社招5年以上LBSL

1、负责容器云平台后端系统的架构设计、产品开发; 2、负责优化大规模容器云平台下性能和高可用性等问题; 3、负责云原生产品架构演进; 4、参与基于Kubernetes的云原生AI工作,包括任务管理、异构资源管理、性能优化、模型推理、工作流等; 5、参与云原生方向新技术和AI应用工程的调研,例如AI Agent,CoT,模型微调等; 6、与计算网络存储团队深度合作,提升大模型训练和推理下的稳定性、可观测和性能等。

更新于 2022-03-23
logo of bytedance
社招5年以上A97286

1、负责容器云平台后端系统的架构设计、产品开发; 2、负责优化大规模容器云平台下性能和高可用性等问题; 3、负责云原生产品架构演进; 4、参与基于Kubernetes的云原生AI工作,包括任务管理、异构资源管理、性能优化、模型推理、工作流等; 5、参与云原生方向新技术和AI应用工程的调研,例如AI Agent,CoT,模型微调等; 6、与计算网络存储团队深度合作,提升大模型训练和推理下的稳定性、可观测和性能等。

更新于 2025-02-08
logo of bytedance
社招A162054

1、通过良好的工程架构设计,参与生产集群和服务的整个生命周期,满足可持续发展,提高稳定性,包括参与架构规划、评审,设计、部署和上线等环节; 2、确保大数据、计算、云原生、分布式存储等核心系统的高可用性和性能,并构建自动化工程以防止问题再次发生,同时关注系统成本和稳定性; 3、设计、编写和交付软件,提高公司服务的可用性、可扩展性、延迟和效率,构建保障线上大规模集群快速迭代的自动化平台; 4、构建自动化运营解决方案,为大型复杂系统参与整个生命周期的设计和上线,确保系统的可靠性; 5、根据业务使用场景,优化服务治理实践,包括关键链路性能瓶颈分析、业务问题定位和排障,推进系统高可用架构改造升级等。

更新于 2023-06-05
logo of xpeng
社招3年以上

1. 负责小鹏汽车“扶摇”AI平台数据处理相关的软件开发工作,包括数据加载工具(XDataLoader)和数据集管理平台(XDataset),提供统一的数据加载、转换、缓存与预取能力;目标解决大规模数据加载过程中出现的性能瓶颈、数据一致性、系统稳定性等问题,服务AI大模型的训练和推理; 2. 开发并维护高性能 DataLoader SDK,支持自定义采样、并行读取、缓存预取与数据增强等功能,优化多线程/进程流水线,降低I/O与预处理延迟,简化算法团队接入并提升加载效率; 3. 搭建通用Dataset管理系统,实现多源异构数据(图片、视频、点云、传感器等)的统一接入、解析与格式化; 4. 协同算法团队及其他技术团队,深入理解业务需求,快速响应并落地实现。

更新于 2025-07-22