logo of bytedance

字节跳动容器开发工程师/技术专家

社招全职A83532地点:杭州状态:招聘

任职要求


1、具备扎实的计算机理论基础,有扎实的操作系统,体系结构,数据结构算法功底;
2、精通GoPythonRustC/C++ 等编程语言一个或多个;    
3、熟悉容器社区,对 Containerd, Kata 等有深入理解,并且有一定的生产环境实践的经验;
4、对资源隔离有了解,对cgroup、namespace机制有深入了解,熟悉常用的资源隔离手段;
5、深入理解 Linux 系统,熟悉虚拟化相关技术,有数据面卸载相关经验更佳。

工作职责


本团队负责数百万节点的云原生基础设施,支撑公司的所有产品线。目前在 kubernetes 集群管控技术,运行时资源优化,多云多集群,云原生基础设施稳定性保障方面都会比较深入的技术积累,并且开源有 kubebrain, katalyst 等云原生基础技术相关项目,团队持续围绕以资源并池,资源弹性为中心的基础技术研发和突破。

1、构建标准化的容器运行时规范,推动容器架构的演进;
2、根据业务实际场景优化容器运行时,推动RunC,Kata 等MicroVM容器运行时的迭代,提供资源隔离能力,优化应用运行稳定性;
3、和资源优化方向密切协作,在保障数据面稳定性的前提下,提升资源使用效率;
4、推动镜像系统的迭代,设计并推动镜像加速/镜像分发等项目落地;
5、积极探索容器运行时技术形态,参与设计和实现容器数据面卸载,推动容器和容器虚拟化融合等技术的研发和落地。
包括英文材料
数据结构+
算法+
Go+
Python+
Rust+
C+
C+++
Linux+
相关职位

logo of bytedance
社招A23916

1、负责混合云PaaS方向架构设计、系统开发,容器服务等产品化工作; 2、负责混合云云原生AI套件,GPU架构的研发,提升AI效率、性能。

更新于 2024-11-13
logo of bytedance
社招A170680

1、负责混合云PaaS方向架构设计、系统开发,容器服务等产品化工作; 2、负责混合云云原生AI套件,GPU架构的研发,提升AI效率、性能。

更新于 2024-11-13
logo of amap
社招2年以上技术类-开发

团队介绍: 加入高德地图移动架构核心团队,我们负责支撑亿级用户的地图与导航场景。在这里,你将深入业界领先的跨端容器技术,在包体积、“启动秒开”等性能体验上持续深耕、保持行业标杆水平,并在高德扫街榜等关键业务中深度优化,让技术价值直接转化为用户口碑。我们是一群对极致体验痴迷的工程师,期待与你一起,参与影响亿级用户的核心技术建设,把技术做到“能写进行业故事”的高度! 加入我们,你将: 直面亿级用户产品的技术挑战,参与定义行业标准的跨端容器与性能优化方案,让你的代码影响全国用户的出行; 与一群痴迷于攻克技术难题、追求极致体验的顶尖工程师共同成长; 在架构设计、性能极致优化等方向获得充分授权,拥有将技术成果写入行业故事的机会与舞台。 岗位职责: 1. 主导架构与容器技术:负责高德地图iOS主APP的基础架构演进与高性能跨端容器的设计、开发与难点攻关,确保技术选型的先进性与可靠性; 2. 驱动关键业务实现:深度参与高德导航、用户平台、增值服务等核心业务的开发工作,通过技术创新保障产品体验领先; 3. 深耕体验与性能优化:主导并落地APP启动速度、包体积、流畅度等核心性能指标的极致优化,攻克“扫街榜体验优化”等技术难题,塑造行业领先的用户体验; 4. 保障应用稳定安全:负责识别并解决软件潜在风险,构建高可用、高稳定、高安全的应用运行环境。

更新于 2025-09-26
logo of thead
社招5年以上技术-芯片

我们正在寻找具备深厚技术功底、前瞻性视野和丰富实战经验的DevOps平台工程专家,加入我们致力于构建智能化研发基础设施的核心团队。在这里,你将主导下一代AI驱动的CI/CD平台与智能运维系统的设计与落地,推动软件研发流程向自动化、可观测性、自愈能力和数据驱动决策全面进化。 作为团队的技术骨干,你将: 1. 设计并构建高可用、智能化的CI/CD平台 主导持续集成与持续交付系统的架构演进,支持大规模分布式研发协作;探索机器学习在构建失败预测、测试用例智能推荐、资源调度优化等场景的应用,显著提升交付效率与稳定性。 2. 打造企业级智能化运维(AIOps)体系 基于Python、Go等语言,构建自动化运维工具链与平台化能力,实现基础设施即代码(IaC);引入异常检测、根因分析、故障传播图谱等AI算法,提升系统可观测性与故障响应速度,推动运维从“被动响应”向“主动预防”转变。 3. 构建全链路智能监控与自愈系统 设计并落地覆盖应用、服务、资源的端到端监控体系,集成Prometheus、Grafana、ELK、OpenTelemetry等主流技术栈;结合时序预测(LSTM、Prophet)、无监督异常检测(Isolation Forest、One-Class SVM)等模型,实现性能瓶颈预警、自动诊断与部分场景的闭环自愈。 4. 推动MLOps与DevOps深度融合 主导机器学习模型训练流水线(ML Pipeline)与模型服务化(Model Serving)平台建设,设计模型版本管理、A/B测试、流量灰度、监控告警与快速回滚机制,支撑AI能力高效、稳定地规模化落地。

更新于 2025-10-09