logo of bytedance

字节跳动AI Infra后端开发实习生-IaaS

实习兼职A09637地点:上海状态:招聘

任职要求


1、2026届本科及以上学历在读,计算机、通信等相关专业;
2、掌握算法数据结构等基础知识,至少熟练使用一门编程语言(C/C++/Python/Go等);
3、积极乐观,责任心强,工作认真细致,具有良好的团队沟通与协作能力;
4、热爱编程,有较强的学习能力,有强烈的求知欲、好奇心和进取心,能及时关注和学习业界最新技术;
5、有机器学习框架(PyTorchTensorflow等)、推理引擎vLLM、SGLang等)、GPU编程,高性能网络相关开发经验者优先。

工作职责


ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。
团队介绍:字节跳动基础架构IaaS团队,负责提供云计算IaaS能力,作为基座支撑了字节跳动旗下产品(今日头条、抖音、西瓜视频等)亿级用户量APP和toB业务(火山引擎、飞书等);在这里,我们的产品基于云原生架构,覆盖了数以十万计服务器规模的集群和遍布全球、面向各类场景的网络;在这里,我们积极拥抱开源和创新的软硬件架构,致力于为字节toB战略和自身业务保驾护航,引领IaaS产业发展和架构演进。

1、负责负责字节跳动IaaS AI Infra开发、优化工作,满足业务需求;
2、参与字节跳动AI Infra前沿技术探索,技术验证。
包括英文材料
学历+
算法+
数据结构+
C+
C+++
Python+
Go+
机器学习+
PyTorch+
TensorFlow+
推理引擎+
vLLM+
相关职位

logo of bytedance
实习A109306

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动基础架构IaaS团队,负责提供云计算IaaS能力,作为基座支撑了字节跳动旗下产品(今日头条、抖音、西瓜视频等)亿级用户量APP和toB业务(火山引擎、飞书等);在这里,我们的产品基于云原生架构,覆盖了数以十万计服务器规模的集群和遍布全球、面向各类场景的网络;在这里,我们积极拥抱开源和创新的软硬件架构,致力于为字节toB战略和自身业务保驾护航,引领IaaS产业发展和架构演进。 1、负责负责字节跳动IaaS AI Infra开发、优化工作,满足业务需求; 2、参与字节跳动AI Infra前沿技术探索,技术验证。

更新于 2025-04-23
logo of bytedance
实习A08039

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动基础架构IaaS团队,负责提供云计算IaaS能力,作为基座支撑了字节跳动旗下产品(今日头条、抖音、西瓜视频等)亿级用户量APP和toB业务(火山引擎、飞书等);在这里,我们的产品基于云原生架构,覆盖了数以十万计服务器规模的集群和遍布全球、面向各类场景的网络;在这里,我们积极拥抱开源和创新的软硬件架构,致力于为字节toB战略和自身业务保驾护航,引领IaaS产业发展和架构演进。 1、负责负责字节跳动IaaS AI Infra开发、优化工作,满足业务需求; 2、参与字节跳动AI Infra前沿技术探索,技术验证。

更新于 2025-04-23
logo of bytedance
实习A39749

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动基础架构IaaS团队,负责提供云计算IaaS能力,作为基座支撑了字节跳动旗下产品(今日头条、抖音、西瓜视频等)亿级用户量APP和toB业务(火山引擎、飞书等);在这里,我们的产品基于云原生架构,覆盖了数以十万计服务器规模的集群和遍布全球、面向各类场景的网络;在这里,我们积极拥抱开源和创新的软硬件架构,致力于为字节toB战略和自身业务保驾护航,引领IaaS产业发展和架构演进。 1、负责负责字节跳动IaaS AI Infra开发、优化工作,满足业务需求; 2、参与字节跳动AI Infra前沿技术探索,技术验证。

更新于 2025-04-23
logo of liauto
实习后端开发

我们正在寻找一位AI基础设施工程师,为团队 AI 软件,负责设计、构建和维护高效的持续集成与持续交付(CI/CD)流水线,提升开发团队的交付效率和质量。您将与开发、测试和运维团队紧密协作,推动自动化工具链落地,确保代码从提交到部署的全流程高效可靠。​ 主要职责:​ 1.CI/CD 流水线设计与优化:​ ◦搭建和维护基于 Jenkins/GitLab CI 等工具的自动化构建、测试和部署流水线。​ ◦管理容器化部署(Docker)和编排系统(Kubernetes),优化镜像构建和发布流程。​ ◦优化流水线性能(如并行化、缓存策略、依赖管理),缩短构建和部署时间。​ ◦构建内部工具链,提升算法团队的开发效率(如实验管理、版本控制)。​ 2.AI 平台建设:​ a.设计、开发和维护分布式 AI 训练和推理基础设施。​ b.构建和管理 Kubernetes(K8s)、Slurm 或其他编排系统,优化 AI 任务的调度和资源分配。​ 3.基础设施即代码(IaC):​ ◦使用 Terraform/Ansible/Pulumi 等工具管理云资源和部署环境,确保环境一致性。​ ◦实现多环境(开发/测试/生产)的自动化配置和部署。​ 4.质量与安全管控:​ ◦集成代码扫描工具(如 SonarQube)、安全扫描(如 Trivy、Checkmarx)和依赖检查(如 Dependabot)。​ ◦设计自动化测试策略(单元测试、集成测试、E2E 测试)并与流水线结合。​ 5.稳定性与可观测性:​ ◦设计监控和告警系统,保障 AI 服务的 SLA(如延迟、吞吐量、可用性)。​ ◦实现日志追踪、性能分析和故障诊断工具(如 Prometheus、Grafana、ELK)。