字节跳动云迁移技术专家

社招全职A236855A2025-02-10地点：西安状态：招聘

扫码手机上打开

任职要求

1、本科及以上学历，计算机、通信相关专业优先，具备扎实的计算机基础知识；
2、熟悉Linux系统基础操作及常用命令，了解Shell/Python至少一种脚本语言；
3、至少熟悉TCP/IP/HTTP等协议原理、MySQL/Redis等组件的部署与基础运维、Docker/…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、迁移方案支持：协同销售、产品等角色，在导师指导下完成企业迁移上云的技术支持，包括但不限于：需求调研，云上架构设计、迁移方案制定及风险评估等；
2、技术实施与排障：在导师指导下完成产品开通部署、迁移方案实施落地、业务系统割接等动作；能够主动发现并解决迁移过程中的基础技术问题，做好技术风险管控和实施进度管理，保障业务系统顺利迁移；
3、工具与流程优化：参与迁移工具/脚本的开发与优化，沉淀迁移场景的标准化文档和自动化脚本，提升迁移效率；
4、技术输出与沉淀：整理迁移案例经验，输出技术文档、操作手册及行业解决方案，推动知识共享。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

Linux+

Bash+

Python+

脚本+

TCP/IP+

还有更多 •••

登录查看完整学习资料

相关职位

阿里云智能-对象存储运维开发专家-杭州/深圳

社招5年以上技术类-开发

1、设计和实现高性能、可靠的对象存储系统，满足大规模数据存储和访问需求； 2、负责对象存储系统核心功能的研发，包括数据存储、数据访问、数据迁移复制等； 3、制定稳定性策略，寻找并解决产品系统中的潜在风险和瓶颈，覆盖线上疑问，保障系统安全可靠。运用产品优化技术和方法，进行性能优化。 4、分析用户需求，优化存储系统架构，提高系统的扩展性、灵活性和可维护性； 5、负责对象存储相关工具和平台的开发，提升对象存储系统的高运维性。

更新于 2025-04-15深圳|杭州

大模型推理存储系统工程师/专家-Seed

社招A121315

团队介绍：字节跳动豆包大模型团队（Seed）成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限，并探索新的交互。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等，在中国、新加坡、美国等地设有实验室和岗位。豆包大模型团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责机器学习系统存储相关组件的设计和开发，服务于大模型推理的各业务场景（LLM/S2S/VLM/多模态等），包括模型分发加载、KV Cache存储和优化，数据IO性能优化，提高推理TTFT、TBT等核心性能指标； 2、负责设计和实现面向大模型推理的多层级存储系统，综合利用显存、本地内存、分布式内存/磁盘、远端大容量存储系统（HDFS/对象存储）等多种介质进行数据的存储和迁移管理，实现「近计算缓存+远端大容量存储」的一体化分级系统； 3、负责优化大模型KV Cache命中率，从推理框架，流量调度，多级缓存等多个系统纬度入手定制化优化策略；优化数据的读取性能，充分利用近计算侧的NVLink、RDMA高速网络、GPU Direct技术实现数据的高效传输；优化数据副本的存放策略，实现负载流量和存储数据的合理化分布； 4、负责设计和实现高效、易用的数据访问接口，实现和推理框架、引擎的无缝对接，管理KV Cache的生命周期； 5、负责Kubernetes场景下多级存储系统的接入、管理、运维、监控，确保稳定性； 6、负责多机房、多地域、多云场景的系统搭建和容灾，优化跨集群的数据摆放。

更新于 2024-12-20上海

阿里云智能-异构GPU集群资源优化技术专家-杭州

社招5年以上技术类-开发

1. 负责灵骏集群中GPU资源的全面监控、质量巡检及故障预测，通过智能化运维手段确保系统的高可用性和稳定性，提前识别并解决潜在问题； 2. 保障灵骏与集团在线POD的集群资源管理与切分业务，优化资源分配策略，提高资源利用率和任务处理效率，支持大规模分布式计算的需求； 3. 开发和维护KuberGPU技术，实现GPU资源的高效切分与容器化部署，支持包括灵骏客户、集团内部需求以及阿里云服务（ACS）产品在内的多种应用场景，提供灵活且强大的GPU资源共享解决方案； 4. 开发和实施容器热迁移技术，提升集群灵活性和容错能力，确保在不停机的情况下进行系统维护和资源调度，进一步增强用户体验和服务连续性。

更新于 2025-06-18杭州

阿里云智能-异构GPU集群资源优化专家-杭州

社招5年以上云智能集团

1、负责异构计算集群的架构设计与研发，优化算力资源调度，提升效率与稳定性，为亿万用户提供普惠算力服务； 2、攻克主流AI应用在异构计算集群部署中的技术瓶颈，设计并开发高性能、高可用的异构计算解决方案； 3、主导Serverless化异构计算平台的建设，推动云原生架构在异构计算领域的创新应用与迭代升级； 4、跟踪AI领域的前沿技术动态，参与构建面向下一代AI训练与推理场景的智能算力平台架构。

更新于 2025-09-10杭州