logo of bytedance

字节跳动大模型实施运维工程师-火山引擎

社招全职5年以上A63985地点:深圳状态:招聘

任职要求


1、计算机相关专业本科以上学历,5年以上云原生运维经验,2年以上大模型部署调优经验;
2、熟悉DockerKubernetes等容器技术,了解主流云平台(阿里云/AWS等)的使用,并具备丰富的实操和运维经验;
3、深入理解Linux/Unix系统、网络原理及硬件架构,具备扎实的理论基础与丰富的实践经验,拥有出色的故障排查能力,能够快速定位并解决复杂技术问题;
4、熟悉Golang/Python中至少一种开发语言,有Ansible/Saltstack/Puppet等自动化部署和编排工具开发经验;
5、具备较强的沟通和团队协作能力,能够与技术、产品、销售等不同部门人员进行有效沟通与合作,共同推动项目进展;
6、具有大模型项目落地经验者优先,熟悉大模型训练、推理等业务流程及技术要点;具有交付运维团队管理经验者优先,能够合理分配任务、协调资源,保障团队高效运作。

工作职责


1、负责大模型相关产品的全链路交付管理,深度参与项目可行性评估,实施方案制定(容量规划、技术选型等),保障产品高效、稳定上线;
2、负责保障客户环境的稳定运行,建立故障预防与应急响应机制,快速定位并解决各类故障与告警;
3、负责对客赋能,为客户定制专业化、场景化的使用及运维培训方案,培养客户技术团队自主运维能力;
4、协同项目经理整合内外部资源,化解项目执行中的技术难题,确保项目按时高质量交付;
5、建立客户问题反馈闭环管理机制,深度分析客户反馈数据,挖掘客户潜在需求,驱动产品功能迭代与用户体验持续优化。
包括英文材料
学历+
大模型+
Docker+
Kubernetes+
AWS+
Linux+
Unix+
Go+
Python+
Ansible+
相关职位

logo of bytedance
社招5年以上A234280

1、负责大模型相关产品的全链路交付管理,深度参与项目可行性评估,实施方案制定(容量规划、技术选型等),保障产品高效、稳定上线; 2、负责保障客户环境的稳定运行,建立故障预防与应急响应机制,快速定位并解决各类故障与告警; 3、负责对客赋能,为客户定制专业化、场景化的使用及运维培训方案,培养客户技术团队自主运维能力; 4、协同项目经理整合内外部资源,化解项目执行中的技术难题,确保项目按时高质量交付; 5、建立客户问题反馈闭环管理机制,深度分析客户反馈数据,挖掘客户潜在需求,驱动产品功能迭代与用户体验持续优化。

更新于 2024-08-30
logo of bytedance
社招5年以上A12120

1、负责大模型相关产品的全链路交付管理,深度参与项目可行性评估,实施方案制定(容量规划、技术选型等),保障产品高效、稳定上线; 2、负责保障客户环境的稳定运行,建立故障预防与应急响应机制,快速定位并解决各类故障与告警; 3、负责对客赋能,为客户定制专业化、场景化的使用及运维培训方案,培养客户技术团队自主运维能力; 4、协同项目经理整合内外部资源,化解项目执行中的技术难题,确保项目按时高质量交付; 5、建立客户问题反馈闭环管理机制,深度分析客户反馈数据,挖掘客户潜在需求,驱动产品功能迭代与用户体验持续优化。

更新于 2025-06-04
logo of bytedance
社招3年以上A251931

1、负责大模型的交付实施,包括安装部署等工作; 2、负责处理大模型项目的告警、故障响应,维护大模型平台的稳定性; 3、负责对客户进行相关培训、协助项目经理完成项目验收工作。

更新于 2025-04-25
logo of bytedance
社招3年以上A245296

1、负责大模型的交付实施,包括安装部署等工作; 2、负责处理大模型项目的告警、故障响应,维护大模型平台的稳定性; 3、负责对客户进行相关培训、协助项目经理完成项目验收工作。

更新于 2025-04-25