影石Devops工程师-2026校招
任职要求
1. 本科及以上学历,计算机、电子信息等相关专业; 2. 了解 Linux 系统基本操作,会用常见命令; 3. 对编程有一定兴趣,接触过 Python、Shell 等任一语言者优…
工作职责
1. 协助搭建和维护硬件相关代码的自动化部署流程,基于 Jenkins 配置和管理 job,提升代码发布效率; 2. 参与硬件研发相关服务器、云资源的日常管理和简单配置; 3. 学习使用监控工具,配合团队及时发现和解决硬件研发流程中的系统问题; 4. 与硬件开发、测试团队协作,优化研发流程,保障硬件相关项目顺利推进。
1、协助构建、部署和维护CI/CD流水线。 2、参与自动化脚本和工具的开发,以提高开发和运维效率。 3、协助监控和优化系统性能,确保系统稳定运行。 4、度量体系可视化开发。 5、协助排查和解决开发和集成环境中的各种问题。 6、编写和维护相关文档,确保团队知识共享
1、负责小鹏汽车数据智能与车联网业务系统的发布、监控、调优、告警处理等,保障服务的可用性与稳定性; 2、根据监控指标分析应用性能瓶颈、架构合理性及完善运维流程与规范; 3、负责k8s集群搭建、维护和优化,Devops体系工具研究落地; 4、探索业务运维最佳实践,编写运维工具,提升运维效率。
结合业务通过AIGC提效,主导系统的服务化架构设计、AI 模型编排、交互接口整合等核心模块,深度参与从模型能力对接到业务场景落地 的全过程,推动 AIGC的持续进化。 1.设计与开发 AIGC 系统核心后端服务,包括模型接入、能力编排、上下文调度、插件系统等 2.实现对主流大模型(如 GPT、Claude、Qwen、LLaMA 等)以及工具型能力的封装与统一调用接口 3.构建和维护面向多模态/多 Agent 的 MCP(Model Control Plane) 编排框架 4.接入向量数据库、知识库、RAG 检索链路,提升推理效果,如有能力,参与前端开发(主控台、可视化模型调度界面等),提升开发者交互体验 5.推动系统性能优化、监控告警、灰度发布等工程稳定性建设
小红书中台AI平台团队致力于打造业界领先的一站式AI平台,通过技术创新和工程优化,为公司AI业务发展提供强有力的基础设施支撑,实现算法研发效率的显著提升和成本的有效控制。我们负责调度公司所有AI模型训练及推理的数万卡GPU资源,基于自研的训练、推理、智能体框架,为公司所有算法及工程同学提供端到端、一站式的AI研发能力,包含大模型数据处理/训练/压缩/推理/部署及开箱即用的API体验、AI知识库/智能体应用构建、搜广推数据生产/模型训练/模型上线/特征管理/模型测试等。 1、负责大模型/搜广推模型开发平台、AI应用开发平台的架构设计和核心功能研发,构建云原生架构,设计高可用、高性能的微服务体系; 2、负责构建面向大模型、搜广推、智能体全流程DevOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地; 3、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、GPU虚拟化、存储&网络加速等手段,提升GPU集群使用效率; 4、将平台和框架结合,通过任务调度、弹性容灾、性能优化等措施端到端提升AI生产效率,涉及k8s/kubeflow、网络通信、分布式训练等; 5、优化各AI平台性能,提升系统稳定性和可扩展性,保障大规模并发场景下的服务质量与用户体验; 6、持续研究分析业内创新AI平台产品,优化技术方案,改进产品功能,提升创新能力与产品体验。