小米大数据运维工程师实习生
任职要求
1、熟练掌握Python/Golang语言及常用开发框架与工具,熟悉Linux开发环境; 2、熟练掌握linux基础,了解分布式系统原理; 3、有良…
工作职责
1、我们为小米的站点稳定性提供系统和工具,是稳定性工程专家; 2、实践DevOps和GoogleSRE的工程思想; 3、站在软件生命周期全局考虑如何保障系统健壮性,稳定性,并通过软件工程技术为站点保驾护航; 4、站在用户/工程师的角度提供易用的工具和平台产品,不断完善使用体验; 5、负责集团基础软件/工具/平台的设计和研发,维护小米各项业务的稳定运行; 6、按照优秀的工程实践完成需求,设计,编码,测试,发布的软件开发流程; 7、按照标准编写设计/开发/运维/用户文。
1、系统及云平台管理:负责vivo全球数据中心、云平台的上万台服务器系统的建设及管理工作,为vivo企业级业务保驾护航; 2、存储备份管理:负责vivo全球数据中心数PB的SAN/NAS存储、分布式存储、对象存储的建设及运维管理,负责vivo企业数据全生命周期管理、全球容灾备份管理; 3、智能运维平台:参与vivo IAAS/PAAS云平台、智能监控运维平台、ITSM、CMDB、容器等各平台的开发建设,利用大数据和人工智能技术手段,持续改善vivo企业用户服务体验,降低公司IT运营成本。 4、数据中心管理:负责vivo全球数据中心基础设施的规划设计、实施运维以及体系标准建设,提升数据中心机房的稳定性及降低能效。
阿里云持续推进AI技术深化战略布局,围绕AI 和云计算的基础设施建设、AI基础模型平台、企业级AI应用方向构建核心场景。为此,我们正积极招募优秀人才: 负责云计算和大数据基础技术研发,包括不限于以下方向: 1、云基础设施技术,包括研发面向百万级服务器的网络(如RDMA、可编程芯片)、服务器(如异构计算)、数据中心,以及构建超大规模的基础设施智能化运维体系(如AIOps); 2、虚拟化技术,包括XEN、KVM等开源技术的改进,以及也包括我们自研的SDN、VPC等网络虚拟化、存储虚拟化技术,还包括Docker等轻量级的容器方案; 3、MySQL、PostgreSQL、MongoDB、Redis、HBase等开源数据库内核的改进; 4、包含单集群上万个节点,多地多集群的超大规模分布式存储系统(文件系统,KVstore,BigTable等等)、分布式计算系(MapReduce,DAG,MPI并行计算、Batch、类Hive/spark的计算系统包括离线,分布式开发语言,分布式开发IDE,查询优化,流式实时计算,图计算,MPP等等)、弹性分布式资源管理和调度(海量多维度的多目标的调度系统,多个资源维度资源隔离技术等等)、机器学习平台(包括Paratemter Server,深度学习,逻辑回归等等)、异构等新型硬件上计算(包括CPU,GPU,FPGA,RDMA等等); 5、大数据在线引擎体系的目标是集广告、搜索、推荐的投放三位于一体,在近百毫秒周期内,从服务端跨越至移动端上智能,支撑总体近TB级的模型,完成知识推理向量匹配等各种召回,以及其它深度学习的排序和预测算法,参与计算的数十亿商品保持实时更新,支持数百位算法工程师面向众多场景展开测试,在算子流图化的抽象之下,引擎内的模型和数据可随时调整布局满足迭代所需; 6、参与大规模高并发场景下的开发者工具如IDE、SDK、CLI的开发工作,toB相关认证、权限、审计平台合规等相关工具平台的研发工作。
1.负责相关业务服务器端的研发工作,包括需求沟通、功能设计与开发等; 2.负责相关业务服务器相关的高并发架构设计、线上维护、性能调优等; 3.和产品/测试/运营进行密切沟通,能够根据需求提出合理技术方案; 4.负责软件开发过程中的问题分析和总结,提供建议和帮助改善研发流程。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:火山引擎是字节跳动旗下的云服务平台,将字节跳动快速发展过程中积累的增长方法、技术能力和工具开放给外部企业,提供云基础、视频与内容分发、大数据、人工智能、开发与运维等服务,帮助企业在数字化升级中实现持续增长。 1、协助大模型应用开发:在资深工程师的指导下,参与大模型相关应用的开发工作,如知识助手等,负责应用的调试与优化; 2、数据处理与分析:协助进行模型训练数据的收集、整理、标注工作,并对数据进行分析,提升应用的准确性; 3、问题排查与解决:在应用开发过程中,及时发现并记录遇到的技术问题,对于无法解决的问题,及时上报,协助定位和修复问题; 4、智能体搭建:参与AI Agent项目交付工作,包括智能体设计、搭建以及调优、工作流建设。