小米自动驾驶高级运维工程师
任职要求
1. 本科及以上学历,计算机及相关专业,五年以上工作经验,有全球主流公有云和私有云平台开发和运维经验者优先; 2. 计算机基础扎实,熟悉Linux系统、网络、有k8s docker运维经验优先; 3…
工作职责
1、负责小米汽车自动驾驶全球云端基础设施和基础服务的规划、建设、稳定性和可用性保障等; 2、负责小米汽车自动驾驶全球业务架构审核、系统监控、持续交付、应急响应、容量规划等; 3、负责小米汽车自动驾驶数据全流程合规和运维支持; 4、参与小米汽车全球混合合规云平台建设; 5、持续的创新和优化能力,提升产品整体质量,改善用户体验,控制系统成本。
1 负责自动驾驶业务日常运维技术支持,确保服务运行的后台基础设施的稳定性和高可用。 2 负责对混合云(云上云下)各类资源的监控、维护和升级。 3 负责开发各类运维系统和工具,落实运维体系工作建设,关注成本、质量、效率、安全四大目标,为公司业务赋能。
-负责自动驾驶数据全链路数据流构建,完成数据闭环下的AI Infra系统构建,包含挖掘相关框架、标注、数据管道、分布式训练、模型评测、推理和部署全链路的建设 -负责数据闭环系统稳定性和效率建设,对数据飞轮落地有想法和落地路径 -负责面向AI Infra 的数据存储系统建设,了解高吞吐下的Infra 框架设计 -负责面向大模型时代的工程架构优化工作,对各业务进行对接和合理化评估,针对现行系统中各种问题进行分析优化,给出设计优化方案并实现
-主导自动驾驶信息安全产品服务端后台的设计和研发工作,确保项目的顺利进行和高质量交付 -根据需求进行功能模块化拆解、设计文档编写、编码、单元测试,确保系统的稳定性与可扩展性 -负责后端模块及服务在可扩展、高可用、高并发、可运维等方向的技术优化 -撰写并更新系统相关文档,为团队提供完整、准确的技术支持
特斯拉正在寻找一位富有激情和丰富经验的数据中心工程师加入我们的IT基础设施及运营团队,负责数据中心基础设施,理想的候选人具备丰富的设计,建造以及维护数据中心基础设施的能力,包括但不限于计算机、通信、流程管理,电力,暖通和智能化等领域的专业知识,候选人将会帮助我们建造下一代数据中心来保障我们的IT基础设施99.99%可用。 岗位职责 负责数据中心业务连续稳定、制定并达成SLA、参与新数据中心的建设、现有数据中心的扩展以及包括计算、存储、网络和其他基础设施组件在内的部署; 负责参与数据中心服务器,网络设备部署、资产管理、上架、布线及硬件资源规划; 负责服务器硬件(CPU、内存、硬盘、RAID卡、网卡、电源等)的安装、调试、维护及故障排查; 负责制定流程规范、推动自动化工具落地,提升团队效率和质量; 负责运维服务过程中的问题处理及管控进度,并对项目实施及售后服务工作持续优化; 负责编写数据中心运维文档,包括数据中心基础设施,设备维护手册、故障处理 SOP 等; 负责设备生命周期的过程优化和治理,完成产品的线上化推进过程的风险管控和保障; 负责资源交付、设备运维、供应商及IDC数据中心IT管理,持续完善标准流程规范制定; 具有较强的分析问题解决问题的能力,具有良好的团队沟通协作能力; 根据需要为多个团队提供远程服务,包括重启、测试/故障排除等; 建设交付及压力测试,数据中心平面图,机柜立面图、机电安装图,容量文档,资产管理和其他必要的设计文件; 数据中心智能化,信息化建设和管理。