阿里云诚云科技-高级IT自维修工程师-国内属地运维(南通 杭州 )
任职要求
• 3年及以上服务器维修相关⼯作经验 • 熟悉数据中心行业IT运维硬件相关基本技术标准 • IT运维专业技术功底扎实,具有较强的服务器维修理论基础,掌握数据中心各类机型服务器的拆机维修 • 可协助IM制定机房日常运维及服…
工作职责
1、负责辖区内机房自维修运维管理工作,结合IDC实际情况均衡考虑服务质量、效率、成本及安全,持续优化及改进以支撑部门的业务运营; 2、负责辖区内机房自维修的服务器维修整体质量,包括:人员能力、技术储备和备件质量,协助现场服务器维修达成维修SLA; 3、负责辖区内机房现场自维修进行日常自维修工单操作和流程指导,支撑不断扩大的自维修体量,确保相关指标满足业务整体需求; 4、针对不断扩充的自维修新机型,梳理基于现场实际情况的操作手册,同时对一线人员进行培训与认证,确保全国人员能力满足项目推进要求; 5、基于自维修项目,配合实现专业领域的边界拓展,包括但不限于专利、新技术、新产品等。
1、负责辖区内机房自维修运维管理工作,结合IDC实际情况均衡考虑服务质量、效率、成本及安全,持续优化及改进以支撑部门的业务运营; 2、负责辖区内机房自维修的服务器维修整体质量,包括:人员能力、技术储备和备件质量,协助现场服务器维修达成维修SLA; 3、负责辖区内机房现场自维修进行日常自维修工单操作和流程指导,支撑不断扩大的自维修体量,确保相关指标满足业务整体需求; 4、针对不断扩充的自维修新机型,梳理基于现场实际情况的操作手册,同时对一线人员进行培训与认证,确保全国人员能力满足项目推进要求; 5、基于自维修项目,配合实现专业领域的边界拓展,包括但不限于专利、新技术、新产品等。
【业务介绍】 我们是小红书内稠密类模型(LLM/MLLM/SD/CV/NLP)统一的AI平台QuickSilver,负责调度公司内所有稠密类模型训练与推理资源,基于自建的训推引擎,为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务;包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力。 工作职责: 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程,包括模型fine-tuning、推理服务化等 3、构建云原生架构,设计高可用、高性能的微服务体系 4、优化平台性能,提升系统稳定性和可扩展性
1、负责模型训练平台核心功能开发和架构设计,包括传统CN/NLP/SD/LLM等多场景支持 2、负责大模型后训练工具平台化建设,包括后预训练、微调、对齐等技术落地 3、设计和实现高性能分布式训练系统,打造端到端训练解决方案 4、优化训练调度和资源管理,提升集群利用率和训练效率 5、开发模型训练监控诊断工具,建设可观测性体系
关于我们: 滴滴国际化Fintech业务,是滴滴国际化战略的重要组成板块。近年来,滴滴Fintech在拉美地区积极探索和开展电子支付、信贷、信用卡、商户收单等业务,为当地用户带来更便捷、优质、更高性价比的金融服务。我们诚挚邀请真诚、可靠、勇于挑战的您和我们一起,携手并肩,拥抱金融出海的浪潮,和滴滴Fintech一起快速成长。 职位描述: 1、参与并完成风控平台基建研发,包括决策引擎、特征平台、核身、模型、名单、图数据库、监控平台、Databus等多个方向 2、建设提效工具,提升风控研发流程的效率。 3、积极跟其他团队沟通和配合,推动项目进展,讨论并提出有建设性的意见。