发布单位:北京中航信柏润科技有限公司 发布时间:2022-7-2
出于对it资源化、精细化管理的要求,企业部署了诸多的监控管理工具,如网络监控、系统监控、数据库监控工具等。一般来说,这些监控工具往往来自于不同的厂商,彼此之间缺乏信息共享的手段。而一个具体的业务是由网络、主机、应用本身所组成,管理信息无法共享,这就造成了当一个故障出现时,无法通过系统直接自动分析并定位故障点,加大了it故障的分析难度,降低了解决问题的效率。业务服务管理可以有效整合企业已经构建的众多it监控系统,将分散的it管理信息集中到一个单点的管理平台中,从而可以快速进行故障定位。根源问题定位随着企业业务的快速发展,it环境越来越复杂,it组件越来越多,同时各组件之间的关联关系也纷乱和复杂。业务服务管理能够提供有效的根源问题定位能力,它着眼于企业的业务系统,通过集中与业务相关的it信息,根据业务逻辑和it组件之间的关联关系进行建模,企业可以在业务模型中的任何一点进行快速的根源问题分析和定位,---提高了解决问题的速度和准确度。故障影响范围评估当我们发现it故障时,我们不仅应该关注故障本身,更应该考虑该故障对业务系统的影响。通过建立业务服务影响拓扑,可以快速的了解企业的关键性业务及业务故障时的影响范围,通过了解企业具体的业务环境,优先处理关键故障点。
教据中心建设作为一种战略投入基本上已经形成共识,但是在巨额的投入后仍面临着种种问题与风险,面临着数据量急速膨胀,场地---不足,运营成本高昂、能耗大、安垒性差,业务连续能力低等一系列挑战。
那么在数据中心运维管理工作中到底存在哪些问题呢?
(1)运维人员不了解数据中心运维管理系统规划情况主要工作局现在对设备的维护上;
(2)简单的依照标准确定运维内容,包括一些不重要、无关紧要和不对的指标;
(3)机房环境指标指示不正常(温度、湿度、正压等),不知道如何改变制冷设备设置,使系统运行达到---状态;
(4)供电系统异常(接地、零地电压、干扰、it设备异常)时,只知道在供电设备上查找原因,而---*终不能解决问题;
(5)管理界限不清楚,只维护部分基础设施设备,忽略或不维护发电机和空调室外机等;
(6)只维护关键设备,对发电机、电池、配电、线缆长时间不做维护;
(7)设施文档不*或不正确;
(8)发生事故时简单地归结为设备问题,不愿也无法找出引发事故的*原因,以至于故障*后再发生故障,或诱发其他环节故障。
(9)对设备和系统的智能监控管理功能不熟悉,已有的智能管理功能不能得到充分的利用。
(10)无专门维护人员配制,或维护人员不符合标准;
(11)管理制度不健全,缺乏维护操作流程,无严格的交---制度。
集中人员从事解决方案的研究,营造知识共享的文化氛围
组织能力较强的---从事解决方案研究:实施it运维服务管理系统和流程优化后,运维---可以通过参考知识库中的解决方案进行问题处理。
可以适当降低对一般运维---的能力和数量的要求。这样,就可以组织能力较强的---专门从事解决方案的研究,既充分发挥了高素质---的价值,又通过合理分工提高了运维工作效率。
首先是基础知识:
1、电力知识。一般来说需要具备110以下的供配电知识,中压知识知道个皮毛就行了,低压要掌握的透一点。具体涉及的设备就是变压器、配电系统、ups/高压直流、发电机、精密列头柜、pdu等设备原理、维护方法、故障处理等。再往后学学开关电源、服务器供电(皮毛)啥的。
2、暖通知识。暖通需要全的知识,直膨、水、自然新风、间接新风,各种制冷方式均应有所了解。
重点是水系统,冷机冷塔、泵、阀、末端、这些都要深入掌握原理、维护方式、故障处理等。以及发电机的供油系统,室内空气、腐蚀、颗粒、新风等知识。
3、弱电知识。弱电需要综合布线全知识。光纤、绞线的等级、应用范围、成本,测试方法。扎线
4、监控系统。这个也要很全。系统的原理、系统的维护(数据备份、应用停启)。
5、消防系统。这个不用了解太深,读读消防系统设计规范、消防法啥的就行,有事情有专门的供应商可以搞定。