IT运维

有哪些常用的自动化运维工具?

2020-10-14 17:16:59 | 来源:中培企业IT培训网

随着信息时代的不断发展,IT运维已成为IT服务内涵的重要组成部分。运维已从最初的几台服务器发展成为一个庞大的数据中心。单靠人工已不能再满足技术,业务,管理等方面的要求,因此标准化,自动化,体系结构优化,流程优化和其他降低IT服务成本的因素引起了人们越来越多的关注。其中,对自动化运维进行了广泛的研究,并将其作为替代手动操作的起点。那么有哪些常用的自动化运维工具?

  有哪些常用的自动化运维工具?

  1、监控

  2、网络设备存活监控

对于SRE来说,需要监控程序是否正常;对于主机组来说,需要监控服务器硬件是否正常;对于网络来说,我们首先需要关心网络设备是否可达。当一台TOR不可达时,基本上预示着会有一片服务器不可达,业务的痛感是相当强烈的。

  3、设备日志监控

设备存活告警虽然可以预警很多异常,并且准确度很高,但是对于冗余性做得比较好的网络,能Ping通并不代表完全没问题,此时,细心的网络工程师会去看日志,这里可以反映出更多细节。对于万台服务器规模,网络设备的数量也就千台,但是逐台查看日志,人肉判断是否有异常,那简直是场噩梦。

  4、流量监控

高速公路铺得再好,也架不住车多人多。确保网络顺畅,品质优良,没有丢包,延时稳定也是网络工程师的职责 ,此时流量监控就成了刚需。

业务的飞速发展体现在网络层面就是DC内流量上涨/DCI流量上涨/IDC出口流量上涨/专线流量上涨,流量监控可以准确掌握业务的高峰和低谷,当线路需要扩容时,带宽使用率是老板参考的重要数据。一般情况下线路中的流量超过50%即可发起扩容,因为这意味着当备份链路down之后,主线路将出现拥塞。

5、接口error监控

接口的Error包监控和流量监控一样,均可以通过snmp采集,OID:ifOutErrors,ifInErrors , Error包出现增量会直接影响业务的服务质量,一旦发现需要优先处理,否则业务会拎着一堆TcpTimeOut指标找上门来。

  6、制造自动化运维工具

第一章中的组合拳打完之后,基本上不会出现“意料之外的故障”,所有的异常都应该有据可查,当SRE莫名其妙提出对网络环境的质疑时,你应该早已心中有谱。

但是网络工程师的工作并非只有救火,日常运维工作中,经常需要配合业务发展做一些线上变更/ 机房扩建/业务类故障排查等。作为一名“懒惰”的网络工程师,程序可以帮忙点什么忙呢?

  7、UserDevice Tracker

这个名词借用于Solarwinds套装中的一个组件,直译为“用户设备追踪器” , 在中小型企业网运维中,经常会有这样的需求:

· 知道服务器的IP,请问连接在交换机的哪个口?

· 知道交换机的某个端口,请问连接的服务器的IP是多少?

· 给你一台服务器的MAC地址,怎么知道在哪个交换机的哪个口?

大型互联网公司一般会有CMDB或者网络管理平台来记录这些信息, 但是如果你是一家中小型企业的网管,没有运维研发团队做支持,并且还在沿用二层的环境(服务器网关在核心设备),那就比较费劲了。以上几个问题其实归根到底是要捋清楚三个要素的对应关系:PORT<>MAC<>IP 。

  8、网络设备北向接口的二次封装

日常网络运维工作中,经常会有一些 “简单重复劳动”,例如:为某个接口划分Vlan/给某台设备添加一条指向主机的路由等, 这些操作既没有科技含量,还占用了工程师宝贵的时间,更要命的是再简单的人肉操作,重复的次数只要足够多,总有失误的时候,正所谓“常在河边走,哪有不湿鞋”,但是在这种问题上犯错误简直是对职业生涯的抹黑,如此“鸡肋”的工作怎么才能干得漂亮?

上述就是关于有哪些常用的自动化运维工具的全部内容介绍,想了解更多关于自动化运维的信息,请继续关注中培伟业。