01.IT运维发展现状
科技不断变化的今天,互联网改变了众多企业的业务模式,越来越多的业务逐渐从线下转到线上,原本需要人与人面对面办理的业务,变成通过手机随时随地即可办理。所以现如今可以说,IT即业务的模式变化对IT运维管理提出了更大的挑战。
在业务与新技术的融合过程中,信息技术无疑起到了重要的作用。 目前IT应用已经渗透到各行业,不仅有效管理企业的人、财、物,而且在重塑企业价值链、创新商业模式中发挥重要的作用。随着IT应用的深入,企业的IT应用也日益复杂化继续使用传统的设备级运维管理方式管理IT则出现许多管理盲区,并引发多种问题。
用户体验无量化
IT 要掌握对用户提供的服务质量,了解用户体验
主动发现问题
80%的故障都是用户先发现,反馈给服务台后,运维人员才知道
责任难界定
系统不可用了,各部门、服务商都说不是我的问题
部门难以协同
出现故障往往会多部门关联,部门墙是IT改革的最大障碍
故障无法重现
10分钟前业务系统无法访问,没错误日志,没系统告警
02.运维新思路
健康五步走
IT运维部门如何改变被动运维的现状,nCompass方案通过网络数据及日志数据,对数据中心数据流进行智能分析,通过健康5步走的过程帮助运维部门实现主动运维。
看见:掌握用户体验,关键业务及链路状态。
学习:通过智能机器学习,呈现数据中心业务画像及性能基线。
定位:当问题发生时快速锁定故障域缩短问题处理时间。预警:智能隐患分析将隐患消灭在萌芽中,避免重大事故发生。
优化:为数据中心业务性能优化提供有力的数据支撑。
1.看见
用户体验分析
实时监控用户访问数据中心业务的可用性及性能情况。掌握实时用户数、访问量和成功率。了解用户分布,来自哪些地区及运营商。
关键业务状态呈现
基于数据中心业务流,清晰呈现全局关键业务状态及业务间逻辑关系,并可下钻查看某一业务端到端业务详情,实现业务层级可见。
网络链路分析
对关键链路及关键网络节点实现网络用量及网络质量管理。可视化链路流量,实时查看任一链路的Top应用、通信,链路异常时可快速定位链路中的异常通信。
2.学习
机器学习智能基线
基于采集分析的数据,通过机器学习算法,实时学习数据中心的运行现状。链路流量及质量状态、实时在线用户数、用户体验状态、业务响应状况等。
业务画像
端到端可视化的三个关键点
前端--用户访问我的用户体验如何?
自身--网络及应用的端到端各节点的运行状态如何?
后端--我依赖的后端服务的运行状态如何?
3.定位
通过算法实现故障精准定位
传统故障定位往往要对原始数据包进行分析,要从百万数据包中找到几个异常的数据包,对于拥有丰富经验的人也要花费30分钟到3小时甚至更长的时间找出故障原因。
nCompass通过内置指标,通过智能分析引擎快速定位故障原因,大大缩短处理时间。避免用户再下载数据包来进行分析,提高故障处理效率。
4.预警
通过算法及规则 提供隐患识别能力
海恩法则提到1次重大的发生,一定是由之前29次轻微事故、300次未遂先兆和1000次事故隐患累计而成。我们IT运维过程中往往都在处理这一次重大事故,而忽略了故障发生之前数据中心存在的隐患。
nCompass通过算法和规则快速识别数据中心存在的隐患事件,提前预警,做到事前处理。将隐患消灭在萌芽之中,减少、避免事故的发生。
5.优化
nCompass根据数据自动生成优化报告,分别从用户、链路、应用及业务四个纬度对数据中心进行分析,并给出综合评分,客户可以根据报告内容有针对性的对数据中心进行评估优化,持续提升运维管理水平。