运用AIOps策略、人工智能与大数据技术,结合新的IT管理模式与流程革新,云智慧重构了新一代数字化管控中心,能够提升企业的统一监控、故障处置、指挥调度和应急演练能力,提高业务支撑效能与水平。

管控中心是企业决策的大脑

通过数字化管控中心的可视化大屏,能够全面动态地展示数字化业务与IT系统的运行情况,进行系统资源的调度和管理。

企业管控中心应该具备:将业务核心指标和IT运行数据进行统一有效的集成与可视化呈现,清晰有效的对业务与IT系统运转状态进行监控,对关键问题和故障进行有效处置甚至自愈,支撑业务和IT的管理者进行科学决策的能力。

数字化管控中心的另一个核心作用是呈现IT的业务价值(BVIT:Business Value of IT)。在信息技术增值潜力飞速增长的数字时代,CIO需要一种合理的方法来展示IT价值,让业务部门认可IT的价值,进而解决“业务与IT”和“数据与价值”之间普遍存在的“双GAP”难题。

利用AIOps构建数字化企业管控中心

在企业数字化转型中,IT管理者们通常关注业务、技术、流程和人,要实现四个维度数据的统一管控,需要在系统层面对管理制度、指标体系进行构建与实施,搭建面向业务运维的统一管控平台。

这个平台应该侧重于对业务关键要素的健康感知及其与支撑IT的关系,它是业务和IT之间的数字桥梁,如图所示面向数字化运营与运维的统一管控中心的构建与落地方法论。

数字化企业管控中心落地构建与落地方法论

1、基于指标体系构建、梳理关注要素

指标体系是一整套具有内在业务与技术层级或关联关系的指标集合,这里的指标体系更侧重于从外部的业务和用户体验视角,建立自上而下的、具有逻辑串接关系的一系列数据关联集合,数据之间具有计算与内在联系。

运维数据指标管理体系的建设与实施需要考虑全局化,同时又是一个循序渐进的过程,主要工作包括立体化分层指标体系梳理、指标评价标准定义、指标健康度评估模型、体系的建立与系统化实施以及不断的持续改进优化。

2、注重AIOps与管理场景融合

面向业务与IT的新一代可视化管控平台,基于机器学习和大数据,帮助管理人员直观掌握IT运维与业务运营的有效信息,全面了解数字化运营状态,通过可视化管理与有效决策,提升资产管理与监控管理的效率,而智能运维相关技术应用的特点就是:实时性、预测性和决策性。

管控中心典型管理场景

按照用户场景对管控中心的产品模块进行分类,帮助CIO和运维主管、业务主管从业务健康、IT资源健康、用户体验、安全态势以及问题事件等多维度关心企业的IT运维和业务运营。

全方位的业务与IT管理维度

1、IT资源健康感知:面向不同的客户需求,对IT资源按照资源类型等不同维度进行分类与监控,能够满足以下应用场景的需求:

▪ 对数据中心、基础设施、网络质量等方面进行全面的监控与分析;

▪ 帮助管理者实时掌握IT资源的运行状态,及时掌握故障信息;

▪ 提高IT资源的稳定性和使用效率,提升企业的运维效率和水平;

▪ 提升用户体验,增强公司的运营能力。

数据中心实时监控

2、业务健康态势感知:以业务系统数据为基础,经过数据统计、加工与分析,用可视化大屏的方式进行展示,让管理者在第一时间、多维度了解业务的健康状态、运营能力,及时进行业务预警以及问题定位,提高业务稳定性以及业务运营能力。

实时业务指标看板

3、用户体验感知:基于拨测的用户体验监控、移动端真实用户体验监控以及浏览器端真实用户体验监控,帮助管理者了解用户行为与用户体验并从整体掌控应用的运营情况及增长动态,为决策提供依据。

基于拨测数据的用户体验感知监控

4、问题事件管控:以事件管理数据为基础,对业务、服务、基础设施等设备告警事件进行全局统一监控,监控结果以可视化事件墙的方式进行展示,实时、全面、全局展现业务和IT的运行状态,及时进行问题事件预警。

问题事件管控大屏

总结和展望

企业数字化管控中心与传统数据可视化有本质不同,数据可视化利用图表等视觉元素展现数据和理解数据,它注重“形式”,而面向业务分析的数字化管控中心包括端到端IT数据采集、基于算法的数据关联分析和可视化呈现,它更注重数据价值的挖掘与传递。

新一代数字化企业管控中心基于AIOps策略,融合高性能大数据引擎和智能分析算法,能够有效解决监控数据孤岛问题,实现运维数据的深度洞察,帮助管理人员全面掌控数字化业务的运行态势,直观触达业务运营与IT运维中的关键信息,实现业务运营与IT运维的有效管理与决策。