过去几个月,优维在新的资源监控微应用相关能力的研发上投入大量的时间与精力。
上周三,优维专门召开了一场资源监控微应用发布会,介绍了优维的监控微应用的功能亮点和后续规划。
下面就跟着鹿小U一起来具体了解一下。
01
过去,接入资源监控的阻碍
首先来看看,过去在接入资源监控的时候,会遇到什么样的问题?
高 门 槛
过去,在做监控采集的时候,我们可能会经过如下的监控配置路径:
从上图可以看出,完成监控采集不仅步骤多,并且在使用路径上都是分离的,需要跳转不同的菜单才能完成一系列的采集。
这样长配置路径也暴露了不少问题:
用户路径不清晰:监控采集配置的时候,需要切换查看多个小产品,用户的使用路径不明确、配置成本高。 易用性差:虽然我们提供了通用的自定义采集能力,但易用性不足,有学习成本。 监控资源纳管成本高:采集监控指标之前,需要自定义采集监控资源,自定义采集和调试门槛高。
以上种种问题的存在,导致在做监控采集的时候,门槛会比较高,用户难以入门。
高 成 本
过去在做资源监控接入的时候,另一个问题是成本较高。
对于监控资源采集,首先从模型定义到资源发现,本身建设周期长,交付成本高。其次,资源的采集会影响监控数据的采集,没有标准模型建设,很难展开监控套件的建设;资源采集不正确或者采集不到,也会影响监控采集和视图查看。
再回到监控指标采集来看,Hub套件采集的成功率低,往往现场需要进一步调试采集脚本。其次是现有套件的资源覆盖率低,并且更新不及时。内置套件覆盖不到的资源,现场需要自定义脚本采集,采集适配难,验证困难,也进一步增加了采集成本。
以上这两个采集环节,直接导致采集成本较高,需要耗费大量精力去做采集配置、采集调试以及采集验证。
那么,针对高门槛和高成本这两大阻碍,优维开发的资源监控微应用如何来解决呢?
02
现在,资源监控微应用的优势
资源监控微应用的核心目标,是希望能够实现用户去自主接入,自主采集,免运维成本。
那怎么去降低用户的使用门槛呢?
过去,监控接入时,采集配置的操作路径相对分离,配置步骤也很多,如果用户对平台不熟悉是比较难入门的。现在,监控微应用按监控资源的维度进行配置操作和监控查看,需要监控哪个资源对象,直接找到资源对象对应的菜单,根据指引步骤,快速启用监控。
进一步降低监控接入成本
基于OneModel的资源纳管
基于OneModel去做资源的自动纳管,并且把资源自动发现作为启动监控的一环。只需要选择合适的方法,即可快速纳管到对应的资源。
内置采集套件,标准化采集
第二块是关于监控指标的采集,现在的资源监控应用全面内置监控套件,实现标准化采集。目前,我们丰富了内置监控套件,已拓展了60+个内置套件,覆盖核心资源对象,后续还会持续去拓展丰富套件资源。
过去,
在自定义采集的时候,会遇到采集不全面或者耗费时间较长; 自定义采集没有标准输出,不同项目之间重复建设。现在,
标准化套件采集 全面使用内置标准套件,避免自定义采集的不规范、不全面 核心监控场景覆盖 如何保证内置指标定义的质量?优维积累了银行证券等多行业的实践经验,同时结合内部专家和运营经验,定义了标准套件的内置指标,覆盖绝大多数的监控使用场景。 稳定的监控采集,免运维 如何保证指标采集的稳定性?搭建真实环境和使用实际云资源,展开测试和验收工作,模拟客户真实使用
目前,监控微应用覆盖的资源范围广,保证核心资源的全覆盖。
【云】私有云、腾讯云、阿里云 【服务域】数据库、逻辑、队列、接入、缓存 【资源域】网络、计算、存储、网络设备 【信创】宝兰德、TiDB、JBoss、BD2、HBase 【容器】Kubernetes、Docker
以上,基于OneModel去做资源纳管,通过内置监控套件,实现标准化采集;再内置立体化、场景化的监控视图的能力,减少监控启用的使用成本,让用户使用路径更加明确。我们都在同一资源下去完成,确保能够覆盖多个资源域、多个云等,从而达到一键启用,免运维的能力。
优维也致力于OneModel的建设。基于OneModel,监控微应用能做什么?
资源纳管:一键扫描,快速纳管,全新资源自动发现能力。 模型定义消费:基于OneModel,建设标准化的监控采集套件;基于OneModel,采集配置内填充默认配置。 监控展示:丰富监控信息展示,如服务的实例架构数据,主要来源于自动发现的关系字段。立体化、场景化的监控视图
过去采用的是通用的单资源的指标视图,信息展示有限。
现在,我们的监控微应用全面内置了监控视图,帮助用户摆脱通用视图的限制,从不同维度上展示监控数据。第二,深度消费资源依赖关系,支持资源下钻。第三,资源视图展示方式、展示数据更加丰富。
03
后续规划
结合客户使用需求,优维将进一步优化监控微应用的用户体验,以及对监控覆盖资源的进一步适配和拓展。
同时优维也将基于OneModel+监控微应用的能力,进一步打造上层消费场景,实现1+1>2的效果。包括如下场景:
打造告警分析视图,提升故障处理效率 结合日志、Tracing、拨测等数据,进一步打造服务全链路观测 基于资源关系和监控数据,进行故障根因辅助分析