让vmware世界纤毫毕现——vROPs 初体验

1 背景

vROPs是Vmware开发的,面向IT管理员的,集监控、分析、告警等多功能合一的管理平台。

它功能强大,不仅能整合运维自家的多个产品,如vSphere、vSAN、NSX等等,还有不少软硬件厂商能和它集成交互,可以称得上是运维利器。

在Horizon8之前,购买Horizon,会送vROPs这款产品。但有趣的是,有的最终用户似乎对它不太感冒,项目实施时装好了vROPs就放在那了,并没有真正使用起来,日常运维还是习惯在Horizon等软件里面去做。这样不免浪费了它的功能。

最近刚好在学习这款软件,记录一下自己的初步心得。

2 产品优势

image-20210420202929050

我认为它核心的竞争力有:

  1. 对Vmware自家产品的各种对象、属性、衡量指标等等各种元素的精细操作能力。
  2. 基于上述能力提供的高自由度定制功能,包括Dashboard、Alerts等。
  3. 对常见运维场景的便捷与人性化的操作。

Vmware对其的定义为智能操作管理,另一个运维软件——Log Insight专注于Log的集中分析,可以和vROPs集成协同工作。

3 术语

这个产品中的的概念,常常在中文里有不同的近义词可对应。为了避免混淆,先放一个表,这是产品本身在不同浏览器语言下的呈现。

英文中文备注
vROPsVMware vRealize Operations Suite标准发音vee-rops,参考链接
Metric衡量指标
View视图
Dashboard仪表板
Widget小组件类似手机桌面的小组件
Alert警示
Symptom症状

4 功能运用

产品功能很多,从传统自建数据机房运维角度,最关注的还是监控(Monitoring)与故障排除(Trouble Shooting)。

4.1 Monitor(管理员主动)

VROPs可以让你很方便地定制各种Dashboard,实现信息的快速调取。

image-20210425093539864

观看时可以实现交互效果。比如,创设一个Dashboard中的第一个Widget是一个列表,它列出了环境中的多个DataCenter。其它Widget是展示某些性能趋势等信息的。那么,你想看哪个DataCenter就点哪个,Performance信息会随着选择自动刷新更改,非常方便。

最终结果是要绘制Dashboard。

一般要先做View(视图),再做Dashboard(仪表盘)。

以下引用部分来自官方培训教材。

View

A view is the smallest component of a dashboard or a report.

A view is a visualization of data that helps you interpret the metrics, properties, and policies of a given object.

Views help you perform the following tasks:

• Diagnosing and troubleshooting issues

• Gathering information about your environment

View是基础的属性/衡量指标的第一次可视化提炼了。典型的例子是资产统计表。你关注哪些属性、指标,就选择哪些,并且可以充分地定义展示效果、过滤器等。

列表只是View的一种类型。其它类型如下图。

image-20210425100530240

Dashboards

Dashboards provide a graphic representation of data and display the overall infrastructure health

我们可以像搭积木一样,从Properties、Metrics、Views等元素中选择自己需要的信息,绘制Dashboard。通常,在创建Dashboard的时候是通过拖拽List到画布中的方式来实现的。

下图中,每个小图表都是View,左边的是List类型的View。右边则是Trend(趋势)类型。

image-20210425101000204

可以猜想到,这个Dashboard将实现的效果是:在左边任意点选一个VM,右边就展示它的Performance和Utilization信息。

系统中还有几种常见的小组件可以选用。如下图就是“热图”控件的效果。

image-20210425101853377

TIP

View和Dashboard都是可复用的资产,可以从一个vROPs环境导出到另一个。

4.2 Alerts

这是系统自己通过实时计算分析各种属性、Metrics,当发现符合症状定义时触发的信息。

The alerts are generated when the symptoms in the alert definition are triggered. The symptoms is triggered when the objects in your environment do not operate within the parameters you defined as acceptable.

Forexample,avirtual machine memory workload is at immediate level symptom is triggered when the Virtual Machine: Memory|Workload (%) metric is greater than 90%.

这是一个需要基于业务运行状态精细调整、定制的部分。Alerts过多会造成使得信息有效性下降,从而增加错过重要的信息的机率。

在vROPs里面,可设置的内容的精度和粒度比vSphere中要更多。

image-20210425103501657

系统中,可以看到Alerts有以下几类。

  • 衡量指标,大于数字;逻辑关系+值;True/False
  • 消息类:有运算符:包含,匹配
  • 故障类:无运算符,一种事件发生
  • 衡量指标事件:大于硬阈值

4.3 Trouble Shooting

便于快速浏览一个对象的上下文环境中的各个关联对象,检查是否有告警。并且可以快速切换关注对象目标。

系统还能自动列出多项与某一种现象有关的其它关联现象,叫做潜在证据,以辅助分析。如下图。

image-20210425091708430

举个例子,在VDI环境中,可能会发生启动风暴,那么一个桌面VM的读写性能受到影响,Performance下降,当符合Symptom定义的时候——如Latency > 20ms——就会触发Alert当。管理员看到Alert,点进去Touble-shoot这台VM时,会发现系统已经把这段时间前后的多个可能相关的事件、指示变化情况罗列好了,比如告警是否增多,从什么时候开始增多的,IOPS、网络流量等趋势图表等。

4.4 其它

4.4.1 Reports的配置与导出

基于View或者Dashboard创建报告,通过邮件等方式自动发出,可设置计划任务。

报告中可自定义一些样式如Logo等。可选择导出为PDF、CSV两种格式。(当条目较多的时候,PDF的格式不是很美观。)

4.4.2 Optimaziton

根据商业意图来迁移负载,自动调整不同ESXi Host中运行的Vm的数量。(vSphere需要打开 DRS迁移。)

常见的意图有:

  • 尽量在指定数量的主机中均分负载。
  • 尽量用最少的主机承担负载,以空出主机。

4.4.3 容量计算、What-if

新项目上线工作负载评估。

当前运行状态系统资源还能支撑多久。

部分业务迁移到公有云对运行成本有何影响等。

4.4.4 服务发现

内置多种标准服务类型,可发现环境中运行着的实例:如AD、IIS、SQL等。

可对被发现的主机远程执行命令,运行Script等。

可自定义服务进行监控,如NTP。

5 资源

可在marketplace.cloud.vmware.com中搜索管理包(Management Pack),与现有环境集成。这样可以识别到其它软硬件品牌特有的Metrics、Views、Dashboard等,从而使运维进一步集中。

此条目发表在IT技术分类目录,贴了, , 标签。将固定链接加入收藏夹。

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注