更多数据可以带来更好的预测
尽管是IT运营使其他企业AI计划保持平稳运行,但实施AI以改善其自身的运营速度却很慢。原因之一是上述数据零散。当向AI / ML模型提供部分数据时,您只会获得企业的部分视图。另一个主要原因是因为当前大多数AI / ML实施都是为了创新,并且通常由BU资助。传统上,企业将IT视为成本中心,因此他们不愿意花钱来使用AI来改善运营。但是,随着大量的数据,以及当前的大流行病产生了更多的未连接的远程数据,这种感觉在开始淹没Ops团队时发生了变化。 IT运营团队正在达到一个临界点,要处理的数据过多,这是AI的理想方案。这是AI和ML的最佳选择。人工智能在大量数据上蓬勃发展。实际上,向AI算法馈送的数据越多,模型就越好。
传统上,IT运营团队多年来一直监视IT基础结构监视(ITIM)和网络性能监视与诊断(NPMD)层。在过去的十年中,应用程序性能管理(APM)帮助提高了每个应用程序的可见性。但是,即使所有这些系统都表明它们正常工作,客户仍然会根据位置,连接类型(移动/互联网),所使用的缓存/ CDN提供程序的类型等而遇到问题。现代应用程序及其组件的复杂性加载到客户视图中会使其变得非常复杂。数字体验监视(DEM)的概念已获得可见性,可以专门监视,分析和优化客户体验。但是,它们更像是监视工具,而不是诊断工具。
AIOps(IT运营中的人工智能)解决方案可以帮助解决此问题。一个好的AIOps解决方案应该能够从多个来源获取数据,消除噪声,关联事件序列并基于历史数据和实时数据的组合产生可行的见解。
数据采集
可以说,这是最重要的一步。不仅需要将历史数据馈送给AI进行模型创建,而且还需要将实时数据馈给AI进行推理和更新模型。仅像过去那样收集日志或SNMP并不能提供企业的全面情况。收集尽可能多的信息,包括事件,日志,时间序列数据,应用程序数据,性能数据,利用率数据等。新的基于事件的范式转移到发布/订阅或基于事件的消息传递。尽管这些消息非常重要,但它们对于收集实时数据以提供企业的完整视图并做出准确的预测绝对至关重要。大多数基于云的系统,无论是基于容器的还是基于虚拟机的,都通过API提供大量信息。还应包括IoT设备的时间序列数据以及几乎所有硬件设备的容量和性能指标。
收集结构化,半结构化和非结构化数据。尽管现有的BI和分析系统在处理非结构化数据时遇到困难,但AI还是喜欢它。它可以解析几乎所有内容,包括音频,视频,文本文件,图像,配置文件,文档,PDF文件等。
最后,大多数团队忘记将配置记录,变更管理系统,CMBD等作为等式的一部分。这对于每天有时会推动多个发布周期的敏捷团队尤其重要。除非IT运营团队意识到最近的变化,否则他们将浪费大量时间试图找出问题的根本原因。
数据质量和数据摄取
AI存在数据质量问题。创建AI / ML模型时,“垃圾填埋,垃圾填埋”是非常正确的。您的算法有多好或数据科学家有多好都无关紧要;如果您没有提供足够的质量数据,那么您将一无所获。当企业收集大量数据时,它仍然是不完整,不正确和/或不一致的。您还需要收集相邻和相关的数据。您可能会认为它们无关紧要,但是对于AI使用看似无关的数据所能找到的东西,您会感到惊讶。一个例子是,当NASA卫星破裂时,IBM的AI工程师和NASA科学家找到了一种方法,可以利用太阳光以98%的准确度来计算紫外线强度。我最近写了一篇文章,可以在这里看到。
如果您与数据科学家交谈,他们会告诉您他们花了多少时间准备数据。他们多达80%的时间用于准备数据,而不是分析数据或创建和微调模型。
数据分类和标签
数据需要正确分类,分类和标记,以便AI / ML从中学习。对于监督学习模型尤其如此。在训练,验证和调整模型之前,这是重要的一步。标签的准确性和质量是最重要的两件事。准确性衡量的是标签与真实情况之间的接近程度,或与您的企业事实和/或实际条件匹配的程度。质量与用于模型的整个数据集的标注准确性有关。当您结合使用自动,外包和内部标签工作时,尤其如此。所有组都会在整个数据集中一致地标记吗?
数据仓库
鉴于数据的数量、速度和多样性,传统的数据存储和数据管理现场解决方案不适用于数字原生解决方案。许多公司已经求助于数据湖解决方案来处理这个问题。尽管单一的集中式数据源可能有所帮助,但它需要得到适当的保护、管理和定期更新。它应该能够无缝处理结构化和非结构化数据。
结论
人工智能需要大量的数据。约翰尼#5(人工智能机器人)短路会说,“我需要更多的投入……”如果你的主管要在此基础上做出重大的企业决策,确保你给人工智能提供了正确数量和质量的数据。如果不是,他们会忽略你的模型输出/建议,自己做决定,从而最小化你的价值,最终你将获得数字化和改善你的业务的资金。