作者:Bahubali Shetti
当今世界,我们的生活很大程度上由应用程序控制。 无论是用于商业用途还是个人用途,我们都希望这些应用程序 “始终在线” 并能够立即做出响应。 这些高期望对开发人员和运营人员提出了巨大的要求。
管理这些应用程序需要 SRE (Site Reliability Engineer - 网站可靠性工程师)不仅要分析来自应用程序的大量数据,还要分析其运行的基础架构中的大量数据。 此外,SRE 确保在其操作流程中使用(或构建)适当的工具。 因此,管理呈指数级增长的数据、解决日常问题以及不断使用工具和操作流程会留出有限的时间来了解业务绩效。
借助 Elastic Observability,SRE 不仅可以整合和分析所有遥测数据,还可以结合业务数据来帮助推动卓越运营、提高生产力并获得有价值的见解。
Elastic Observability 建立在 Elastic Stack 之上,Elastic Stack 是一种经过验证的基于搜索的解决方案,被全球客户用于任务关键型应用程序。 Elastic Observability 利用 10 年的机器学习 (ML) 开发经验,帮助 SRE 在一个解决方案中跨云原生和分布式系统进行监控、聚合和洞察。 Elastic Observability 大规模管理高基数和高维度数据,以帮助打破孤岛并将应用程序、基础设施和用户遥测数据汇集在一起,以在单个平台上实现端到端的可观察性。
作为一个单一的平台,Elastic 帮助 SRE 关联无限的遥测数据,包括指标、日志和跟踪,利用搜索的力量打破孤岛并将数据转化为洞察力。 作为一个全栈可观察性解决方案,从基础设施监控到日志监控和应用程序性能监控 (APM) 的一切都可以在单一、统一的体验中找到。
Elastic Observability 提供对 AWS、Microsoft Azure 和 Google Cloud 等云环境的可见性,以及为无缝数据摄取而构建的集成。 Elastic 可观察性还支持云原生和微服务技术,如 Kubernetes 和无服务器,以确保采用。 凭借其开源根源,Elastic 支持最新和流行的开源项目,如 OpenTelemetry,它正在标准化可观察性摄取。
Elastic Stack 的强大功能和灵活性使 SRE 能够全面了解从应用程序到基础设施的全貌,同时还能帮助他们管理业务绩效。
作为 SRE,你必须通过从多个位置收集的遥测数据来管理复杂的分布式环境:业务洞察力、应用程序(前端和后端组件)、基础设施,甚至 DevOps 工具。
虽然获取数据很重要,但真正需要回答的是具体的运营问题,例如:客户体验是否下降? 应用程序的吞吐量、延迟等是多少? 我的基础设施优化了吗? 我们花钱太多了吗? 开发流水线是否优化? 可观察性遥测数据可以帮助回答这些问题等等。
Elastic 提供以下功能来帮助从多个位置提取和聚合数据,包括业务洞察力:
这些功能与 Elastic Observability 的搜索、机器学习和分析相结合,将帮助 SRE 查明并找到我们之前提到的问题的答案。 然而,了解总体运营绩效(例如你的趋势如何、你的运营效率是否高以及是否达到业务目标)更难获得甚至完成。 SRE 没有时间,也无法轻松地聚合、合并遥测数据并将其与业务洞察相关联,以提供完整的运营图景。
为了应对这一挑战,Elastic 发布了 SLO/SLI (Sevice Level Objective/Sevice Level Indicator)监控功能,以帮助 SRE 管理和洞察业务绩效。
Elastic 的新 SLO 功能将帮助您:
Elastic 的 SLO 功能处于测试阶段,因此请联系你的销售代表以获取访问权限。
卓越运营应考虑的另一个目标是成本。 Elastic 可观察性可以通过其时间序列数据库 (TSDB) 帮助实现成本效益。 虽然 Elastic 的 TSDB 不仅有助于提供跨指标、日志和跟踪的单一视图,以及通过分析获得更好的洞察力,它还通过缩减采样和降低遥测数据的存储成本来提高存储效率。 Elastic 不仅收集和聚合大量遥测数据,而且还极其高效地存储这些数据,以改进和实现你的运营成本指标。
最终,你希望提高工作效率并减少开心时光的平均等待时间 (mean time to happy hour - MTTH) 。 你想专注于产品和运营 —— 问题总是,怎么做?
基本上,SRE 可以使用多种工具。 团队通常有简单或复杂的警报,使用仪表板来帮助可视化和聚合数据(并不断更改这些以满足他们的需要),并利用机制来发现和简单地分析他们的数据。
然而,这些当前的基线方法已经足够了。 它们并不总能帮助您管理两个主要的 SRE 问题:
Elastic 可观察性超越了基础知识,可帮助你提高可预测性和减少 MTTx。 这两个高级功能是:
Elastic 不仅为您提供收集的数据,还提供额外的上下文信息。 几个例子:
集成的完整堆栈视图 - 提供结合基础设施遥测查看应用程序遥测的能力。 在 Elastic APM 中,在分析 trace 时,你不仅可以看到特定于 trace 的指标和日志,还可以看到相关的 Kubernetes pod/container 指标和日志。
可行的见解 - 当警报发生时,你只会收到一条简单的消息,然后发现过程就会开始。 Elastic 最近发布了一项功能,可以提供额外的上下文以减少手动发现的需要。 你可能会在一个位置获得所有正确的诊断信息。
集成和自动化的关联和异常检测 - Elastic 已将 ML 的输出集成到多种功能中,因此你无需运行即可查看分析。 例如,你可以在 APM 中查看每个服务的异常检测。 或者单击一个按钮并查看 APM 中跟踪分布的延迟相关性。
Elastic 凭借其在机器学习领域 10 年的发展,不仅允许你使用自己的模型,而且它是真正为你工作而构建的。 以下是 Elastic Observability 使用内置机器学习模型的开箱即用功能的几个示例,包括数据帧分析和自然语言处理 (NLP):
这些功能都是预构建的一键式功能,无需了解 ML,因为我们在 ML 功能中拥有的建模、数据框分析和 NLP 有助于支持这些基于 ML 的功能。 这些基于 ML 的功能通过减少查找根本原因分析的时间来支持日志分析、APM 和基础设施遥测数据。
Elastic Observability 的上下文数据特征和 AIOps 特征的结合将帮助你作为 SRE 提高可预测性并减少 MTTx(无论是平均修复时间、响应时间还是故障时间)。 作为 SRE,你的最终目标是专注于改善你的业务和生产力,而这两个关键能力将帮助你实现这一目标。
凭借在开源领域的深厚历史,Elastic 不仅不断增加对开源项目的支持,而且 Elastic 还不断创新,使你能够在我们的开放平台中引入自己的数据并根据需要进行分析。
持续的开源支持:
Elastic 对开源的持续支持现在包括(但不限于):
弹性通用架构:
Elastic 提供通过 Elastic Common Schema (ECS) 引入数据模型的能力。 ECS 是一种开源规范,它为引入 Elasticsearch 的数据定义了一组通用的文档字段。 ECS 让你可以灵活地收集、存储和可视化任何数据。 这包括来自你的应用程序和基础架构的指标、日志、跟踪、内容和事件。
ECS 旨在支持统一的数据建模,使你能够使用交互式和自动化技术集中分析来自不同来源的数据。 ECS 既提供了专门构建的分类法的可预测性,又提供了适应自定义用例的包容性规范的多功能性。 ECS 允许你规范化事件数据,以便你可以更好地分析、可视化和关联 Elastic 中表示的数据。
此 ECS 有助于最大限度地减少修改或 ETL 数据以将其引入 Elastic 的需要。 这大大减少了你修改流程和现有工具的需要,而不是仅仅将数据发送到 Elastic。
我们相信,这种对开源项目以及自定义数据和模型支持的持续支持使 Elastic 可观察性能够顺利集成到你的操作流程中,而无需修改它以适应供应商提供的内容。
自定义机器学习模型:
Elastic Observability 的机器学习,除了本博客前面讨论的预建开箱即用功能外,还提供:
通过支持最流行和最常用的开源 ML 框架,Elastic Observability 是内部拥有高级机器学习团队的组织的首选平台。 这些组织投入了大量时间和金钱来开发自己的模型,以帮助分析数据并针对他们的需求和日常运营开发定制的见解。 借助 Elastic 的机器学习,你可以轻松地将这些自定义模型添加到 Elastic Observability 中。
以下是使用公开可用模型的两个示例:
虽然对可观察性的需求显而易见,但更大的挑战是为今天和明天找到合适的平台。 虽然开箱即用的可观察性功能很重要,但定制和构建长期为你的组织服务的平台的能力有时会被忽视。 鉴于组织通常在其本地和云环境中拥有独特的数字足迹,因此随着时间的推移适应和发展的灵活性对于任何企业可观察性解决方案都至关重要。
可观察性的核心是统一你的可观察性数据,然后对您的应用程序和系统的性能进行实时和历史洞察,其总体目标是建立卓越运营,从而带来更强大、更稳健的客户体验。
Elastic 可观察性通过在为开放数据和闪电般快速分析而构建的平台之上提供高级 AIOps 和机器学习,为你的未来做好准备。 当今现代应用程序的复杂、分布式特性需要始终在线(并生成 TB 级遥测数据),需要可观察性来为您的未来提供灵活性和强大功能。
正如我们在上面展示的那样,Elastic 的强大功能和灵活性使你能够全面了解从应用程序到基础设施的情况,同时还可以帮助他们管理业务绩效。 希望你已经了解 Elastic 如何提供帮助:
你在等什么? 试用 Elastic Cloud 并注册一个帐户,看看 Elastic Observability 的使用和集成是多么容易和简单。
原文:An observability solution for today’s “always-on” world | Elastic Blog
本文发布于:2024-02-02 00:48:12,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170681130640306.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |