SREが信頼するElasticsearch Platform上に構築されたメトリクス監視

Elasticは、業界最高水準のメトリクス効率と、業界で最も豊富なログ分析ソリューションを兼ね備えています。競合するTSDBよりも30倍高速なクエリを実現し、高カーディナリティワークロード向けに設計されたカラム型データストアを基盤とし、コストを抑えながら拡張可能です。ネイティブPromQLに対応しているため、使い慣れたワークフローをそのまま利用できます。

クラス最高のカラム型メトリクスエンジンをご紹介

Elasticsearchのカラム型データストアは、あらゆる規模において、メトリクスの取り込み、ストレージ、クエリ速度の点で他のデータストアを凌駕します。

データを失わずにスケールする

ログの取り込み、保存、クエリ性能の基準を確立した高度なエンジニアリング技術を高カーディナリティのメトリクスに対応するより優れたTSDBの構築にそのまま適用しました。同じチーム、同じ厳密さ、そして新しいデータタイプで、コストを抑えながらあらゆるメトリクスをフル解像度で保持できるように構築されています。

  • 最高水準の効率

    より高速なクエリをはるかに低いコストで実現

    ElasticsearchはPrometheusの25倍の速さでクエリを実行し、基数の制限なしでメトリクスを2.5倍無駄なく保存します。現在の取り込みアーキテクチャを維持し、より多くの履歴を保持し、同等のPrometheusスタックよりも少ない費用で済みます。

  • スキーマ非依存型

    1つのデータストアであらゆるフォーマットに対応

    ほとんどのバックエンドはすべてを単一のスキーマに正規化します。しかし、Elasticsearchは違います。Prometheus、OpenTelemetry、Beats、OCSFのどれを送信しても、Elasticsearchはそれぞれのネイティブフォーマットで保存し、そのままクエリを実行します。変換レイヤーもなく、情報の損失もなく、変換コストもかかりません。

  • 移行は1日で完了

    初日からPromQLを使用

    既存のPromQLクエリ、ダッシュボード、アラートルールは、新しい言語を習得する必要なくそのまま引き継がれます。リモート書き込みとOTLP取り込みの両方に対応しています。移行は設定変更のみで済み、1か月もかかるような大掛かりなプロジェクトではありません。

  • ログ + メトリクス + トレース

    統合された調査 — コンテキストの切り替えは不要

    一般的なオブザーバビリティスタックでは、根本原因の特定のために複数のクエリ言語やバックエンドの操作が必要になることがよくあります。一方、Elasticsearchでは、メトリクス、ログ、トレースがすべて一箇所に集約されています。アラートが発生した時点で関連するコンテキストがすでに存在しているのです。

Elasticsearchは行をスキャンしません。列を読み取ります。

Elasticsearchのセグメントベースのストレージは設計上カラム型であり、ベクトルロードと処理により、数百万件の時系列データに対して1秒未満の応答速度を実現します。

  • 高カーディナリティであらゆるデータにクエリ

    ES|QLは、この利点を最大限に活用するために設計されています。ベクトル化されたクエリエンジンは、データをバッチ処理し、高カーディナリティでもパフォーマンスが低下しません。ネイティブのPromQLサポートも含まれ、メトリクス、ログ、トレース間でクエリをパイプ処理できます。

  • すべてのバイトを最大限に活用

    レート、デルタ、パーセンタイル、時間バケット化、アグリゲーションなど、時系列分析に必要なあらゆる機能に加え、ドキュメント値のスキップ機能やSynthetics IDのトリミング機能によりストレージ容量を節約できるため、コストを抑えつつ、より深い分析が可能です。

  • すでに作業しているあらゆる場所からアクセス可能

    ほとんどのバックエンドはアクセス手段が1つしかありませんが、Elasticsearchは3つのアクセス手段を提供します。ダッシュボードと事前構築済みのワークフローを提供するKibana、チャット主導の調査を行うElastic AI Agent、そしてチームがすでに利用しているAIツール専用のMCPアプリとスキルです。

Elasticsearch 9.4ベンチマーク

数字に表れるエンジニアリング

本番環境レベルのTSDBを定義する3つの指標(クエリ速度、ストレージ密度、取り込みスループット)で直接比較

ディメンション Elasticsearch 9.4 Prometheus Mimir ClickHouse
クエリ速度高カーディナリティ時系列 最速
ベースライン
最大30倍遅い 最大30倍遅い 最大8倍遅い
ストレージ密度バイト/サンプル 最高
3.74B
〜9.42 B ~3.95B 〜6.8B
取り込みスループットサンプル/秒 最速
428K/秒
402K/秒 404K/秒 〜300K/秒
ネイティブPromQLアダプター不要 ネイティブ ✓ ネイティブ ✓ ネイティブ アダプターが必要です
OTel-nativeスキーマ変換なし OTelファースト エクスポートツール経由 エクスポートツール経由 手動マッピング

列指向型メトリクスエンジンとしてのElasticsearch

それを可能にしたイノベーション

ストレージアーキテクチャからクエリ実行に至るまで、当社のプラットフォームの各部分は明確な目的を持って構築されています。これを実現したエンジニアリングをご紹介します。

移行ツール — テクニカルプレビュー

DatadogやGrafanaから一晩で移行

DatadogやGrafanaのダッシュボードとアラートルールをElasticに自動的に変換することで、プラットフォーム切り替えのコストと複雑さを大幅に削減します。

Datadogのメトリクス料金を50%節約するために切り替える準備はできていますか?

ElasticへのPrometheusメトリックのシッピングを開始

Prometheus Remote Writeエンドポイントに追加の設定は不要です。メトリクスが流れ始めたら、組み込まれたPROMQL関数を使用してES|QLでクエリを実行し、PromQLとの互換性を確保するか、ネイティブのES|QLクエリを作成して同じストア内のログやトレースとメトリクスを結合できます。

メトリクスを行動に変える

インフラストラクチャを大規模に監視します。Discoverで指標を調べたり、コードとしてダッシュボードを構築したり、AI主導の調査で異常を浮き彫りにしたり、傾向を明らかにしたり、修復を自動化したりすることで、キャパシティプランニングや問題解決を迅速に行うことができます。