
grafana
Datadogの代替として
Grafanaは、メトリクスの可視化、アラート、ダッシュボードのためのオープンソースプラットフォームです。データの保存場所を問わず、クエリ、可視化、アラート設定を行い、チームでダッシュボードを共有してデータ駆動のカルチャーを醸成できます。パネルプラグインによる多様な可視化方式に対応します。
- 柔軟な可視化 — クライアントサイドの高速グラフとパネルプラグインによる多様な表現
- ダイナミックダッシュボード — テンプレート変数でドロップダウン切替可能な再利用ダッシュボードを作成
- メトリクス探索 — アドホッククエリとドリルダウンでデータを探索、分割ビューで比較
- ログ探索 — メトリクスからログへラベルフィルター維持のまま切替、ライブストリーミングにも対応
- アラート — メトリクスにアラートルールを視覚的に定義、Slack等へ通知
- 複数データソース混在 — 同一グラフで異なるデータソースを混在、カスタムデータソースにも対応
Go + TypeScript製(AGPL-3.0ライセンス)。こんな人におすすめ: インフラやアプリケーションのメトリクスをリアルタイムで監視・可視化したいDevOps/SREチーム。Prometheusがメトリクス収集・アラートのコアエンジンであるのに対し、Grafanaはその可視化レイヤーとして複数データソースを統合するダッシュボード基盤です。導入のポイント: grafana.comからダウンロードまたはDockerで即座に起動でき、play.grafana.orgでデモを体験できます。
インストール・要件
docker run -d -p 3000:3000 --name=grafana grafana/grafana-enterprise
Docker が必要。公式 docs では `grafana/grafana-enterprise` イメージが推奨されており、エンタープライズライセンスなしで OSS と同等の機能で動作する(enterprise 機能を試したい場合のみライセンス追加が必要)。
こんな場面で使う
公式は「Full-stack observability with actually useful AI」を掲げ、Kubernetes クラスタ監視・アプリケーション性能監視・データベース性能追跡・合成監視・インシデント対応までを 1 つの UI で扱う。Microsoft、NVIDIA、Salesforce、BlackRock、Canva、DHL、Anthropic、Bloomberg 等のグローバル企業が公式サイトで顧客として明示されている。
情報源: grafana.com公式は「AI がダッシュボード作成・トラブルシュート・複雑なクエリ回答を支援」し、「adaptive data aggregation により telemetry コストを最大 80% 削減」を主張する。観測データ量増加に伴う運用コスト最適化用途で採用される。
情報源: grafana.com他ツールとの比較
- AGPL-3.0 OSS でセルフホスト可能。Datadog のホスト課金・APM 課金を回避できる
- 40+ のデータソース(Prometheus / Loki / Tempo / InfluxDB / Elasticsearch / CloudWatch 等)に対応
- パネルプラグイン / コミュニティダッシュボードが公式マーケットプレイスで公開されている
- Grafana Cloud によるマネージド版も提供され、セルフホストとマネージドを選択できる
- Datadog はフルマネージドで運用負荷なし。Grafana セルフホスト版はサーバー管理が必要
- Datadog は APM・ログ・トレース・セキュリティ監視・RUM 等の周辺機能がオール統合済み
- Datadog は 600+ のインテグレーションを標準提供し、エージェント導入のみで多くのミドルウェアを自動検知
- Prometheus 単体は「Multiple modes of graphing」とのみ言及される限定的なダッシュボード機能。Grafana は可視化レイヤーとして外部 UI を提供
- Prometheus 以外(Loki / Tempo / Elasticsearch / InfluxDB / Postgres / CloudWatch 等)も同一ダッシュボードで可視化
- パネルプラグインによる多彩な可視化形式(heatmap / geomap / table / stat 等)に対応
- Prometheus はメトリクス収集と PromQL によるクエリ評価、アラート発火のコアエンジン。Grafana は可視化に特化しメトリクス収集には別途エージェントが必要
- Prometheus は CNCF プロジェクトで Kubernetes 監視のデファクトスタックを構成
- Prometheus はサーバー単体で完結し、分散ストレージ依存なしで動作
- GitHub stars 73,050(SigNoz 26,432)で開発者コミュニティ規模が大きい
- 40+ データソース対応で、既存の Prometheus / Elasticsearch 等の観測スタックをそのまま活用可能
- パネルプラグイン / コミュニティダッシュボードを公式マーケットプレイス(grafana.com/grafana/dashboards)から流用可能
- SigNoz はログ・メトリクス・トレースを ClickHouse でワンストップ管理し、データストア選定が不要
- SigNoz は OpenTelemetry ネイティブで APM 機能(p99 latency / error rate / Apdex)を標準同梱
- SigNoz は分散トレーシングの Flamegraph / Gantt Chart 表示を標準提供
日本語情報
公式日本語ドキュメントは未提供だが、Qiita では「grafana」タグ付き記事が 700件以上蓄積されている。Zenn でも 2026 年に AI テレメトリー観測や Loki / Alloy 連携、アラート設計といった実運用事例の投稿が継続している。
採用企業(公式 Customers より)
このツールについてよくある質問
- Grafana Cloud と self-hosted OSS のどちらを選ぶか、判断軸は?
- 判断軸は次の 3 つに分けられる。コンプライアンス要件(公式が掲げる FedRAMP / SOC Type II / PCI DSS / GDPR 等の認証が必要な業務 → Cloud、自社の認証スコープで対応できる → OSS)。運用人員リソース(観測スタックを自社運用する DevOps 体制が組めない場合 → Cloud、組める場合は選択肢としての OSS)。データ規模(自前でストレージのスケーリング設計を行う必要が出る規模になった場合 → Cloud のマネージドスケーリング)。`grafana-enterprise` Docker イメージは OSS と同等で動作しつつ Cloud 機能の試用も可能な中間選択肢として位置付けられる。 情報源: grafana.com
- データソース(Prometheus / Loki / Tempo)はどう使い分けるか?
- 公式 docs は観測データの種別でカテゴリを分けている。メトリクス(時系列の数値データ)は Prometheus(CNCF プロジェクト、PromQL でクエリ)。ログは Loki(公式 README が「Prometheus-like label-based queries」と説明する、Prometheus と同じラベル体系でログを集約)。分散トレーシング(マイクロサービス間のリクエスト追跡)は Tempo(公式 docs が「trace-to-logs / trace-to-metrics / trace-to-profiles links」の組み込み設定を持つことを記載、Jaeger / Zipkin 互換)。1 つの Grafana ダッシュボードでこれらを混在させ、パネル単位で切り替える運用が前提となる。 情報源: grafana.com
導入時の注意点
- AGPL-3.0 ライセンスのため、Grafana 本体を改変してネットワーク経由でユーザーにサービス提供する場合、ソースコード開示義務が発生する。社内利用や非改変での組み込みなら影響は限定的だが、Grafana を組み込んだ SaaS を提供する場合は事前にライセンス影響を確認する必要がある。情報源: github.com