オブザーバビリティ学習コンテンツ
概要
SaaSアプリケーションにおけるオブザーバビリティ(Observability) の設計原則・実践パターンを体系的に学ぶコンテンツ集です。
本カテゴリの題材: IDサービス
各記事ではIDサービスを題材にした具体例を多く使用しています。IDサービスとは、ユーザーの認証(本人確認)・認可(アクセス制御)・ユーザー管理を一元的に提供するSaaS基盤です。
オブザーバビリティの3本柱:
ログ (Logs) メトリクス (Metrics) トレース (Traces)
┌──────────┐ ┌──────────┐ ┌──────────┐
│ 個別の │ │ 集計された│ │ リクエスト│
│ イベント │ │ 数値データ│ │ の経路 │
│ 記録 │ │ │ │ 追跡 │
└─────┬────┘ └─────┬────┘ └─────┬────┘
│ │ │
└───────────┬───────┘───────────────────────┘
│
┌─────▼─────┐
│ 統合分析 │
│ ダッシュ │
│ ボード │
└───────────┘
問題の検出 → 原因の特定 → 影響範囲の把握
記事中に構造化ログ設計、メトリクス命名規則、分散トレーシングといったオブザーバビリティ領域の例が登場しますが、設計原則やパターン自体はEC、CRM、プロジェクト管理ツールなど、あらゆるSaaSに共通して適用できます。
オブザーバビリティ知識の全体像
┌─────────────────────────────────────────────────────────────────────────┐
│ オブザーバビリティ設計 │
└─────────────────────────────────────────────────────────────────────────┘
│
┌──────────┬──────────────┼──────────────┐
│ │ │ │
▼ ▼ ▼ ▼
┌─────────┐┌──────────┐┌───────────┐┌───────────┐
│ 基礎概念 ││ 構造化 ││ メトリクス ││ 分散 │
│ ││ ログ設計 ││ とアラート ││ トレーシング│
│なぜ ││何をどう ││何を計測し ││リクエスト │
│オブザー ││記録する? ││どう通知? ││をどう │
│バビリ ││ ││ ││追跡する? │
│ティ? ││ ││ ││ │
└────┬────┘└────┬────┘└────┬─────┘└────┬─────┘
│ │ │ │
▼ ▼ ▼ ▼
basics structured metrics-and distributed
-logging -alerting -tracing
既存コンテンツとの棲み分け
本カテゴリは設計原則(Why/What) に焦点を当てています。ツール固有の設定手順(How)は既存コンテンツを参照してください。
| コンテンツ | カバー範囲 | 焦点 |
|---|---|---|
| 本カテゴリ(オブザーバビリティ) | 設計原則・SLI/SLO・構造化ログ設計・メトリクス設計・トレーシング設計 | Why / What |
| Docker / Kubernetes: Kubernetes Observability | Prometheus / Grafana / Fluent Bit / OTel Collector のK8s設定 | How(ツール設定) |
| Linux: ログ管理 | syslog, journald, logrotate | How(OSレベル) |
| AWS: モニタリング | CloudWatch, X-Ray, CloudTrail | How(AWS固有) |
| セキュリティ: セキュリティログ | セキュリティログ、SIEM | セキュリティ観点 |
対象読者
- SaaSアプリケー ション開発者
- SRE / プラットフォームエンジニア
- ID基盤・認証システム開発者
- 運用品質の向上に取り組むチームリーダー
所要時間について: 各ドキュメントの所要時間は目安です。初学者の方は2〜3倍の時間を見込んでください。
コンテンツ一覧
基礎
| ドキュメント | 学べること | 所要時間 |
|---|---|---|
| オブザーバビリティの基礎 | モニタリングとの違い、3本柱、SLI/SLO/SLA、成熟度モデル | 20分 |
設計・運用
| ドキュメント | 学べること | 所要時間 |
|---|---|---|
| 構造化ログ設計 | 構造化ログの利点、ログレベル設計、コンテキスト情報、アンチパターン | 20分 |
| メトリクスとアラート設計 | メトリクスの種類、RED/USEメソッド、命名規則、アラート設計 | 25分 |
| 分散トレーシング | トレース・スパン、コンテキスト伝播、サンプリング戦略 | 20分 |
学習パス
初心者向け(推奨順序)
1. オブザーバビリティの基礎
↓ 概念と全体像を理解する
2. 構造化ログ設計
↓ 最も身近なログから設計を学ぶ
3. メトリクスとアラート設計
↓ 数値データの計測とアラートを学ぶ
4. 分散トレーシング
リクエスト追跡の仕組みを学ぶ
中級者向け(トピック別)
運用品質の向上に注力:
オブザーバビリティの基礎 → メトリクスとアラート設計
ログ基盤の構築に注力:
構造化ログ設計 → (参 考)Linux: ログ管理 → (参考)K8s Observability
マイクロサービス運用に注力:
分散トレーシング → メトリクスとアラート設計 → (参考)K8s Observability
関連リソース
外部リファレンス
- Google SRE Book - Monitoring Distributed Systems
- Google SRE Book - Service Level Objectives
- OpenTelemetry Documentation
- Charity Majors - Observability Engineering (O'Reilly)
関連する学習コンテンツ
- Docker / Kubernetes - K8sでのPrometheus / Grafana / OTel Collector設定
- AWS - CloudWatch / X-Ray / CloudTrail
- セキュリティ - セキュリティログ・SIEM
- CI/CD - パイプラインでの品質ゲート・テスト戦略
チェックリスト
学習完了後、以下を確認できるようになることを目指します:
- モニタリングとオブザーバビリティの違いを説明できる
- ログ・メトリクス・トレースの3本柱の役割と関係を説明できる
- SLI / SLO / SLA を定義し、エラーバジェットを計算できる
- 構造化ログの設計方針(レベル・コンテキスト・フォーマット)を策定できる
- ログレベル(ERROR / WARN / INFO / DEBUG)の使い分け基準を説明できる
- REDメソッド / USEメソッドに基づくメトリクスを設計できる
- メトリクスの命名規則とラベル設計のベストプラクティスを適用できる
- アラート疲れを防ぐアラート設計ができる
- 分散トレーシングの基本概念(トレース・スパン・コンテキスト伝播)を説明できる
- サンプリング戦略(Head-based / Tail-based)を要件に応じて選択できる
最終更新: 2026-03-04