チューニングガイド

本ドキュメントでは、idp-server の性能最適化のための設定指針を提供する。

JVM チューニング

ヒープサイズ

JAVA_TOOL_OPTIONS="-Xms512m -Xmx2g"

負荷レベル	推奨Xms	推奨Xmx
小規模	256m	1g
中規模	512m	2g
大規模	1g	4g

ヒント

XmsとXmxを同じ値に設定すると、ヒープリサイズのオーバーヘッドを回避できる。

ガベージコレクション

G1GC（推奨）

JAVA_TOOL_OPTIONS="-XX:+UseG1GC -XX:MaxGCPauseMillis=100"

パラメータ	値	説明
UseG1GC	有効	G1GCを使用
MaxGCPauseMillis	100	目標GC停止時間(ms)
G1HeapRegionSize	自動	リージョンサイズ

ZGC（低レイテンシ重視）

JAVA_TOOL_OPTIONS="-XX:+UseZGC -XX:+ZGenerational"

JDK 21以降で推奨
超低レイテンシが要求される場合に使用

GCログ

JAVA_TOOL_OPTIONS="-Xlog:gc*:file=/var/log/gc.log:time,uptime:filecount=5,filesize=100m"

Tomcat チューニング

スレッドプール

server:
  tomcat:
    threads:
      max: 300
      min-spare: 50
    accept-count: 100
    connection-timeout: 20000

パラメータ	推奨値	説明
max	300	最大ワーカースレッド
min-spare	50	最小待機スレッド
accept-count	100	接続キューサイズ
connection-timeout	20000	タイムアウト(ms)

負荷レベル別設定

負荷レベル	max	min-spare	accept-count
小規模	100	20	50
中規模	300	50	100
大規模	500	100	200

データベースチューニング

PostgreSQL

接続プール（HikariCP）

spring:
  datasource:
    hikari:
      connection-timeout: 30000      # 接続取得タイムアウト（ms）
      maximum-pool-size: 30          # 最大プール数
      minimum-idle: 10               # 最小アイドル接続数
      idle-timeout: 600000           # アイドルタイムアウト（ms）
      max-lifetime: 1800000          # 接続最大生存時間（ms）
      keepalive-time: 180000         # キープアライブ間隔（ms）
      validation-timeout: 5000       # 検証タイムアウト（ms）

パラメータ	デフォルト	推奨値	説明	変更を検討するケース
connection-timeout	30000	30000	プールから接続を取得する際の最大待機時間	`SQLTransientConnectionException` が頻発する場合は延長を検討
maximum-pool-size	10	30	最大コネクション数	`hikaricp.connections.pending` が増加する場合は増加、DB CPU高騰時は削減
minimum-idle	10	10	最小アイドル接続数	負荷変動が大きい場合は増加、リソース節約したい場合は削減
idle-timeout	600000	600000	アイドル接続が閉じられるまでの時間（10分）	DB接続数を抑えたい場合は短縮
max-lifetime	1800000	1800000	接続の最大生存時間（30分）	DB側 `wait_timeout` より短く設定。接続エラーが出る場合は短縮
keepalive-time	0（無効）	180000	アイドル接続の生存確認間隔（3分）	LB/FW経由で接続切断エラーが出る場合は有効化・短縮
validation-timeout	5000	5000	接続の有効性検証タイムアウト	ネットワーク遅延が大きい環境では延長

パラメータ詳細

maximum-pool-size（最大プール数）

┌─────────────────────────────────────────────────────────────┐
│  過剰な接続プールは逆効果                                    │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  多すぎると:                                                │
│  ・DB側でコンテキストスイッチが増加                         │
│  ・ロック競合が発生しやすくなる                             │
│  ・メモリ消費が増加                                         │
│                                                             │
│  目安:                                                      │
│  ・CPUコア数 × 2〜4                                         │
│  ・4コアなら 8〜16 程度から始める                           │
│  ・実測で調整（プール枯渇 vs DB競合のバランス）             │
│                                                             │
└─────────────────────────────────────────────────────────────┘

keepalive-time（キープアライブ）

┌─────────────────────────────────────────────────────────────┐
│  なぜ必要か                                                  │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  クラウド環境では:                                          │
│  ・ロードバランサーがアイドル接続を切断する                 │
│  ・AWS ALB: 350秒、Azure: 240秒 など                        │
│  ・切断された接続を使うとエラー発生                         │
│                                                             │
│  keepalive-time を設定すると:                               │
│  ・アイドル接続に対して定期的に検証クエリを実行             │
│  ・ファイアウォール/LBによる切断を防止                      │
│  ・推奨: 180000（3分）= LBのタイムアウトより短く            │
│                                                             │
└─────────────────────────────────────────────────────────────┘

max-lifetime（最大生存時間）

┌─────────────────────────────────────────────────────────────┐
│  DB側のタイムアウトより短く設定                              │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  PostgreSQL wait_timeout のデフォルト: なし（無制限）       │
│  MySQL wait_timeout のデフォルト: 28800秒（8時間）          │
│                                                             │
│  推奨:                                                      │
│  ・1800000（30分）程度                                      │
│  ・DB側タイムアウトの 80% 以下に設定                        │
│  ・古い接続を定期的にリフレッシュ                           │
│                                                             │
└─────────────────────────────────────────────────────────────┘

接続プールサイズの指針

過剰な接続プールはDB側の競合を引き起こす。実測では30→10に削減することでp95が20%改善したケースもある。負荷テストで hikaricp.connections.pending が増加しないサイズを見つけることが重要。

PostgreSQL設定

# postgresql.conf

# 接続
max_connections = 200

# メモリ
shared_buffers = 256MB
effective_cache_size = 768MB
work_mem = 4MB
maintenance_work_mem = 64MB

# WAL
wal_buffers = 16MB
checkpoint_completion_target = 0.9

# クエリ最適化
random_page_cost = 1.1
effective_io_concurrency = 200

インデックス最適化

必須インデックス

-- ユーザー認証デバイス検索
CREATE INDEX idx_user_auth_device_tenant_user
ON idp_user_authentication_devices (tenant_id, user_id);

CREATE INDEX idx_user_auth_device_user_id
ON idp_user_authentication_devices (user_id);

-- テナント別検索
CREATE INDEX idx_idp_user_tenant_id
ON idp_user (tenant_id);

-- メール検索
CREATE INDEX idx_idp_user_email
ON idp_user (tenant_id, email);

インデックス使用状況確認

SELECT
    schemaname,
    tablename,
    indexname,
    idx_scan,
    idx_tup_read,
    idx_tup_fetch
FROM pg_stat_user_indexes
WHERE schemaname = 'public'
ORDER BY idx_scan DESC;

Redis チューニング

基本設定

spring:
  redis:
    host: redis
    port: 6379
    timeout: 2000
    lettuce:
      pool:
        max-active: 50
        max-idle: 20
        min-idle: 5

キャッシュTTL

cache:
  enable: true
  ttl: 300  # 秒

データ種別	推奨TTL	理由
JWKS	3600	変更頻度低
クライアント設定	300	中程度の変更頻度
ユーザーセッション	1800	セキュリティ考慮

Redis設定

# redis.conf

# メモリ
maxmemory 1gb
maxmemory-policy allkeys-lru

# 永続化（必要に応じて）
appendonly no
save ""

# ネットワーク
tcp-keepalive 300
timeout 0

ロードバランサチューニング

Nginx設定

upstream idp_backend {
    server idp-server-1:8080;
    server idp-server-2:8080;
    keepalive 32;
}

server {
    listen 80;

    location / {
        proxy_pass http://idp_backend;
        proxy_http_version 1.1;
        proxy_set_header Connection "";
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_set_header X-Forwarded-Proto $scheme;

        proxy_connect_timeout 30s;
        proxy_send_timeout 60s;
        proxy_read_timeout 60s;
    }
}

keepalive設定の効果

実測ではkeepalive追加によりTPS +12%、p95 -20%の改善を確認。 proxy_http_version 1.1 と proxy_set_header Connection "" が必須。

負荷分散アルゴリズム

アルゴリズム	ユースケース
round_robin	デフォルト、均等分散（実測済み）
least_conn	接続数ベース
ip_hash	セッション固定が必要な場合

アプリケーション設定

ログレベル

logging:
  level:
    root: warn
    org.idp.server: info
    org.springframework.web: warn

警告

本番環境ではDEBUGログを無効化すること。I/Oオーバーヘッドが大きい。

非同期処理

spring:
  task:
    execution:
      pool:
        core-size: 8
        max-size: 32
        queue-capacity: 100

パフォーマンスチェックリスト

デプロイ前

JVMヒープサイズ設定確認
GC設定確認
DBコネクションプールサイズ確認
Redisキャッシュ有効化確認
必須インデックス作成確認
ログレベルがINFO以上であること

運用中

GCログの定期確認
DBクエリ統計の確認
Redisメモリ使用量確認
アプリケーションヒープ使用量確認

トラブルシューティング

高レイテンシ

GCポーズ確認
```
grep "pause" /var/log/gc.log
```

DBクエリ確認

SELECT query, mean_exec_time
FROM pg_stat_statements
ORDER BY mean_exec_time DESC
LIMIT 10;

スレッド状態確認

jstack <pid> | grep -A 2 "java.lang.Thread.State"

メモリ不足

ヒープダンプ取得

jmap -dump:format=b,file=heap.hprof <pid>

ヒープ使用量確認
```
jstat -gc <pid> 1000
```

接続エラー

DBコネクション確認
```
SELECT count(*) FROM pg_stat_activity;
```
Redis接続確認
```
redis-cli ping
```

推奨設定サンプル

検証済み構成（2インスタンス、2,400+ TPS）

以下は実測で2,400+ TPS、p95 < 150msを達成した構成。

# application.yaml
server:
  tomcat:
    threads:
      max: 300
      min-spare: 50
    accept-count: 100

spring:
  datasource:
    hikari:
      maximum-pool-size: 10  # CPUコア × 2
      minimum-idle: 5

  redis:
    lettuce:
      pool:
        max-active: 50

cache:
  enable: true
  ttl: 300

logging:
  level:
    root: warn
    org.idp.server: info

# JVM設定
JAVA_TOOL_OPTIONS="-Xms512m -Xmx2g -XX:MaxGCPauseMillis=100"

# nginx設定（keepalive必須）
upstream idp_backend {
    server idp-server-1:8080;
    server idp-server-2:8080;
    keepalive 32;
}

実測結果

2インスタンス構成: 2,464 TPS、p95: 145ms（Authorization）
190万ユーザー環境で検証済み

JVM チューニング​

ヒープサイズ​

ガベージコレクション​

G1GC（推奨）​

ZGC（低レイテンシ重視）​

GCログ​

Tomcat チューニング​

スレッドプール​

負荷レベル別設定​

データベースチューニング​

PostgreSQL​

接続プール（HikariCP）​

パラメータ詳細​

PostgreSQL設定​

インデックス最適化​

必須インデックス​

インデックス使用状況確認​

Redis チューニング​

基本設定​

キャッシュTTL​

Redis設定​

ロードバランサチューニング​

Nginx設定​

負荷分散アルゴリズム​

アプリケーション設定​

ログレベル​

非同期処理​

パフォーマンスチェックリスト​

デプロイ前​

運用中​

トラブルシューティング​

高レイテンシ​

メモリ不足​

接続エラー​

推奨設定サンプル​

検証済み構成（2インスタンス、2,400+ TPS）​

関連ドキュメント​