メインコンテンツまでスキップ
バージョン: 2.1

Doris Cluster Monitoring

Manager は Prometheus、Grafana、AlertManager を統合しており、Manager 内で直接クラスターモニタリングを表示・管理できます。

クラスターモニタリングの表示

Manager は、クラスターのリアルタイム運用状況を把握するための豊富な事前定義済みモニタリングメトリクスを提供しています。

monitor

モニタリングメトリクスの説明は以下の通りです:

カテゴリーメトリクス名メトリクス説明
Cluster 概要FE Nodeクラスター内の FE ノードの総数
FE Not Aliveクラスター内のオフライン FE ノード数
Used Capacityクラスター内の BE の使用領域
BE Nodeクラスター内の BE ノードの総数
BE Not Aliveクラスター内のオフライン BE ノード数
Total Capacityクラスター内の BE の総利用可能ストレージ容量
FE JVM Heap Use Rateクラスター内の FE の JVM ヒープ使用率
BE コンパクション Score各 BE のコンパクションスコア
Load Rows Rate単位時間内のデータインポート状況
QPS異なる FE の QPS 状況
99th Latency異なる FE の 99パーセンタイルクエリレイテンシ
Host MonitorCPU Used Rateノードの CPU 使用率
Mem Usageノードのメモリ使用サイズ
Mem Used Rateノードのメモリ使用率
I/O Util単位時間内のディスク I/O 使用率
Disk Used Rateディスク容量使用率のパーセンテージ
Disk Write Throughputディスク書き込みスループット
Disk Read Throughputディスク読み取りスループット
Network Outbound Trafficゲートウェイのアウトバウンドトラフィック
Network Inbound Trafficゲートウェイのインバウンドトラフィック
Query StatisticRPS単位時間内の異なる FE のリクエスト/秒
QPS異なる FE の QPS
99th Latency99パーセンタイルクエリレイテンシ
Query Percentileクエリレイテンシ(異なるパーセンタイル)
Query Error [1m]1分以内のクエリ失敗率
Connections各 FE の接続数
JobsBroker Load JobBroker ロードタスクのステータス分布
Insert Load JobInsert タスクのステータス分布
Routine Load JobRoutine ロードタスクのステータス分布
Spark Load JobSpark ロードタスクのステータス分布
Broker Load TendencyBroker ロードタスクのステータス傾向
Insert Load TendencyInsert タスクのステータス傾向
Routine Load TendencyRoutine ロードタスクのステータス傾向
Spark Load TendencySpark ロードタスクのステータス傾向
SC Job実行中のスキーマ変更タスク数
Report Queue Sizeマスターノードの Report Queue Size
Rollup Job実行中のロールアップタスク数
TransactionsTxn Begin/Success on FEFE で開始されたトランザクション総数と成功したトランザクション数
Txn Failed/Reject on FE単位時間内の BE トランザクションの失敗率と拒否率
Publish Task on BEBE での publish タスクの総数
Txn Status on FE異なる状態のトランザクション数
Txn Load Bytes/Rows rate単位時間内にインポートされたデータの行数とサイズ
FEMax Replayed Journal IDFE の Journal ID
Edit ログ SizeFE のエディットログサイズ
Image WriteFE でのイメージ書き込み数
Image PushFE でのイメージプッシュ数
Image CounterFE でのイメージ書き込み数とプッシュ数
Image CleanFE イメージクリーンアップの成功・失敗ステータス
Edit log CleanFE エディットログクリーンアップの成功・失敗ステータス
BDBJE WriteBDBJE の 99パーセンタイル書き込みレイテンシ
BDBJE Read単位時間内の BDBJE の読み取り
JVM HeapFE の JVM ヒープ使用量
Scheduling Tabletsデータバランシングまたは復旧中にスケジュールされるタブレット数
JVM Old GCOld GC
JVM Young GCYoung GC
JVM OldJVM old サイズ
JVM YoungJVM young サイズ
FE Collect コンパクション ScoreFE によって収集された各 BE のコンパクションスコア
JVM Non HeapFE の JVM 非ヒープ使用量
JVM ThreadsJVM スレッド数
BEDisk UsageBE のディスク容量使用率
BE FD CountBE での FD 使用量
BE Thread NumBE でのスレッド分布
Tablet Meta Read単位時間内の BE のメタデータ読み取り状況
Tablet Meta Write単位時間内の BE のメタデータ書き込み状況
Tablet DistributionBE でのタブレット分布
BE コンパクション Base単位時間内に BE が実行したベースコンパクションタスクの実行率
BE コンパクション Cumulate単位時間内に BE が実行した累積コンパクションタスクの実行率
BE Push Bytes単位時間内の BE での push_request_write データのサイズ
BE Push Rows単位時間内の BE での push_request_write の行数
BE Scan Bytes単位時間内に BE がスキャンしたデータのサイズ
BE Scan Rows単位時間内に BE がスキャンした行数
BE TasksFinish Task Report各 BE で完了したタスクの総数
Push Task各 BE で正常に実行されたプッシュタスク数
Push Task Cost Time各 BE でプッシュタスク実行にかかった時間
DeleteBE で実行された削除タスクの総数
Base コンパクションBE で実行された base_compaction タスクの総数
Cumulative コンパクションBE で実行された cumulative_compaction タスクの総数
CloneBE で実行されたクローンタスクの総数
Create RollupBE で実行された create_rollup タスクの総数
Schema ChangeBE で実行された schema_change タスクの総数
Create TabletBE で実行された create_tablet タスクの総数

新しいモニタリングダッシュボードの作成

Manager には2つのモニタリングダッシュボードがあります:

  • Doris Dashboard 概要:基本的な Doris とホストモニタリング項目を提供する事前定義済み Doris モニタリングダッシュボード。変更不可。

  • Default Custom Doris Dashboard 概要:変更可能なユーザー定義モニタリングダッシュボード。

新しいダッシュボードを作成する場合、Default Custom Doris Dashboard 概要 パネルを変更してカスタムダッシュボードを追加できます。

  1. 「Default Custom Doris Dashboard 概要」ダッシュボードを選択

    モニタリングページの左上で、「Default Custom Doris Dashboard 概要」パネルを選択します:

    dashboard

  2. 新しいダッシュボードを複製

    新しいパネルを複製します。任意のモジュールにドラッグアンドドロップできます:

    duplicate-panel

  3. 複製したパネルを編集

    パネルを編集します。ルールについては edit panel を参照してください。

    edit-panel

クラスターモニタリングの管理

クラスターモニタリングの有効/無効化

ユーザー設定で「Service 構成」を選択して、モニタリングとアラートサービスを有効または無効にします。

enable-monitor

モニタリング認証の有効/無効化

Manager v24.0.3 以降、モニタリングコンポーネントの認証はデフォルトで有効になっています。Prometheus、AlertManager、Grafana のアカウントとパスワードを個別に設定できます。webserver/conf/manager.conf ファイルで以下の設定を変更できます:

設定項目タイプ説明
MONITOR_AUTH_ENABLEBOOLEANモニタリング認証を有効または無効にします。デフォルトは TRUE です。
GRAFANA_USERSTRINGGrafana ユーザー名。現在は 'admin' ユーザーのみサポートしています。
GRAFANA_PASSSTRINGGrafana パスワード。個別に設定されていない場合、ランダムパスワードが設定されます。
PROMETHEUS_USERSTRINGPrometheus ユーザー名。デフォルトは 'admin' ユーザーです。
PROMETHEUS_PASSSTRINGPrometheus パスワード。個別に設定されていない場合、ランダムパスワードが設定されます。
ALERTMANAGER_USERSTRINGAlertManager ユーザー名。デフォルトは 'admin' です。
ALERTMANAGER_PASSSTRINGAlertManager パスワード。個別に設定されていない場合、ランダムパスワードが設定されます。