メインコンテンツまでスキップ
バージョン: 3.x

Dorisクラスター監視

Managerは、Prometheus、Grafana、およびAlertManagerを統合しており、Manager内で直接クラスター監視を表示および管理できます。

クラスター監視の表示

Managerは、クラスターのリアルタイムの運用状況を理解するのに役立つ豊富な事前定義済み監視メトリクスセットを提供します。

monitor

監視メトリクスの説明は以下の通りです:

CategoryMetric NameMetric デスクリプション
Cluster 概要FE Nodeクラスター内のFEノードの総数
FE Not Aliveクラスター内のオフラインFEノード数
Used Capacityクラスター内のBEの使用容量
BE Nodeクラスター内のBEノードの総数
BE Not Aliveクラスター内のオフラインBEノード数
Total Capacityクラスター内のBEの総利用可能ストレージ容量
FE JVM Heap Use Rateクラスター内のFEのJVMヒープ使用率
BE コンパクション Score各BEのCompactionスコア
Load Rows Rate単位時間内のデータインポート状況
QPS異なるFEのQPS状況
99th Latency異なるFEの99パーセンタイルクエリレイテンシ
Host MonitorCPU Used RateノードのCPU使用率
Mem Usageノードのメモリ使用サイズ
Mem Used Rateノードのメモリ使用率
I/O Util単位時間内のディスクI/O利用率
Disk Used Rate使用されたディスク容量の割合
Disk Write Throughputディスク書き込みスループット
Disk Read Throughputディスク読み取りスループット
Network Outbound Trafficゲートウェイのアウトバウンドトラフィック
Network Inbound Trafficゲートウェイのインバウンドトラフィック
Query StatisticRPS単位時間内の異なるFEの1秒あたりのリクエスト数
QPS異なるFEのQPS
99th Latency99パーセンタイルクエリレイテンシ
Query Percentileクエリレイテンシ(異なるパーセンタイルでの)
Query Error [1m]1分以内のクエリ失敗率
Connections各FEの接続数
JobsBroker Load JobBrokerロードタスクのステータス分布
Insert Load JobInsertタスクのステータス分布
Routine Load JobRoutineロードタスクのステータス分布
Spark Load JobSparkロードタスクのステータス分布
Broker Load TendencyBrokerロードタスクのステータス傾向
Insert Load TendencyInsertタスクのステータス傾向
Routine Load TendencyRoutineロードタスクのステータス傾向
Spark Load TendencySparkロードタスクのステータス傾向
SC Job実行中のスキーマ変更タスク数
Report Queue SizeマスターノードのReport Queue Size
Rollup Job実行中のrollupタスク数
TransactionsTxn Begin/Success on FEFE上で開始されたトランザクションの総数と成功したトランザクション
Txn Failed/Reject on FE単位時間内のBEトランザクションの失敗率と拒否率
Publish Task on BEBE上のpublishタスクの総数
Txn Status on FE異なる状態のトランザクション数
Txn Load Bytes/Rows rate単位時間内にインポートされたデータの行数とサイズ
FEMax Replayed Journal IDFEのJournal ID
Edit ログ SizeFEのEdit logサイズ
Image WriteFE上のイメージ書き込み数
Image PushFE上のイメージプッシュ数
Image CounterFE上のイメージ書き込みおよびプッシュ数
Image CleanFEイメージクリーンアップの成功と失敗状況
Edit log CleanFE edit logクリーンアップの成功と失敗状況
BDBJE WriteBDBJEの99パーセンタイル書き込みレイテンシ
BDBJE Read単位時間内のBDBJEの読み取り
JVM HeapFEのJVMヒープ使用量
Scheduling Tabletsデータバランシングまたは復旧中にスケジューリングされるタブレット数
JVM Old GCOld GC
JVM Young GCYoung GC
JVM OldJVM oldサイズ
JVM YoungJVM youngサイズ
FE Collect コンパクション ScoreFEによって収集された各BEのCompactionスコア
JVM Non HeapFEのJVM non-heap使用量
JVM ThreadsJVMスレッド数
BEDisk UsageBEのディスク容量使用率
BE FD CountBE上のFD使用量
BE Thread NumBE上のスレッド分布
Tablet Meta Read単位時間内のBEのメタデータ読み取り状況
Tablet Meta Write単位時間内のBEのメタデータ書き込み状況
Tablet DistributionBE上のタブレット分布
BE コンパクション Base単位時間内にBEによって実行されるbase compactionタスクの率
BE コンパクション Cumulate単位時間内にBEによって実行されるcumulative compactionタスクの率
BE Push Bytes単位時間内のBE上のpush_request_writeデータのサイズ
BE Push Rows単位時間内のBE上のpush_request_writeの行数
BE Scan Bytes単位時間内にBEによってスキャンされたデータのサイズ
BE Scan Rows単位時間内にBEによってスキャンされた行数
BE TasksFinish Task Report各BE上で完了したタスクの総数
Push Task各BE上で正常に実行されたpushタスク数
Push Task Cost Time各BE上でpushタスクを実行する時間コスト
DeleteBE上で実行されたdeleteタスクの総数
Base コンパクションBE上で実行されたbase_compactionタスクの総数
Cumulative コンパクションBE上で実行されたcumulative_compactionタスクの総数
CloneBE上で実行されたcloneタスクの総数
Create RollupBE上で実行されたcreate_rollupタスクの総数
Schema ChangeBE上で実行されたschema_changeタスクの総数
Create TabletBE上で実行されたcreate_tabletタスクの総数

新しい監視ダッシュボードの作成

Managerには2つの監視ダッシュボードがあります:

  • Doris Dashboard 概要: 基本的なDorisおよびホスト監視項目を提供する事前定義済みのDoris監視ダッシュボードで、変更はできません。

  • Default Custom Doris Dashboard 概要: 変更可能なユーザー定義の監視ダッシュボードです。

新しいダッシュボードを作成する際は、Default Custom Doris Dashboard 概要 パネルを変更してカスタムダッシュボードを追加できます。

  1. 「Default Custom Doris Dashboard 概要」ダッシュボードの選択

    監視ページの左上隅で、「Default Custom Doris Dashboard 概要」パネルを選択します:

    dashboard

  2. 新しいダッシュボードの複製

    新しいパネルを複製します。任意のモジュールにドラッグ&ドロップできます:

    duplicate-panel

  3. 複製されたパネルの編集

    パネルを編集します。ルールについては edit panel を参照してください。

    edit-panel

クラスター監視の管理

クラスター監視の有効化/無効化

ユーザー設定で、「Service 構成」を選択して監視およびアラートサービスを有効または無効にします。

enable-monitor

監視認証の有効化/無効化

Manager v24.0.3以降、監視コンポーネントの認証はデフォルトで有効になっています。Prometheus、AlertManager、およびGrafanaのアカウントとパスワードを個別に設定できます。webserver/conf/manager.conf ファイルで、以下の設定を変更できます:

構成タイプデスクリプション
MONITOR_AUTH_ENABLEBOOLEAN監視認証を有効または無効にします。デフォルトはTRUEです。
GRAFANA_USERSTRINGGrafanaのユーザー名。現在は'admin'ユーザーのみサポートされています。
GRAFANA_PASSSTRINGGrafanaのパスワード。個別に設定されていない場合、ランダムパスワードが設定されます。
PROMETHEUS_USERSTRINGPrometheusのユーザー名。デフォルトは'admin'ユーザーです。
PROMETHEUS_PASSSTRINGPrometheusのパスワード。個別に設定されていない場合、ランダムパスワードが設定されます。
ALERTMANAGER_USERSTRINGAlertManagerのユーザー名。デフォルトは'admin'です。
ALERTMANAGER_PASSSTRINGAlertManagerのパスワード。個別に設定されていない場合、ランダムパスワードが設定されます。