メインコンテンツまでスキップ
バージョン: 4.x

監視概要

VeloDB Cloudは監視とアラート機能を提供しており、warehouseやクラスターの健全性とパフォーマンスを追跡して調整を行うことができます。

ナビゲーションバーでMetrics機能を見つけることができ、以下のことが可能です。

  • warehouseまたはクラスター別にメトリクスを表示する。
  • Starredを使用して、warehouseや異なるクラスターの関心のあるメトリクスをまとめて表示する。
  • 時間セレクターを調整して過去のメトリクスデータを表示し、過去15日間のメトリクスデータを確認できる。
  • 自動更新機能を使用してメトリクスをリアルタイム(5秒)で更新する。

VeloDB Cloudで使用できるメトリクスは2つのカテゴリーに分類されます。

  • Basic Metrics - 基本メトリクスデータは、CPU使用率、メモリ使用量、ネットワークスループットなど、クラスターの物理的な側面を監視するのに役立ちます。
  • Service Metrics - クエリパフォーマンスデータは、QPS、クエリ成功率などのwarehouseやクラスターのアクティビティとパフォーマンスを監視するのに役立ちます。これはクラスターの具体的なワークロードを理解するのに役立ちます。

Basic Metrics

metrics basic

基本メトリクスは「ノード」次元でクラスターの物理的な監視情報を提供します。

クラスターの基本メトリクスを使用して、指定した時間枠内でクラスターが異常かどうかを判断できます。また、過去または現在のクエリがクラスターのパフォーマンスに影響を与えているかどうかも確認できます。

クラスターの基本メトリクスを使用して、低速クエリの原因を診断し、クラスター容量のスケールアップやスケールダウン、SQL文の最適化などの可能な対策を講じることができます。

以下のクラスター基本メトリクスを提供しています。

CPU Utilization

すべてのノードのCPU使用率の割合を表示します。クラスターのスケールやその他のリソース消費操作を計画する前に、このチャートからクラスター使用率が最も低い時間を見つけることができます。

Memory Usage

すべてのノードのメモリ使用量を表示します。メモリ使用量が継続的に高い場合は、クラスターのスケールアップを検討する必要があります。

Memory Utilization

すべてのノードのメモリ使用率を表示します。メモリ使用率が継続的に高い場合は、クラスターのスケールアップを検討する必要があります。

I/O Utilization

ハードディスクI/Oの使用率を表示します。I/O使用率が常に高いレベルで維持されている場合、より良いクエリパフォーマンスのためにより多くのノードをスケールアウトすることを検討できます。

Network Outbound Throughput

ネットワーク上でのノードの1秒あたりの平均送信速度をMB/sで表示します。ネットワーク経由でデータを読み取るクエリは速度が遅いため、ネットワーク読み取りを最小限に抑えるようにキャッシュを正しく設定する必要があります。

Network Inbound Throughput

ネットワーク上でのノードの1秒あたりの平均受信速度をMB/sで表示します。

Cache Read Throughput

キャッシュ経由での1秒あたりの読み取りスループットをMB/sで表示します。

Cache Write Throughput

キャッシュ経由での1秒あたりの書き込みスループットをMB/sで表示します。

Basic Metricsのサポート範囲

MetricsWarehouseCluster
CPU UtilizationSupportedSupported
Memory UsageSupportedSupported
Memory UtilizationSupportedSupported
I/O UtilizationSupportedSupported
Network Outbound ThroughputSupportedSupported
Network Inbound ThroughputSupportedSupported
Cache Read ThroughputNot supportedSupported
Cache Write ThroughputNot supportedSupported

Service Metrics

metrics query

Query Per Second (QPS)

1秒あたりのクエリリクエスト数を表示します。ピーク時のシステムのQPSに基づいて、クラスターに必要な計算リソースを決定できます。

Query Success Rate

分単位で更新される全クエリに対する成功クエリの割合を表示します。クエリ成功率が異常に低下した場合は、クラスターやノードの障害があるかどうかを検討してください。

Dead Nodes

現在のクラスターの停止ノード数を表示します。

Average Query Runtime

分単位で更新されるクエリの平均時間を表示します。平均クエリ時間が異常に上昇した場合は、トラブルシューティングを検討してください。

Query 99th Latency

指定された期間中に昇順で99パーセンタイルにランクされるリクエストの応答時間を表示し、クラスター内の低速クエリの速度を反映します。

Cache Hit Rate

全I/O操作の中でキャッシュにヒットしたI/O操作の割合を表示します。キャッシュヒット率が低すぎる場合は、キャッシュポリシーの変更やスペースのスケールアップを検討してください。

Remote Storage Read Throughput

単位時間あたりにリモートに保存されたデータの読み取り量。

Sessions

現在のwarehouseのセッション数を表示し、クラスターを区別しません。

Load Rows Per Second

データ書き込み操作の効率を測定するメトリクスで、現在データベースやその他のデータストレージシステムに正常に書き込まれているレコードの速度を示します。

Load Bytes Per Second

現在の書き込みタスクのレートをデータサイズで反映して表示します。

Finished Load Tasks

最近の期間で完了したタスク数を表示します。急激な増加や減少は、ビジネスの異常を示している可能性があります。

コンパクション Score

データファイルのマージ圧力を示します。Scoreが大きいほど、マージ圧力が大きくなります。

Transaction Latency

warehouseの書き込みタスクのトランザクション遅延を示します。遅延が小さいほど、データをより迅速にクエリできます。

Service Metricsのサポート範囲

MetricsWarehouseCluster
Query Per SecondSupportedSupported
Query Success RateSupportedSupported
Dead NodesNot supportedSupported
Average Query TimeSupportedSupported
Query 99th LatencySupportedSupported
Cache Hit RateNot supportedSupported
Remote Storage Read ThroughputNot supportedSupported
SessionsSupportedNot supported
Load Rows Per SecondSupportedSupported
Load Bytes Per SecondSupportedSupported
Finished Load TasksSupportedNot supported
コンパクション ScoreNot supportedSupported
Transaction LatencySupportedNot supported

アラート概要

SMSアラート通知に加えて、VeloDB Cloudは追加料金なしで監視とアラートサービスを提供します。

クラスター監視メトリクスが変化したときに通知されるようにアラートルールを設定できます。

metrics alerts

アラート設定

アラートルールの表示

リストページで既存のアラートルールとその現在のアラート状況を表示できます。

「赤い点」はアラートルールが有効であることを意味し、「緑の点」は現在のアラートルールがトリガーされていないことを示します。

ワンクリックアラートの有効化

one click alert

Enable One-Click Alertをクリックして基本的なアラートルールを素早く設定でき、これは現在および将来のwarehouseやクラスターの両方に適用されます。

新規/編集アラートルール

metrics alerts new alert rule

New Alert Ruleをクリックするか既存のルールをコピーしてアラートルールを作成できます。現在のアラートルールを変更することもできます。

アラートルール設定は4つの部分で構成されます。

Rule Name

ルール名をカスタマイズできます。warehouse内で一意である必要があります。

Cluster

アラートルールが有効になるクラスターを指定できます。クラスターが削除されても、そのアラートルールは削除されませんが無効になります。

Conditions

満たすべきメトリクスの1つ以上のルールと、これらの条件の組み合わせ方法(and、or)を設定できます。

In Last

「In Last」は条件を満たす時間の持続時間を意味します。アラートの適時性と正確性のバランスを取るために、この時間を適切に設定する必要があります。

Channel

1つ以上の通知チャンネルを設定でき、設定したチャンネルを通じてアラートメッセージがそれぞれプッシュされます。

In-site Notification

設定方法:ユーザーを選択。

Email

設定方法:ユーザーを選択。

SMS

設定方法:ユーザーを選択/携帯電話番号を入力。

WeCom

設定方法:ロボットwebhookを入力。

  1. PC版WeComで、アラーム通知を受信する対象のWeComグループを見つける。
  2. WeComグループを右クリック。表示されるウィンドウでAdd Group Botをクリック。
  3. 表示されるウィンドウでCreate a Botをクリック。
  4. 表示されるウィンドウで、カスタムボット名を入力しAddをクリック。
  5. webhook URLをコピー。
alerts WeCom

注意 メッセージソースを制限する必要がある場合は、IPホワイトリストを設定してください。VeloDB CloudサーバーのIPアドレスは3.222.235.198です。

Lark

設定方法:ロボットwebhookを入力。

外部システムからグループチャットにメッセージを即座にプッシュするカスタムボットを作成するには、webhookを使用してグループチャットと外部システムを接続する必要があります。対象のグループに入り、Settings > BOTs > Add Botをクリック。Custom Botを選択。ボットに適切な名前と説明を入力し、Nextをクリック。

alerts Lark step1

その後、webhook URLが取得されます。

alerts Lark step2

注意 メッセージソースを制限する必要がある場合は、IPホワイトリストを設定してください。VeloDB CloudサーバーのIPアドレスは3.222.235.198です。

DingTalk

設定方法:ロボットwebhookを入力。

DingTalkロボットのwebhookを取得するには、こちらを参照してください。

  1. PCでDingTalkクライアントを実行し、チャットボットを追加したいDingTalkグループに移動し、右上角のGroup Settingsアイコンをクリック。
  2. Group SettingsパネルでGroup Assistantをクリック。
  3. Group AssistantパネルでAdd Robotをクリック。
  4. ChatBotダイアログボックスでAdd Robotセクションの**+**アイコンをクリック。その後、Customをクリック。
alerts DingTalk01
  1. Robot detailsダイアログボックスでAddをクリック。
  2. Add Robotダイアログボックスで、以下の手順を実行:
alerts DingTalk02

注意 メッセージソースを制限する必要がある場合は、IPホワイトリストを設定してください。VeloDB CloudサーバーのIPアドレスは3.222.235.198です。

  1. チャットボットのプロフィール写真と名前を設定。
  2. Security SettingsパラメータでCustom Keywordsを選択。その後、alertを入力。
  3. 利用規約を読み、I have read and accepted DingTalk Custom Robot Service Terms of Serviceを選択。
  4. Finishedをクリック。
  5. Add Robotダイアログボックスで、DingTalkチャットボットのwebhookアドレスをコピーし、Finishedをクリック。
alerts DingTalk03

アラート履歴の表示

アラート履歴を表示し、フィルタリングできます。