メインコンテンツまでスキップ
バージョン: 4.x

Monitoring

VeloDB Cloudは、warehouseとclusterの健全性とパフォーマンスを追跡し、変化が生じた際に対応できるよう、モニタリングとアラート機能を提供します。

左ナビゲーションのManageグループからMonitoringを開きます。Monitoringには4つのサブページがあります:MetricsAlertsQuery AuditUsageです。

Metrics

Metricsページでは以下のことができます:

  • warehouseまたはcluster別にメトリクスを表示する
  • Starredを使用して、warehouses間やclusters間で関心のあるメトリクスをピン留めし、一緒に表示する
  • 時間セレクターを調整して、過去15日間までの履歴データを確認する
  • ほぼリアルタイムの更新(5秒間隔)のために自動更新を有効にする

メトリクスは2つのカテゴリに分かれています:Basic Metrics(物理リソース使用率)とService Metrics(クエリ/ワークロードパフォーマンス)です。

Basic metrics

Basic metricsは、ノード別のclusterの物理的使用率を追跡します。これらは、特定の時間範囲でclusterが健全かどうかを判断し、履歴または現在のクエリがパフォーマンスに影響を与えているかどうかを判断するのに役立ちます。これは、スケールアップ、スケールダウン、またはSQLの最適化を計画する際の有用な入力です。

metrics basic

MetricWhat it shows
CPU Utilization全ノードにわたるCPU使用率のパーセンテージ。スケーリングやその他のリソース集約的な操作のための静穏な時間帯を見つけるのに有用。
Memory Usage全ノードによって消費されるメモリ。継続的に高い使用量はスケールアップの信号。
Memory Utilization全ノードのメモリ使用率。継続的に高い使用率はスケールアップの信号。
I/O UtilizationディスクI/O使用率。継続的に高い値は、クエリパフォーマンスのためにより多くのノードを追加することを示唆。
Network Outbound Throughputノードあたりの1秒あたりの平均アウトバウンド速度(MB/s)。ネットワーク経由でデータを読み取るクエリは低速 — ネットワーク読み取りを減らすためにキャッシュを設定。
Network Inbound Throughputノードあたりの1秒あたりの平均インバウンド速度(MB/s)。
Cache Read Throughput1秒あたりのキャッシュ読み取りスループット(MB/s)。
Cache Write Throughput1秒あたりのキャッシュ書き込みスループット(MB/s)。

Support range:

MetricWarehouseCluster
CPU Utilization
Memory Usage
Memory Utilization
I/O Utilization
Network Outbound Throughput
Network Inbound Throughput
Cache Read Throughput
Cache Write Throughput

Service metrics

Service metricsは、クエリとワークロードの動作を追跡します:クエリの実行速度、成功数、書き込みパスの動作です。

metrics query

MetricWhat it shows
Query Per Second (QPS)1秒あたりのクエリリクエスト数。ピークQPSは、clusterのサイジング時の有用な入力。
Query Success Rate成功したクエリのパーセンテージ、1分ごとに更新。異常な下降は、clusterまたはnode障害を示す可能性。
Dead Nodescluster内の停止ノード数。
Average Query Runtime平均クエリ時間、1分ごとに更新。異常な上昇は調査の信号。
Query 99th Latency99パーセンタイルクエリの応答時間。遅いクエリの速度を反映。
Cache Hit Rateキャッシュから提供されるI/O操作のパーセンテージ。低い値はキャッシュポリシーの見直しやキャッシュ領域の増加を示唆。
Remote Storage Read Throughput単位時間あたりにリモートストレージから読み取られるデータ量。
Sessionswarehouseのセッション数(clusterごとには分割されない)。
Load Rows Per Secondレコードが正常に書き込まれる割合。
Load Bytes Per Secondデータボリュームが書き込まれる割合。
Finished Load Tasks最近の期間で完了したロードタスク数。急激な変化はビジネス異常を示す可能性。
Compaction Scoreデータファイルマージ圧力。高いスコアはより多くのマージ圧力を意味する。
Transaction Latency書き込みタスクのトランザクション待機時間。低いほどデータがより早くクエリ可能になる。

Support range:

MetricWarehouseCluster
Query Per Second
Query Success Rate
Dead Nodes
Average Query Time
Query 99th Latency
Cache Hit Rate
Remote Storage Read Throughput
Sessions
Load Rows Per Second
Load Bytes Per Second
Finished Load Tasks
Compaction Score
Transaction Latency

Alerts

VeloDB Cloudは、追加料金なし(SMSアラート通知を除く)でモニタリングとアラート機能を提供します。clusterモニタリングメトリクスが変化した際に通知されるよう、アラートルールを設定できます。

metrics alerts

View alert rules

Alertsリストは、既存のアラートルールとその現在のアラート状態を表示します:赤い点はルールが発火していることを意味し、緑の点はルールがトリガーされていないことを意味します。

One-click alerts

Enable One-Click Alertをクリックして、基本的なルールセットを自動的に設定します。このルールセットは現在のwarehousesとclustersの両方、および後で作成するものにも適用されます。

one click alert

Create or edit an alert rule

New Alert Ruleをクリックするか、既存のルールをコピーします。

metrics alerts new alert rule

アラートルールには4つの部分があります:

PartDescription
Rule Namewarehouse内で一意の名前。
Clusterルールが適用されるclusters。clusterが削除された場合、そのルールは削除されませんが、無効化されます。
Conditions1つ以上のメトリクス閾値、and / orで結合。
In Lastルールが発火する前に条件が保持されなければならない期間。適時性とノイズのバランス。

Notification channels

すべてのアラートルールは1つ以上のチャネルにプッシュできます。各チャネルはアラートメッセージを独立してプッシュします。

In-site notificationEmail — 通知するユーザーを選択。

SMS — ユーザーを選択するか、電話番号を直接入力。

WeCom — グループロボットを追加し、そのwebhook URLを貼り付け。

  1. PC版WeComで、アラートを受信するグループを開く。
  2. グループを右クリックし、Add Group Bot、次にCreate a Botをクリック。
  3. ボットに名前を付け、Addをクリック。
  4. webhook URLをアラートチャネル設定にコピー。
alerts WeCom

Note メッセージソースを制限するには、webhook IP許可リストを設定してください。VeloDB CloudサーバーIPは3.222.235.198です。

Lark — カスタムボットを追加し、そのwebhook URLを貼り付け。

  1. 対象グループで、Settings → BOTs → Add Bot → Custom Botをクリック。
  2. ボットに名前と説明を付け、Nextをクリック。
  3. webhook URLをアラートチャネル設定にコピー。
alerts Lark step1 alerts Lark step2

Note メッセージソースを制限するには、webhook IP許可リストを設定してください。VeloDB CloudサーバーIPは3.222.235.198です。

DingTalk — カスタムロボットを追加し、そのwebhook URLを貼り付け。完全な手順についてはDingTalkのガイドを参照してください。概要:

  1. 対象のDingTalkグループで、Group Settings → Group Assistant → Add Robot → Customを開く。
  2. プロフィール画像、名前、セキュリティ設定を設定(Custom Keywordsを使用し、alertを入力)。
  3. 利用規約に同意し、Finishedをクリック。
  4. webhook URLをアラートチャネル設定にコピー。
alerts DingTalk01 alerts DingTalk02 alerts DingTalk03

Note メッセージソースを制限するには、webhook IP許可リストを設定してください。VeloDB CloudサーバーIPは3.222.235.198です。

Alert history

Alertsページでアラート発火履歴を表示し、時間、ルール、またはclusterでフィルタリングできます。

Query Audit

Query Auditは、warehouse内で実行されたクエリを監査・分析するためのワンストップツールです。パフォーマンスの低いクエリを見つけ、トレンドを調査し、個別の問題を診断するために使用します。

リストビューで履歴クエリをフィルタリングし、List Selectionを使用してフィルタにより多くの次元を追加します。

Query IDをクリックしてクエリ詳細ページを開きます。プロファイルキャプチャが有効になっている場合、プロファイルがそこで利用可能です。

audit log

Note 非クエリ文と失敗した文にはQuery IDがありません。

Usage

Usageは、現在のwarehouse内でコンピュート、キャッシュ、ストレージがどのように消費されているかを表示し、コストがどこに向かっているかを確認できます。

左ナビゲーションからMonitoring → Usageを開きます。

usage

組織レベルの請求と支払いチャネルについては、Billingを参照してください。