バックアップと復元の概要
概要
Dorisはバックアップとリストア操作のサポートを提供します。これらの機能により、ユーザーはデータベース、Table、またはパーティションからリモートストレージシステムにデータをバックアップし、必要に応じてリストアできます。
要件
- 管理者権限: ADMIN権限を持つユーザーのみがバックアップとリストア操作を実行できます。
主要な概念
Snapshot: スナップショットは、データベース、Table、またはパーティション内のデータの特定時点でのキャプチャです。スナップショットを作成する際は、スナップショットラベルを指定する必要があり、完了時にタイムスタンプが生成され、Repository、スナップショットラベル、タイムスタンプによってスナップショットを識別できます。
Repository: バックアップファイルが保存されるリモートストレージの場所です。サポートされるリモートストレージには、S3、Azure、GCP、OSS、COS、MinIO、HDFS、およびその他のS3互換オブジェクトストレージが含まれます。
Backup Operation: バックアップ操作は、データベース、Table、またはパーティションのスナップショットを作成し、スナップショットファイルをリモートRepositoryにアップロードし、バックアップに関連するメタデータを保存することを含みます。
Restore Operation: リストア操作は、リモートRepositoryからバックアップを取得し、Dorisクラスターにリストアすることを含みます。
主要な機能
-
データのバックアップ: Dorisは、スナップショットを作成することで、Table、パーティション、またはデータベース全体からデータをバックアップできます。データはファイル形式でバックアップされ、HDFS、S3、またはその他のS3互換リモートストレージシステムに保存されます。
-
データのリストア: リモートRepositoryからバックアップデータを任意のDorisクラスターにリストアできます。これには、データベース全体のリストア、Table全体のリストア、パーティションレベルのリストアが含まれ、柔軟なデータリカバリが可能です。
-
スナップショット管理: データはスナップショットの形式でバックアップされます。これらのスナップショットはリモートストレージシステムにアップロードされ、必要に応じてリストアできます。リストアプロセスは、スナップショットファイルをダウンロードし、ローカルメタデータにマッピングして有効化することを含みます。
-
データマイグレーション: バックアップとリストアに加えて、この機能は異なるDorisクラスター間でのデータマイグレーションもサポートします。データをリモートストレージシステムにバックアップし、別のDorisクラスターにリストアでき、クラスターマイグレーションシナリオを促進します。
-
レプリケーション制御: データをリストアする際、リストアされるデータのレプリカ数を指定して、冗長性と耐障害性を確保できます。
制限事項
-
ストレージとコンピューティングの分離: ストレージ・コンピューティング分離モデルは、バックアップとリストアをサポートしていません。
-
非同期マテリアライズドビュー(MTMV)はサポートされていません: **非同期マテリアライズドビュー(MTMV)**のバックアップまたはリストアはサポートされていません。これらのビューは、バックアップとリストア操作で考慮されません。
-
ストレージポリシーを使用するTableはサポートされていません: storage policiesを使用するTableは、バックアップとリストア操作をサポートしていません。
-
増分バックアップ: 現在、Dorisは完全バックアップのみをサポートしています。増分バックアップ(前回のバックアップ以降に変更されたデータのみを保存)はサポートされていません。特定のパーティションをバックアップすることで増分バックアップを実現できます。
-
colocate_with属性: バックアップまたはリストア操作中、DorisはTableの
colocate_with属性を保持しません。リストア後、コロケートされたTableについては、この属性を再設定する必要がある場合があります。 -
動的パーティションサポート: Tableをリストアした後、
ALTER TABLEコマンドを使用してこの属性を手動で有効にする必要があります。 -
単一同時実行: 単一データベースでは、バックアップまたはリストアタスクは同時に1つしか実行できません。