Elastic Compute Node
Elasticコンピュートノードは、BEノードの特別なタイプとして、データストレージ機能を持たず、データ演算のみを担当します。したがって、コンピュートノードはステートレスなBEノードと見なすことができ、簡単に追加・削除が可能です。
lakehouseデータ分析のシナリオでは、elasticコンピュートノードはHive、Iceberg、Hudi、Paimon、JDBCなどの外部データソースのクエリに使用できます。Dorisは外部データソースのデータストレージを処理しないため、elasticコンピュートノードを使用して外部データソースの計算能力を簡単に拡張できます。さらに、コンピュートノードにはキャッシュディレクトリを設定して外部データソースのホットデータをキャッシュし、データ読み取りをさらに高速化することも可能です。
ElasticコンピュートノードはDorisのストレージとコンピューティングStaticモードにおけるelasticリソース制御に適しています。Doris 3.0のストレージ・コンピューティング分離アーキテクチャでは、BEノードはステートレスであるため、独立したelasticコンピュートノードは不要になります。
コンピュートノードの使用方法
BEノードタイプ
ストレージとコンピューティングStaticモードでは、BEノードは2つのタイプに分かれます:
-
Mix
混合ノード。これはBEノードのデフォルトタイプです。これらのノードは演算とDoris内部Tableデータのストレージの両方に参加します。
-
Computation
Elasticコンピュートノード。データストレージは処理せず、データ演算のみを行います。
コンピュートノードの追加
BEのbe.conf設定ファイルに以下の設定を追加してください:
be_node_role=computation
その後、BEノードを起動すると、Computationタイプとして実行されます。
次にDorisに接続して以下を実行してください:
ALTER SYSTEM ADD BACKEND
このBEノードを追加します。追加が成功すると、SHOW BACKENDSのNodeRole列でノードタイプがcomputationと表示されます。
コンピュートノードの使用
コンピュートノードを有効にし、その動作を制御するには、FE設定ファイルfe.confで以下のパラメータを設定する必要があります:
| パラメータ名 | 説明 |
|---|---|
prefer_compute_node_for_external_table | デフォルトはfalse。trueに設定すると、外部Tableのクエリが優先的にコンピュートノードに割り当てられます。falseの場合、外部Tableのクエリは任意のBEノードに割り当てられます。クラスターにコンピュートノードが存在しない場合、このパラメータは効果がありません。 |
min_backend_num_for_external_table | prefer_compute_node_for_external_tableがtrueの場合のみ有効。クラスター内のコンピュートノード数がこの値未満の場合、外部Tableのクエリは一部の混合ノードを取得して割り当て、総ノード数がこの値に達するよう試行します。クラスター内のコンピュートノード数がこの値より大きい場合、外部Tableのクエリはコンピュートノードのみに割り当てられます。バージョン2.0(含む)以前では、このパラメータのデフォルト値は3でした。バージョン2.1以降では、デフォルト値は-1で、現在のコンピュートノード数のみを使用することを意味します。 |
min_backend_num_for_external_tableの詳細説明:
クラスターに3つのコンピュートノードと5つの混合ノードがあると仮定します。
min_backend_num_for_external_tableが3以下に設定されている場合、外部Tableクエリは3つのコンピュートノードのみを使用します。3より大きい値、例えば6に設定された場合、外部Tableクエリは3つのコンピュートノードに加えて追加の3つの混合ノードを演算に使用します。
要約すると、このパラメータは主に外部Table演算に参加できるBEノードの最小数に使用され、コンピュートノードを優先的に選択します。このパラメータを増加させると、より多くのBEノード(コンピュートノードに限定されない)が外部Tableクエリ処理に参加できるようになり、パラメータを減少させると外部Tableクエリ処理に参加するBEノード数を制限できます。
注記:
バージョン2.1以降、
min_backend_num_for_external_tableは-1に設定可能です。以前のバージョンでは、このパラメータは正の数でなければなりませんでした。このパラメータはprefer_compute_node_for_external_table = trueの場合のみ有効です。
min_backend_num_for_external_tableの値がBEノードの総数より大きい場合、最大でもすべてのBEが選択されます。上記のパラメータは
ADMIN SET FRONTEND CONFIGコマンドを使用してFEノードを再起動せずに動的に変更できます。すべてのFEノードで設定する必要があります。または、fe.confに設定を追加してFEノードを再起動してください。
ベストプラクティス
連合クエリのリソース分離とElasticスケーリング
連合クエリのシナリオでは、ユーザーは外部Tableデータのクエリ専用のコンピュートノードセットをデプロイできます。これにより、外部Tableクエリ負荷(Hiveでの大規模分析など)と内部Tableクエリ負荷(低レイテンシの高速データ分析など)を分離できます。
同時に、ステートレスBEノードとして、コンピュートノードは簡単にスケールアップ・ダウンできます。例えば、k8sを使用してelasticコンピュートノードクラスターのセットをデプロイし、ビジネスピーク時にはデータレイク分析により多くのコンピュートノードを活用し、オフピーク時には迅速にスケールダウンしてコストを削減できます。
よくある問題
- 混合ノードとコンピュートノードは相互に変換できますか?
コンピュートノードは混合ノードに変換できます。ただし、混合ノードはコンピュートノードに変換できません。
- コンピュートノードはデータストレージディレクトリの設定が必要ですか?
はい。コンピュートノードのデータストレージディレクトリはユーザーデータを保存せず、cluster_idなどのBEノード自体の情報ファイルと、動作中の一時ファイルのみを保存します。
コンピュートノードのストレージディレクトリは少量のディスク容量(MBレベル)のみを必要とし、ユーザーデータに影響を与えることなく、ノードと共にいつでも削除できます。
- コンピュートノードと混合ノードはファイルキャッシュディレクトリを設定できますか?
ファイルキャッシュは、最近アクセスしたリモートストレージシステム(HDFSまたはオブジェクトストレージ)からのデータファイルをキャッシュすることで、同じデータの後続クエリを高速化します。
コンピュートノードと混合ノードの両方でファイルキャッシュディレクトリを設定できます。ファイルキャッシュディレクトリは事前に作成する必要があります。
- コンピュートノードはDECOMMISION操作による廃止が必要ですか?
いいえ。コンピュートノードはDROP BACKEND操作を使用して直接削除できます。