メインコンテンツまでスキップ
バージョン: 4.x

Kudu カタログ

概要

Kudu CatalogはTrino Kudu Connectorを使用してTrino Connector互換性フレームワーク経由でKuduTableにアクセスします。

注記
  • これは実験的機能で、バージョン3.0.1以降でサポートされています。
  • この機能はTrinoクラスター環境に依存せず、Trino互換性プラグインのみを使用します。

使用例

シナリオサポート状況
データ統合Kuduデータを読み取りDoris内部Tableに書き込み
データ書き戻しサポートされていません

バージョン互換性

  • Dorisバージョン: 3.0.1以降
  • Trino Connectorバージョン: 435
  • Kuduバージョン: サポートされているバージョンについては、Trino Documentationを参照してください

クイックスタート

ステップ1: Connectorプラグインの準備

以下のいずれかの方法でKudu Connectorプラグインを取得できます:

方法1: プリコンパイル済みパッケージの使用(推奨)

プリコンパイル済みプラグインパッケージをここからダウンロードして解凍します。

方法2: 手動コンパイル

カスタムコンパイルが必要な場合は、以下の手順に従ってください(JDK 17が必要):

git clone https://github.com/apache/doris-thirdparty.git
cd doris-thirdparty
git checkout trino-435
cd plugin/trino-kudu
mvn clean package -Dmaven.test.skip=true

コンパイル後、trino/plugin/trino-kudu/target/trino-kudu-435/ディレクトリが作成されます。

ステップ 2: Deploy Plugin

  1. すべてのFEおよびBEデプロイメントパスのconnectors/ディレクトリ下にtrino-kudu-435/ディレクトリを配置します(ディレクトリが存在しない場合は手動で作成してください):

    ├── bin
    ├── conf
    ├── plugins
    │ ├── connectors
    │ ├── trino-kudu-435
    ...

また、fe.conftrino_connector_plugin_dir設定を変更することで、プラグインパスをカスタマイズすることもできます。例:trino_connector_plugin_dir=/path/to/connectors/

  1. Connectorが適切にロードされるように、すべてのFEおよびBEノードを再起動します。

ステップ 3: Catalogの作成

基本設定(認証なし)

CREATE CATALOG kudu_catalog PROPERTIES (
'type' = 'trino-connector',
'trino.connector.name' = 'kudu',
'trino.kudu.client.master-addresses' = 'ip1:port1,ip2:port2,ip3:port3',
'trino.kudu.authentication.type' = 'NONE'
);

Kerberos認証設定

CREATE CATALOG kudu_catalog PROPERTIES (
'type' = 'trino-connector',
'trino.connector.name' = 'kudu',
'trino.kudu.client.master-addresses' = 'ip1:port1,ip2:port2,ip3:port3',
'trino.kudu.authentication.type' = 'KERBEROS',
'trino.kudu.authentication.client.principal' = 'user@DOMAIN.COM',
'trino.kudu.authentication.client.keytab' = '/path/to/kudu.keytab',
'trino.kudu.authentication.config' = '/etc/krb5.conf',
'trino.kudu.authentication.server.principal.primary' = 'kudu'
);

ステップ 4: データのクエリ

Catalogを作成した後、以下の3つの方法のいずれかを使用してKuduTableデータをクエリできます:

-- Method 1: Query after switching to カタログ
SWITCH kudu_catalog;
USE kudu_db;
SELECT * FROM kudu_tbl LIMIT 10;

-- Method 2: Use two-level path
USE kudu_catalog.kudu_db;
SELECT * FROM kudu_tbl LIMIT 10;

-- Method 3: Use fully qualified name
SELECT * FROM kudu_catalog.kudu_db.kudu_tbl LIMIT 10;

構成

カタログ 構成 パラメータ

Kudu Catalogを作成するための基本構文は以下の通りです:

CREATE CATALOG [IF NOT EXISTS] catalog_name PROPERTIES (
'type' = 'trino-connector', -- Required, fixed value
'trino.connector.name' = 'kudu', -- Required, fixed value
{TrinoProperties}, -- Trino Connector related properties
{CommonProperties} -- Common properties
);

TrinoPropertiesパラメータ

TrinoPropertiesは、trino.プレフィックスが付いたTrino Kudu Connector固有のプロパティを設定するために使用されます。一般的なパラメータには以下があります:

パラメータ名必須デフォルト説明
trino.kudu.client.master-addressesYes-KuduMasterノードアドレスのリスト
trino.kudu.authentication.typeNoNONE認証タイプ:NONEまたはKERBEROS
trino.kudu.authentication.client.principalNo-Kerberosクライアントプリンシパル
trino.kudu.authentication.client.keytabNo-Kerberoskeytabファイルパス
trino.kudu.authentication.configNo-Kerberos設定ファイルパス
trino.kudu.authentication.server.principal.primaryNo-Kuduサーバープリンシパルプレフィックス

その他のKudu Connector設定パラメータについては、Trino公式ドキュメントを参照してください。

CommonPropertiesパラメータ

CommonPropertiesは、メタデータ更新ポリシー、アクセス制御など、一般的なCatalogプロパティを設定するために使用されます。詳細については、Catalogの概要の「Common Properties」セクションを参照してください。

データタイプマッピング

Kudu Catalogを使用する際、データタイプは以下のルールに従ってマッピングされます:

KuduタイプTrinoタイプDorisタイプ備考
booleanbooleanboolean
int8tinyinttinyint
int16smallintsmallint
int32integerint
int64bigintbigint
floatrealfloat
doubledoubledouble
decimal(P, S)decimal(P, S)decimal(P, S)
binaryvarbinarystringTrinoと一致する表示結果のクエリにはHEX(col)関数を使用
stringvarcharstring
datedatedate
unixtime_microstimestamp(3)datetime(3)
otherUNSUPPORTED-サポート外タイプ
ヒント

binaryタイプの場合、16進形式で表示する必要がある場合は、HEX()関数を使用してカラム名をラップしてください。例:SELECT HEX(binary_col) FROM table