Kerberos ベストプラクティス
ユーザーが複数のデータソースに対してDorisを使用してフェデレーテッド分析クエリを実行する場合、異なるクラスタが異なるKerberos認証資格情報を使用することがあります。
大手ファンド会社を例に挙げます。その内部データプラットフォームは複数の機能別クラスタに分かれており、異なる技術チームまたは事業チームによって保守され、それぞれが独立したKerberos Realmsで身元認証とアクセス制御を設定しています:
- Productionクラスタは日次純資産価値計算とリスク評価に使用され、厳格に分離されたデータで認可されたサービスのアクセスのみを許可します(Realm: PROD.FUND.COM)。
- Analysisクラスタは戦略研究とモデルバックテストに使用され、DorisはTVFを通じてこのクラスタに一時的なクエリを実装します(Realm: ANALYSIS.FUND.COM)。
- Data lakeクラスタはIceberg Catalogを統合して大量の履歴市場データ、ログ、その他のデータをアーカイブおよび分析します(Realm: LAKE.FUND.COM)。
これらのクラスタはクロスドメイン信頼関係を確立しておらず、認証情報を共有できないため、これらの異種データソースへの統一アクセスには複数のKerberosインスタンスの認証とコンテキスト管理の同時サポートが必要です。
本ドキュメントでは、マルチKerberos環境でのデータソースの設定とアクセス方法に焦点を当てます。
この機能は3.1+からサポートされています
マルチKerberosクラスタ認証設定
krb5.conf
krb5.confにはKerberos設定情報、KDCの場所、Kerberosサービスの一部のデフォルト値、およびホスト名とRealmのマッピング情報が含まれています。
krb5.confを適用する際は、すべてのノードに配置することを確認してください。デフォルトの場所は/etc/krb5.confです。
realms
EXAMPLE.COMなど、多くのクライアントのKDCとKerberosネットワークを含みます。
複数のクラスタを設定する場合、一つのkrb5.confに複数のRealmsを設定する必要があります。KDCとadmin_serverもドメイン名にできます。
[realms]
EMR-IP.EXAMPLE = {
kdc = 172.21.16.8:88
admin_server = 172.21.16.8
}
EMR-HOST.EXAMPLE = {
kdc = emr_hostname
admin_server = emr_hostname
}
domain_realm
Kerberosサービスが配置されているノードに対して、ドメインからRealmへのマッピングを設定します。
[libdefaults]
dns_lookup_realm = true
dns_lookup_kdc = true
[domain_realm]
172.21.16.8 = EMR-IP.EXAMPLE
emr-host.example = EMR-HOST.EXAMPLE
例えば、プリンシパル emr1/domain_name@realm.com の場合、KDCを検索する際に domain_name を使用して対応するRealmを見つけます。これが一致しない場合、そのRealmのKDCを見つけることができません。
通常、domain_realm に関連するエラーが2種類、DorisのLog/be.outまたはlog/fe.outで確認できます:
* Unable to locate KDC for realm/Cannot locate KDC
* No service creds
keytab and principal
複数のKerberosクラスタ環境では、keytabファイルは通常異なるパスを使用します。例えば、/path/to/serverA.keytab、/path/to/serverB.keytabなどです。異なるクラスタにアクセスする際は、対応するkeytabを使用する必要があります。
HDFSクラスタでKerberos認証が有効になっている場合、通常core-site.xmlファイルでhadoop.security.auth_to_localプロパティを確認できます。これはKerberosプリンシパルをより短いローカルユーザー名にマッピングするために使用され、HadoopはKerberos構文ルールを再利用します。
設定されていない場合、NoMatchingRule("No rules applied to例外が発生する可能性があります。コードを参照してください:
hadoop/src/core/org/apache/hadoop/security/KerberosName.java
hadoop.security.auth_to_localパラメータには、プリンシパルをRULEに対して上から下へマッチングするマッピングルールのセットが含まれています。マッチするマッピングルールが見つかると、ユーザー名を出力し、マッチしないルールは無視されます。具体的な設定フォーマット:
RULE:[<principal translation>](acceptance filter)<short name substitution>
異なるKerberosサービスがマルチクラスタ環境で使用するプリンシパルをマッチさせるために、推奨される設定は以下の通りです:
<property>
<name>hadoop.security.auth_to_local</name>
<value>RULE:[1:$1@$0](^.*@.*$)s/^(.*)@.*$/$1/g
RULE:[2:$1@$0](^.*@.*$)s/^(.*)@.*$/$1/g
DEFAULT</value>
</property>
上記の設定は、core-site.xml内のhadoop.security.auth_to_localプロパティを追加または置換するために使用できます。core-site.xmlをfe/confとbe/confに配置して、Doris環境で有効にします。
OUTFILE、EXPORT、Broker Load、カタログ(Hive、Iceberg、Hudi)、TVF、およびその他の機能で個別に有効にする必要がある場合は、それらのプロパティで直接設定できます:
"hadoop.security.auth_to_local" = "RULE:[1:$1@$0](^.*@.*$)s/^(.*)@.*$/$1/g
RULE:[2:$1@$0](^.*@.*$)s/^(.*)@.*$/$1/g
DEFAULT"
マッピングルールが正しく一致するかどうかを確認するには、異なるクラスターにアクセスする際にこのエラーが発生するかどうかをチェックしてください:
NoMatchingRule: No rules applied to hadoop/domain\_name@EMR-REALM.COM
表示された場合、マッチングが失敗したことを示します。
ベストプラクティス
このセクションでは、Apache Doris公式リポジトリが提供するDocker環境を使用して、DockerでKerberosを使用したHive/HDFSサービスを開始し、DorisからKerberos対応のHive Catalogを作成する方法を紹介します。
環境説明
-
Dorisが提供するKerberosサービスを使用(2セットのHIVE、2セットのKDC):
-
Docker起動ディレクトリ:
docker/thirdparties -
krb5.confテンプレート:
-
1. keytabファイルと権限の準備
keytabファイルをローカルディレクトリにコピー:
mkdir -p ~/doris-keytabs
cp <hive-presto-master.keytab> ~/doris-keytabs/
cp <other-hive-presto-master.keytab> ~/doris-keytabs/
認証の失敗を防ぐため、ファイルのアクセス許可を設定してください:
chmod 400 ~/doris-keytabs/*.keytab
2. krb5.confファイルの準備
-
Dorisによって提供される
krb5.confテンプレートファイルを使用します -
複数のKerberos HDFSクラスターに同時にアクセスする必要がある場合は、krb5.confをマージする必要があり、基本要件は以下の通りです:
-
[realms]: すべてのクラスターのRealmsとKDC IPsを記述します。 -
[domain_realm]: ドメインまたはIPからRealmへのマッピングを記述します。 -
[libdefaults]: 統一された暗号化アルゴリズム(des3-cbc-sha1など)。
-
-
例:
[libdefaults]
default_realm = LABS.TERADATA.COM
allow_weak_crypto = true
dns_lookup_realm = true
dns_lookup_kdc = true
[realms]
LABS.TERADATA.COM = {
kdc = 127.0.0.1
admin_server = 127.0.0.1
}
OTHERREALM.COM = {
kdc = 127.0.0.1
admin_server = 127.0.0.1
}
[domain_realm]
presto-master.docker.cluster = LABS.TERADATA.COM
hadoop-master-2 = OTHERREALM.COM
.labs.teradata.com = LABS.TERADATA.COM
.otherrealm.com = OTHERREALM.COM -
krb5.confを対応するDockerディレクトリにコピーします:cp doris-krb5.conf ~/doris-kerberos/krb5.conf
3. Docker Kerberos環境を開始する
-
ディレクトリに移動する:
cd docker/thirdparties -
Kerberos環境を開始する:
./run-thirdparties-docker.sh -c kerberos -
起動後のサービスには以下が含まれます:
- Hive Metastore 1:9583
- Hive Metastore 2:9683
- HDFS 1:8520
- HDFS 2:8620
4. コンテナIPの取得
Docker IPを確認するには以下のコマンドを使用します:
docker inspect <container-name> | grep IPAddress
または、127.0.0.1 を直接使用してください(サービスがホストネットワークにマッピングされている場合)。
5. Kerberos Hive カタログ の作成
-
Hive Catalog1
CREATE CATALOG IF NOT EXISTS multi_kerberos_one
PROPERTIES (
"type" = "hms",
"hive.metastore.uris" = "thrift://127.0.0.1:9583",
"fs.defaultFS" = "hdfs://127.0.0.1:8520",
"hadoop.kerberos.min.seconds.before.relogin" = "5",
"hadoop.security.authentication" = "kerberos",
"hadoop.kerberos.principal" = "hive/presto-master.docker.cluster@LABS.TERADATA.COM",
"hadoop.kerberos.keytab" = "/mnt/disk1/gq/keytabs/keytabs/hive-presto-master.keytab",
"hive.metastore.sasl.enabled " = "true",
"hadoop.security.auth_to_local" = "RULE:[2:$1@$0](.*@LABS.TERADATA.COM)s/@.*//
RULE:[2:$1@$0](.*@OTHERLABS.TERADATA.COM)s/@.*//
RULE:[2:$1@$0](.*@OTHERREALM.COM)s/@.*//
DEFAULT",
"hive.metastore.kerberos.principal" = "hive/hadoop-master@LABS.TERADATA.COM"
); -
Hive Catalog2
CREATE CATALOG IF NOT EXISTS multi_kerberos_two
PROPERTIES (
"type" = "hms",
"hive.metastore.uris" = "thrift://127.0.0.1:9683",
"fs.defaultFS" = "hdfs://127.0.0.1:8620",
"hadoop.kerberos.min.seconds.before.relogin" = "5",
"hadoop.security.authentication" = "kerberos",
"hadoop.kerberos.principal" = "hive/presto-master.docker.cluster@OTHERREALM.COM",
"hadoop.kerberos.keytab" = "/mnt/disk1/gq/keytabs/keytabs/other-hive-presto-master.keytab",
"hive.metastore.sasl.enabled " = "true",
"hadoop.security.auth_to_local" = "RULE:[2:$1@$0](.*@OTHERREALM.COM)s/@.*//
RULE:[2:$1@$0](.*@OTHERLABS.TERADATA.COM)s/@.*//
DEFAULT",
"hive.metastore.kerberos.principal" = "hive/hadoop-master-2@OTHERREALM.COM"
);
この時点で、マルチKerberosクラスターアクセス設定は完了です。両方のHiveクラスターからデータを表示し、異なるKerberos認証情報を使用できます。
接続テストツール
Kerberosなどの外部依存関係への接続を検証するために、オープンソースツールPulseを使用できます。
Pulseは独立したオープンソースの接続テストツールです。使用方法、インストール詳細、リリース情報については、プロジェクトのドキュメントを参照してください。
- ドキュメント: Kerberos Connectivity Tool
- リリースパッケージ: Kerberos Connectivity Tool v1.0.0
FAQ
-
javax.security.sasl.SaslException: No common protection layer between client and server
- 原因: クライアントの
hadoop.rpc.protectionがHDFSクラスターの設定と異なります。 - 修正: クライアントとHDFSサーバー間で
hadoop.rpc.protectionを一致させてください。
- 原因: クライアントの
-
No valid credentials provided (Mechanism level: Illegal key size)
- 原因: Javaはデフォルトで128ビットより大きい暗号化キーをサポートしていません。
- 修正: Java Cryptography Extension (JCE) Unlimited Strength Policyをインストールし、JARファイルを
$JAVA_HOME/jre/lib/securityに展開してサービスを再起動してください。
-
Encryption type AES256 CTS mode with HMAC SHA1-96 is not supported/enabled
- 原因: 現在のJava環境にAES256サポートがない一方で、KerberosがAES256を使用している可能性があります。
- 修正:
/etc/krb5.confの[libdefaults]でサポートされている暗号を使用するよう更新するか、JCE拡張機能をインストールしてAES256を有効にしてください(上記と同様)。
-
No valid credentials provided (Mechanism level: Failed to find any Kerberos tgt)
- 原因: KerberosがTicket Granting Ticket (TGT)を見つけることができません。以前動作していた設定では、チケットが期限切れになったかKDCが再起動しました。新しい設定では、
krb5.confまたはkeytabが不正確または破損しています。 - 修正:
krb5.confとkeytabを検証し、チケットが有効であることを確認して、kinitを実行して新しいチケットを取得してください。
- 原因: KerberosがTicket Granting Ticket (TGT)を見つけることができません。以前動作していた設定では、チケットが期限切れになったかKDCが再起動しました。新しい設定では、
-
Failure unspecified at GSS-API level (Mechanism level: Checksum failed)
- 原因: GSS-APIチェックサム失敗。
kinitで間違ったパスワードを使用した。keytabが無効であるか古いキーバージョンを持っているため、JVMがパスワードログインにフォールバックしています。 - 修正:
kinitで正しいパスワードを使用し、keytabが最新かつ有効であることを確認してください。
- 原因: GSS-APIチェックサム失敗。
-
Receive timed out
- 原因: 不安定なネットワークまたは大きなパケットでKDCとの通信にUDPを使用しています。
- 修正:
/etc/krb5.confに以下を追加してKerberosにTCPの使用を強制してください:
[libdefaults]
udp_preference_limit = 1
-
javax.security.auth.login.LoginException: Unable to obtain password from user
- 原因: Principalがkeytabと一致しないか、アプリケーションが
krb5.confまたはkeytabを読み取れません。 - 修正方法:
klist -kt <keytab_file>とkinit -kt <keytab_file> <principal>を使用してkeytabとprincipalを検証してください。- ランタイムユーザーが読み取れるように、
krb5.confとkeytabのパスと権限を確認してください。 - JVMスタートアップオプションで正しい設定パスが指定されていることを確認してください。
- 原因: Principalがkeytabと一致しないか、アプリケーションが
-
Principal not found or Could not resolve Kerberos principal name
- 原因:
- principal内のホスト名が解決できません。
_HOSTプレースホルダーがKDCに不明なホスト名に展開されます。- DNSまたは
/etc/hostsが正しく設定されていません。
- 修正方法:
- principalのスペルを確認してください。
- 関連するすべてのノード(Doris FE/BEとKDC)に正しいホスト名-IPエントリがあることを確認してください。
- 原因:
-
Cannot find KDC for realm "XXX"
- 原因: 指定されたrealmに
krb5.confでKDCが設定されていません。 - 修正方法:
[realms]下のrealm名を確認してください。kdcアドレスを確認してください。/etc/krb5.confを変更した後、BEとFEを再起動してください。
- 原因: 指定されたrealmに
-
Request is a replay
- 原因: KDCが認証リクエストが重複していると判断します。典型的な理由: ノード間のクロックスキューまたは同一principalを共有する複数のサービス。
- 修正方法:
- すべてのノードでNTPを有効にして時刻を同期させてください。
- 共有を避けるため、
service/_HOST@REALMなどのサービスインスタンスごとに一意のprincipalを使用してください。
- クライアント not found in Kerberos database
- 原因: クライアントprincipalがKerberosデータベースに存在しません。
- 修正方法: KDCでprincipalを作成してください。
- Message stream modified (41)
- 原因: 特定のOS(例:CentOS 7)とKerberos/Javaの組み合わせに関する既知の問題です。
- 修正方法: ベンダーパッチまたはセキュリティアップデートを適用してください。
- Pre-authentication information was invalid (24)
- 原因:
- 無効な事前認証データ。
- クライアントとKDC間のクロックスキュー。
- JDK暗号設定がKDCと一致しない。
- 修正方法:
- すべてのノード間で時刻を同期してください。
- 暗号設定を合わせてください。