メインコンテンツまでスキップ
バージョン: 4.x

サンプルデータカタログ

概要

カタログ説明適用シナリオ
TPCDSTPC-DSベンチマークデータ。小売業の意思決定支援シナリオをシミュレートし、24のTableを含む。複雑な分析クエリ、データウェアハウスのパフォーマンステスト。
TPCHTPC-Hベンチマークデータ。ビジネス意思決定シナリオをシミュレートし、8のTableを含む。OLAPクエリのパフォーマンステスト、入門学習。

これらのCatalogは動的なデータ生成をサポートします。生成されたデータをテスト用にVeloDB内部Table、IcebergTable、またはHiveTableに書き込むことができます。

Catalog作成

ステップ1:作成ページへ移動

  1. VeloDB Cloudコンソールにログインします。
  2. 左側のナビゲーションバーで、Catalogsをクリックします。
  3. Add 外部カタログボタンをクリックします。
  4. サンプル Dataカテゴリの下で、TPCDSまたはTPCHを選択します。

ステップ2:Catalogの設定

TPCDS設定

sample-1

フィールド必須説明
カタログ NameCatalogの一意の名前。
Commentオプションの説明情報。
Splits Countノードごとの同時実行数。デフォルトは32。

TPCH設定

sample-2

フィールド必須説明
カタログ NameCatalogの一意の名前。
Commentオプションの説明情報。
Splits Per Nodeノードごとの同時実行数。デフォルトは32。

ステップ3:作成の確認

Confirmボタンをクリックして作成を完了します。

Catalogの使用

利用可能なデータの表示

-- View databases (datasets of different scales)
SHOW DATABASES FROM tpcds_catalog;
-- Result example: sf1, sf10, sf100, sf1000 ...

-- View tables
SHOW TABLES FROM tpcds_catalog.sf1;

データベース名のsfはScale Factorを表します:

  • sf1: 約1GBのデータ
  • sf10: 約10GBのデータ
  • sf100: 約100GBのデータ
  • sf1000: 約1TBのデータ

Query サンプル Data

-- Query TPCH data
SELECT * FROM tpch_catalog.sf1.customer LIMIT 10;

-- Query TPCDS data
SELECT * FROM tpcds_catalog.sf1.store_sales LIMIT 10;

VeloDBTableへのデータの書き込み

-- Create VeloDB table and import TPCH data
CREATE TABLE my_db.customer AS
SELECT * FROM tpch_catalog.sf1.customer;

-- Or use INSERT INTO
INSERT INTO my_db.lineitem
SELECT * FROM tpch_catalog.sf10.lineitem;

TPCHTable構造

Table Nameデスクリプション
customer顧客情報
lineitem注文詳細
nation
orders注文
part部品
partsupp部品サプライヤー
region地域
supplierサプライヤー

TPCDSTable構造

TPCDSには24のTableが含まれており、小売シナリオをシミュレートします:

CategoryTable Name
Fact Tablesstore_sales, store_returns, catalog_sales, catalog_returns, web_sales, web_returns, inventory
Dimension Tablescustomer, customer_address, customer_demographics, date_dim, time_dim, item, store, catalog_page, web_page, web_site, warehouse, promotion, household_demographics, income_band, ship_mode, reason, call_center