サンプルデータカタログ
概要
| カタログ | 説明 | 適用シナリオ |
|---|---|---|
| TPCDS | TPC-DSベンチマークデータ。小売業の意思決定支援シナリオをシミュレートし、24のTableを含む。 | 複雑な分析クエリ、データウェアハウスのパフォーマンステスト。 |
| TPCH | TPC-Hベンチマークデータ。ビジネス意思決定シナリオをシミュレートし、8のTableを含む。 | OLAPクエリのパフォーマンステスト、入門学習。 |
これらのCatalogは動的なデータ生成をサポートします。生成されたデータをテスト用にVeloDB内部Table、IcebergTable、またはHiveTableに書き込むことができます。
Catalog作成
ステップ1:作成ページへ移動
- VeloDB Cloudコンソールにログインします。
- 左側のナビゲーションバーで、Catalogsをクリックします。
- Add 外部カタログボタンをクリックします。
- サンプル Dataカテゴリの下で、TPCDSまたはTPCHを選択します。
ステップ2:Catalogの設定
TPCDS設定

| フィールド | 必須 | 説明 |
|---|---|---|
| カタログ Name | ✓ | Catalogの一意の名前。 |
| Comment | オプションの説明情報。 | |
| Splits Count | ノードごとの同時実行数。デフォルトは32。 |
TPCH設定

| フィールド | 必須 | 説明 |
|---|---|---|
| カタログ Name | ✓ | Catalogの一意の名前。 |
| Comment | オプションの説明情報。 | |
| Splits Per Node | ノードごとの同時実行数。デフォルトは32。 |
ステップ3:作成の確認
Confirmボタンをクリックして作成を完了します。
Catalogの使用
利用可能なデータの表示
-- View databases (datasets of different scales)
SHOW DATABASES FROM tpcds_catalog;
-- Result example: sf1, sf10, sf100, sf1000 ...
-- View tables
SHOW TABLES FROM tpcds_catalog.sf1;
データベース名のsfはScale Factorを表します:
sf1: 約1GBのデータsf10: 約10GBのデータsf100: 約100GBのデータsf1000: 約1TBのデータ
Query サンプル Data
-- Query TPCH data
SELECT * FROM tpch_catalog.sf1.customer LIMIT 10;
-- Query TPCDS data
SELECT * FROM tpcds_catalog.sf1.store_sales LIMIT 10;
VeloDBTableへのデータの書き込み
-- Create VeloDB table and import TPCH data
CREATE TABLE my_db.customer AS
SELECT * FROM tpch_catalog.sf1.customer;
-- Or use INSERT INTO
INSERT INTO my_db.lineitem
SELECT * FROM tpch_catalog.sf10.lineitem;
TPCHTable構造
| Table Name | デスクリプション |
|---|---|
| customer | 顧客情報 |
| lineitem | 注文詳細 |
| nation | 国 |
| orders | 注文 |
| part | 部品 |
| partsupp | 部品サプライヤー |
| region | 地域 |
| supplier | サプライヤー |
TPCDSTable構造
TPCDSには24のTableが含まれており、小売シナリオをシミュレートします:
| Category | Table Name |
|---|---|
| Fact Tables | store_sales, store_returns, catalog_sales, catalog_returns, web_sales, web_returns, inventory |
| Dimension Tables | customer, customer_address, customer_demographics, date_dim, time_dim, item, store, catalog_page, web_page, web_site, warehouse, promotion, household_demographics, income_band, ship_mode, reason, call_center |