メインコンテンツまでスキップ
バージョン: 4.x

VeloDB Cloud クイックスタート

このガイドでは、VeloDB Cloud を数分で開始する手順を説明します。warehouseを作成し、600万行のSSB-Flatベンチマークデータセットを読み込み、分析クエリを実行します。

備考

クレジットカードは不要です。 VeloDB Cloud では、SaaS warehouse向けに14日間の無料トライアルを提供しています。


1. アカウントを作成する

velodb.cloud にアクセスし、お好みの方法でサインアップしてください:

  • Google - Googleアカウントでのシングルサインオン
  • Microsoft - Microsoftアカウントでのシングルサインオン
  • Email - 従来のメールアドレスとパスワードによる登録

Sign up for VeloDB Cloud


2. デプロイメントモードを選択する

サインイン後、2つのデプロイメントオプションが表示されます:

モード説明無料トライアル
SaaSVeloDBのクラウドで完全管理されたwarehouse14日間
BYOC独自のAWS/Azureアカウントにデプロイ30日間無料サービス

このクイックスタートでは、SaaS下の Start 14-day Free Trial をクリックしてください。

Choose deployment mode


3. warehouseを作成する

以下の設定でwarehouseを構成します:

設定推奨値
Warehouse Namevelodb-quickstart
Cloud PlatformAWS
Region最寄りのリージョンを選択
Zone利用可能な任意のゾーン
Admin Passwordセキュアなパスワード
警告

重要: 管理者パスワードを記録してください。warehouseに接続する際に必要になります。

初期クラスターには以下が含まれます:

  • 4 vCPU、32 GB RAM コンピュート
  • 200 GB キャッシュストレージ

Create をクリックしてwarehouseをプロビジョニングします。

Create warehouse configuration Warehouse initialization settings

備考

VeloDBはwarehouseを3〜5分でプロビジョニングします。完了すると、ステータスが Running に変わります。

Warehouse provisioning


4. warehouseに接続する

サイドバーの Connections に移動して、接続の詳細を確認します:

Connection information

接続方法

VeloDB Consoleサイドバーの組み込み Query エディターを使用して、ブラウザベースのSQLアクセスを行います。セットアップは不要です。

接続の確認

SHOW DATABASES;
+--------------------+
| Database |
+--------------------+
| information_schema |
+--------------------+

5. SSB-Flat Benchmark Datasetの読み込み

探索用に公開された SSB-Flat SF1 dataset(600万行)を準備しました。この非正規化されたStar Schema Benchmark datasetは、分析クエリに最適です。

備考

認証情報は不要です! サンプルデータbucketはVeloDBから公開でアクセス可能です。

S3からのデータプレビュー

読み込み前に、S3から直接データをプレビューします。最適なパフォーマンスのために、お使いのwarehouse regionに対応するタブを選択してください:

SELECT
lo_orderkey,
lo_orderdate,
c_name,
c_nation,
lo_revenue,
p_brand
FROM S3(
"uri" = "s3://velodb-import-data-us-east-1/ssb-flat-sf1/ssb_flat_001.parquet",
"format" = "parquet",
"s3.endpoint" = "s3.us-east-1.amazonaws.com",
"s3.region" = "us-east-1"
)
LIMIT 5;

データベースとTableの作成

-- Create database
CREATE DATABASE IF NOT EXISTS ssb;
USE ssb;

-- Create the SSB flat table
CREATE TABLE IF NOT EXISTS ssb_flat (
lo_orderkey BIGINT NOT NULL,
lo_linenumber BIGINT NOT NULL,
lo_custkey BIGINT NOT NULL,
lo_partkey BIGINT NOT NULL,
lo_suppkey BIGINT NOT NULL,
lo_orderdate DATE NOT NULL,
lo_commitdate DATE NOT NULL,
lo_orderpriority VARCHAR(15) NOT NULL,
lo_shippriority BIGINT NOT NULL,
lo_shipmode VARCHAR(10) NOT NULL,
lo_year INT NOT NULL,
lo_month INT NOT NULL,
lo_weeknum INT NOT NULL,
d_datekey BIGINT NOT NULL,
d_dayofweek VARCHAR(10) NOT NULL,
d_month VARCHAR(10) NOT NULL,
d_yearmonth VARCHAR(10) NOT NULL,
lo_quantity BIGINT NOT NULL,
lo_extendedprice DOUBLE NOT NULL,
lo_discount DOUBLE NOT NULL,
lo_revenue DOUBLE NOT NULL,
lo_supplycost DOUBLE NOT NULL,
lo_tax DOUBLE NOT NULL,
c_custkey BIGINT NOT NULL,
c_name VARCHAR(25) NOT NULL,
c_nation VARCHAR(15) NOT NULL,
c_region VARCHAR(12) NOT NULL,
c_city VARCHAR(10) NOT NULL,
c_mktsegment VARCHAR(10) NOT NULL,
s_suppkey BIGINT NOT NULL,
s_name VARCHAR(25) NOT NULL,
s_nation VARCHAR(15) NOT NULL,
s_region VARCHAR(12) NOT NULL,
s_city VARCHAR(10) NOT NULL,
p_partkey BIGINT NOT NULL,
p_name VARCHAR(22) NOT NULL,
p_brand VARCHAR(9) NOT NULL,
p_category VARCHAR(7) NOT NULL,
p_mfgr VARCHAR(6) NOT NULL,
p_color VARCHAR(11) NOT NULL,
p_type VARCHAR(25) NOT NULL,
p_size BIGINT NOT NULL,
p_container VARCHAR(10) NOT NULL,
INDEX idx_p_type (p_type) USING INVERTED PROPERTIES("parser" = "english")
)
DUPLICATE KEY(lo_orderkey)
DISTRIBUTED BY HASH(lo_orderkey) BUCKETS 48;

データの読み込み

ヒント

最適なパフォーマンスを得るには、ウェアハウスと同じリージョンのS3バケットを使用してください。

INSERT INTO ssb.ssb_flat
SELECT * FROM S3(
"uri" = "s3://velodb-import-data-us-east-1/ssb-flat-sf1/*.parquet",
"format" = "parquet",
"s3.endpoint" = "s3.us-east-1.amazonaws.com",
"s3.region" = "us-east-1"
);
備考

600万行の読み込みには約30秒から1分かかります。

読み込みの確認

SELECT COUNT(*) AS total_rows FROM ssb.ssb_flat;
+------------+
| total_rows |
+------------+
| 6000000 |
+------------+

6. 分析クエリの実行

それでは、データセットに対していくつかの分析クエリを実行しましょう。

Query 1: リアルタイム集計

顧客地域別に売上高と割引指標を集計します:

SELECT
c_region,
COUNT(*) AS order_count,
SUM(lo_revenue) AS total_revenue,
AVG(lo_discount) AS avg_discount
FROM ssb.ssb_flat
GROUP BY c_region
ORDER BY total_revenue DESC;

Query 2: Window Functions - YoY Growth

Window Functionsを使用して前年同期比の売上成長率を計算します:

SELECT
lo_year,
SUM(lo_revenue) AS yearly_revenue,
LAG(SUM(lo_revenue)) OVER (ORDER BY lo_year) AS prev_year_revenue,
ROUND(
(SUM(lo_revenue) - LAG(SUM(lo_revenue)) OVER (ORDER BY lo_year))
/ LAG(SUM(lo_revenue)) OVER (ORDER BY lo_year) * 100,
2
) AS yoy_growth_pct
FROM ssb.ssb_flat
GROUP BY lo_year
ORDER BY lo_year;

Query 3: CTEを使用した複雑なBI

Common Table Expressionを使用して地域別利益階層を分析する:

WITH regional_stats AS (
SELECT
c_region,
s_region,
SUM(lo_revenue) AS revenue,
SUM(lo_supplycost) AS cost,
SUM(lo_revenue - lo_supplycost) AS profit
FROM ssb.ssb_flat
GROUP BY c_region, s_region
)
SELECT
c_region,
s_region,
revenue,
profit,
CASE
WHEN profit > 1000000000 THEN 'High'
WHEN profit > 500000000 THEN 'Medium'
ELSE 'Low'
END AS profit_tier
FROM regional_stats
ORDER BY profit DESC;

Query 4: Self-Join Period Comparison

セルフジョインを使用して1997年と1993年の売上を比較する:

SELECT
t1.c_nation,
t1.revenue_1997,
t2.revenue_1993,
ROUND((t1.revenue_1997 - t2.revenue_1993) / t2.revenue_1993 * 100, 2) AS growth_pct
FROM (
SELECT c_nation, SUM(lo_revenue) AS revenue_1997
FROM ssb.ssb_flat
WHERE lo_year = 1997
GROUP BY c_nation
) t1
JOIN (
SELECT c_nation, SUM(lo_revenue) AS revenue_1993
FROM ssb.ssb_flat
WHERE lo_year = 1993
GROUP BY c_nation
) t2 ON t1.c_nation = t2.c_nation
ORDER BY growth_pct DESC;

Query 5: 全文検索

転置インデックスを使用して、商品タイプに"STEEL"を含む商品を検索します:

SELECT
p_type,
p_brand,
COUNT(*) AS product_count,
SUM(lo_revenue) AS total_revenue
FROM ssb.ssb_flat
WHERE p_type MATCH 'STEEL'
GROUP BY p_type, p_brand
ORDER BY total_revenue DESC
LIMIT 10;

次のステップ