メインコンテンツまでスキップ
バージョン: 26.x

VeloDB Cloud クイックスタート

このガイドでは、VeloDB Cloudを数分で開始する手順を説明します。warehouseを作成し、600万行のSSB-Flatベンチマークデータセットをロードし、分析クエリを実行します。

備考

クレジットカードは不要です。 VeloDB CloudはSaaS warehouseで14日間の無料トライアルを提供します。


1. アカウントの作成

velodb.cloudにアクセスし、お好みの方法でサインアップしてください:

  • Google - Googleアカウントによるシングルサインオン
  • Microsoft - Microsoftアカウントによるシングルサインオン
  • Email - 従来のメールとパスワードによる登録

Sign up for VeloDB Cloud


2. デプロイメントモードの選択

サインイン後、2つのデプロイメントオプションが表示されます:

モード説明無料トライアル
SaaSVeloDBのクラウドで完全管理されたwarehouse14日間
BYOC独自のAWS/Azureアカウントでのデプロイ30日間の無料サービス

このクイックスタートでは、SaaSの14日間無料トライアルを開始をクリックしてください。

Choose deployment mode


3. Warehouseの作成

以下の設定でwarehouseを設定してください:

設定推奨値
Warehouse Namevelodb-quickstart
Cloud PlatformAWS
Region最寄りのリージョンを選択
Zone利用可能な任意のゾーン
Admin Passwordセキュアなパスワード
警告

重要: 管理者パスワードを覚えておいてください。warehouseに接続する際に必要になります。

初期クラスターには以下が含まれます:

  • 4 vCPU、32 GB RAMのコンピュート
  • 200 GBのキャッシュストレージ

Createをクリックしてwarehouseをプロビジョニングします。

Create warehouse configuration Warehouse initialization settings

備考

VeloDBはwarehouseを3~5分でプロビジョニングします。完了すると、ステータスがRunningに変わります。

Warehouse provisioning


4. Warehouseへの接続

サイドバーのConnectionsに移動して接続詳細を確認してください:

Connection information

接続方法

VeloDB Consoleサイドバーの内蔵Queryエディターを使用して、ブラウザベースのSQLアクセスを行います。セットアップは不要です。

接続の確認

SHOW DATABASES;

期待される出力:

+--------------------+
| Database |
+--------------------+
| information_schema |
+--------------------+

5. SSB-Flat ベンチマークデータセットをロードする

分析用に公開された SSB-Flat SF1 データセット(600万行)をご用意しました。この非正規化された Star Schema Benchmark データセットは分析クエリに最適です。

備考

認証情報は不要です! サンプルデータバケットは VeloDB から公開でアクセス可能です。

S3 からデータをプレビューする

ロードする前に、S3 から直接データをプレビューします。最適なパフォーマンスを得るために、お使いのウェアハウスリージョンに対応するタブを選択してください:

SELECT
lo_orderkey,
lo_orderdate,
c_name,
c_nation,
lo_revenue,
p_brand
FROM S3(
"uri" = "s3://velodb-import-data-us-east-1/ssb-flat-sf1/ssb_flat_001.parquet",
"format" = "parquet",
"s3.endpoint" = "s3.us-east-1.amazonaws.com",
"s3.region" = "us-east-1"
)
LIMIT 5;

データベースとテーブルの作成

-- Create database
CREATE DATABASE IF NOT EXISTS ssb;
USE ssb;

-- Create the SSB flat table
CREATE TABLE IF NOT EXISTS ssb_flat (
lo_orderkey BIGINT NOT NULL,
lo_linenumber BIGINT NOT NULL,
lo_custkey BIGINT NOT NULL,
lo_partkey BIGINT NOT NULL,
lo_suppkey BIGINT NOT NULL,
lo_orderdate DATE NOT NULL,
lo_commitdate DATE NOT NULL,
lo_orderpriority VARCHAR(15) NOT NULL,
lo_shippriority BIGINT NOT NULL,
lo_shipmode VARCHAR(10) NOT NULL,
lo_year INT NOT NULL,
lo_month INT NOT NULL,
lo_weeknum INT NOT NULL,
d_datekey BIGINT NOT NULL,
d_dayofweek VARCHAR(10) NOT NULL,
d_month VARCHAR(10) NOT NULL,
d_yearmonth VARCHAR(10) NOT NULL,
lo_quantity BIGINT NOT NULL,
lo_extendedprice DOUBLE NOT NULL,
lo_discount DOUBLE NOT NULL,
lo_revenue DOUBLE NOT NULL,
lo_supplycost DOUBLE NOT NULL,
lo_tax DOUBLE NOT NULL,
c_custkey BIGINT NOT NULL,
c_name VARCHAR(25) NOT NULL,
c_nation VARCHAR(15) NOT NULL,
c_region VARCHAR(12) NOT NULL,
c_city VARCHAR(10) NOT NULL,
c_mktsegment VARCHAR(10) NOT NULL,
s_suppkey BIGINT NOT NULL,
s_name VARCHAR(25) NOT NULL,
s_nation VARCHAR(15) NOT NULL,
s_region VARCHAR(12) NOT NULL,
s_city VARCHAR(10) NOT NULL,
p_partkey BIGINT NOT NULL,
p_name VARCHAR(22) NOT NULL,
p_brand VARCHAR(9) NOT NULL,
p_category VARCHAR(7) NOT NULL,
p_mfgr VARCHAR(6) NOT NULL,
p_color VARCHAR(11) NOT NULL,
p_type VARCHAR(25) NOT NULL,
p_size BIGINT NOT NULL,
p_container VARCHAR(10) NOT NULL,
INDEX idx_p_type (p_type) USING INVERTED PROPERTIES("parser" = "english")
)
DUPLICATE KEY(lo_orderkey)
DISTRIBUTED BY HASH(lo_orderkey) BUCKETS 48;

データの読み込み

ヒント

最適なパフォーマンスを得るために、ウェアハウスと同じリージョンのS3バケットを使用してください。

INSERT INTO ssb.ssb_flat
SELECT * FROM S3(
"uri" = "s3://velodb-import-data-us-east-1/ssb-flat-sf1/*.parquet",
"format" = "parquet",
"s3.endpoint" = "s3.us-east-1.amazonaws.com",
"s3.region" = "us-east-1"
);
備考

600万行の読み込みには約30秒から1分かかります。

読み込みの確認

SELECT COUNT(*) AS total_rows FROM ssb.ssb_flat;

期待される出力:

+------------+
| total_rows |
+------------+
| 6000000 |
+------------+

6. 分析クエリの実行

それでは、データセットに対していくつかの分析クエリを実行してみましょう。

クエリ1: リアルタイム集計

顧客地域別に売上と割引メトリクスを集計します:

SELECT
c_region,
COUNT(*) AS order_count,
SUM(lo_revenue) AS total_revenue,
AVG(lo_discount) AS avg_discount
FROM ssb.ssb_flat
GROUP BY c_region
ORDER BY total_revenue DESC;

Query 2: Window Functions - 前年同期比成長

ウィンドウ関数を使用して前年同期比の売上成長を計算する:

SELECT
lo_year,
SUM(lo_revenue) AS yearly_revenue,
LAG(SUM(lo_revenue)) OVER (ORDER BY lo_year) AS prev_year_revenue,
ROUND(
(SUM(lo_revenue) - LAG(SUM(lo_revenue)) OVER (ORDER BY lo_year))
/ LAG(SUM(lo_revenue)) OVER (ORDER BY lo_year) * 100,
2
) AS yoy_growth_pct
FROM ssb.ssb_flat
GROUP BY lo_year
ORDER BY lo_year;

Query 3: CTEを使用した複合BI

Common Table Expressionを使用して地域別利益階層を分析する:

WITH regional_stats AS (
SELECT
c_region,
s_region,
SUM(lo_revenue) AS revenue,
SUM(lo_supplycost) AS cost,
SUM(lo_revenue - lo_supplycost) AS profit
FROM ssb.ssb_flat
GROUP BY c_region, s_region
)
SELECT
c_region,
s_region,
revenue,
profit,
CASE
WHEN profit > 1000000000 THEN 'High'
WHEN profit > 500000000 THEN 'Medium'
ELSE 'Low'
END AS profit_tier
FROM regional_stats
ORDER BY profit DESC;

Query 4: 自己結合による期間比較

自己結合を使用して1997年と1993年の収益を比較する:

SELECT
t1.c_nation,
t1.revenue_1997,
t2.revenue_1993,
ROUND((t1.revenue_1997 - t2.revenue_1993) / t2.revenue_1993 * 100, 2) AS growth_pct
FROM (
SELECT c_nation, SUM(lo_revenue) AS revenue_1997
FROM ssb.ssb_flat
WHERE lo_year = 1997
GROUP BY c_nation
) t1
JOIN (
SELECT c_nation, SUM(lo_revenue) AS revenue_1993
FROM ssb.ssb_flat
WHERE lo_year = 1993
GROUP BY c_nation
) t2 ON t1.c_nation = t2.c_nation
ORDER BY growth_pct DESC;

Query 5: 全文検索

転置インデックスを使用して、製品タイプに「STEEL」を含む製品を検索する:

SELECT
p_type,
p_brand,
COUNT(*) AS product_count,
SUM(lo_revenue) AS total_revenue
FROM ssb.ssb_flat
WHERE p_type MATCH 'STEEL'
GROUP BY p_type, p_brand
ORDER BY total_revenue DESC
LIMIT 10;

次のステップ