TiSpark 测试数据项目教程

2024-08-07 23:50:02作者：胡易黎Nicole

1. 项目的目录结构及介绍

TiSpark 测试数据项目的目录结构如下：

tispark-test-data/
├── data/
│   ├── tpch_001/
│   │   ├── customer.tbl
│   │   ├── lineitem.tbl
│   │   ├── nation.tbl
│   │   ├── orders.tbl
│   │   ├── part.tbl
│   │   ├── partsupp.tbl
│   │   ├── region.tbl
│   │   └── supplier.tbl
│   └── tpch_002/
│       ├── customer.tbl
│       ├── lineitem.tbl
│       ├── nation.tbl
│       ├── orders.tbl
│       ├── part.tbl
│       ├── partsupp.tbl
│       ├── region.tbl
│       └── supplier.tbl
├── README.md
└── scripts/
    └── load_tpch_data.sh

目录结构介绍

data/：包含多个版本的 TPC-H 测试数据。每个子目录（如 tpch_001/ 和 tpch_002/）包含一组完整的 TPC-H 数据文件。
scripts/：包含用于加载测试数据的脚本。
README.md：项目说明文档。

2. 项目的启动文件介绍

项目的启动文件主要是 scripts/load_tpch_data.sh。

`load_tpch_data.sh` 介绍

该脚本用于将 TPC-H 测试数据加载到 TiDB 数据库中。使用方法如下：

./scripts/load_tpch_data.sh <database_name> <data_directory>

<database_name>：目标数据库名称。
<data_directory>：包含 TPC-H 数据文件的目录路径。

例如：

./scripts/load_tpch_data.sh tpch_test data/tpch_001

3. 项目的配置文件介绍

项目中没有显式的配置文件，但可以通过修改 load_tpch_data.sh 脚本来进行一些自定义配置。

自定义配置示例

假设你需要修改数据库连接信息，可以在 load_tpch_data.sh 中找到以下部分并进行修改：

# 数据库连接信息
DB_HOST="127.0.0.1"
DB_PORT="4000"
DB_USER="root"
DB_PASSWORD=""

根据实际需求修改 DB_HOST、DB_PORT、DB_USER 和 DB_PASSWORD 的值。

以上是 TiSpark 测试数据项目的教程，涵盖了项目的目录结构、启动文件和配置文件的介绍。希望对你有所帮助！

登录后查看全文