首页
/ ClickHouseDB FDW 使用指南:PostgreSQL与ClickHouse数据集成方案

ClickHouseDB FDW 使用指南:PostgreSQL与ClickHouse数据集成方案

2025-07-08 08:04:44作者:范靓好Udolf

前言

在现代数据架构中,经常需要将不同数据库系统的数据进行集成和分析。ClickHouseDB FDW(Foreign Data Wrapper)为PostgreSQL用户提供了一个强大的工具,使其能够直接查询ClickHouse数据库中的数据,而无需进行复杂的数据迁移或ETL过程。

安装与基础配置

在开始使用ClickHouseDB FDW之前,需要确保已经完成以下准备工作:

  1. 安装PostgreSQL数据库(建议使用较新版本)
  2. 安装ClickHouse数据库
  3. 安装ClickHouse ODBC驱动

完成基础环境准备后,在PostgreSQL中创建扩展:

CREATE EXTENSION clickhousedb_fdw;

示例数据准备

为了更好地演示功能,我们首先在ClickHouse中创建示例数据库和表结构:

CREATE DATABASE test_database;

USE test_database;

CREATE TABLE tax_bills_nyc (
    bbl Int64,
    owner_name String,
    address String,
    tax_class String,
    tax_rate String,
    emv Float64,
    tbea Float64,
    bav Float64,
    tba String,
    property_tax String,
    condonumber String,
    condo String,
    insertion_date DateTime MATERIALIZED now()
) ENGINE = MergeTree PARTITION BY tax_class ORDER BY (owner_name);

然后导入示例数据:

curl -X GET 'http://taxbills.nyc/tax_bills_june15_bbls.csv' | \
clickhouse-client --input_format_allow_errors_num=10 \
--query="INSERT INTO test_database.tax_bills_nyc FORMAT CSV"

PostgreSQL端配置

在PostgreSQL中,我们需要配置外部服务器、用户映射和外部表:

-- 创建外部服务器连接
CREATE SERVER clickhouse_svr 
FOREIGN DATA WRAPPER clickhousedb_fdw 
OPTIONS(
    dbname 'test_database', 
    driver '/path/to/libclickhouseodbc.so', 
    host '127.0.0.1'
);

-- 创建用户映射
CREATE USER MAPPING FOR CURRENT_USER SERVER clickhouse_svr;

-- 创建外部表映射
CREATE FOREIGN TABLE tax_bills_nyc (
    bbl int8,
    owner_name text,
    address text,
    tax_class text,
    tax_rate text,
    emv Float,
    tbea Float,
    bav Float,
    tba text,
    property_tax text,
    condonumber text,
    condo text,
    insertion_date Time
) SERVER clickhouse_svr;

基本查询操作

配置完成后,可以像查询普通PostgreSQL表一样查询ClickHouse数据:

SELECT bbl, tbea, bav, insertion_date 
FROM tax_bills_nyc 
LIMIT 5;

高级功能

聚合下推(Aggregate Pushdown)

ClickHouseDB FDW支持聚合下推功能,可以将聚合操作下推到ClickHouse执行,显著提高性能:

-- 聚合操作在PostgreSQL端执行
EXPLAIN VERBOSE SELECT count(bbl) FROM tax_bills_nyc LIMIT 5;

-- 聚合操作下推到ClickHouse执行
EXPLAIN VERBOSE SELECT count(bbl) FROM tax_bills_nyc;

连接下推(Join Pushdown)

同样支持连接操作的下推,减少数据传输量:

EXPLAIN VERBOSE 
SELECT t2.bbl, t2.owner_name, t1.bav 
FROM tax_bills_nyc t1 
RIGHT OUTER JOIN tax_bills t2 ON (t1.bbl = t2.bbl);

性能优化建议

  1. 合理设计分区键:在ClickHouse端根据查询模式设计合理的分区策略
  2. 使用下推功能:尽可能利用聚合下推和连接下推减少数据传输
  3. 数据类型映射:注意PostgreSQL和ClickHouse之间的数据类型差异
  4. 网络优化:确保PostgreSQL和ClickHouse服务器之间的网络连接稳定高效

当前限制

  1. 不支持所有ClickHouse配置参数的映射
  2. 复杂连接下推的支持有限
  3. 从ClickHouse分区删除数据的支持不完善

结语

ClickHouseDB FDW为PostgreSQL用户提供了访问ClickHouse数据的便捷通道,特别适合需要在PostgreSQL中分析ClickHouse海量数据的场景。通过合理使用其高级功能,可以构建高效的数据分析管道,充分发挥两种数据库各自的优势。

登录后查看全文
热门项目推荐

项目优选

收起
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
176
261
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
860
511
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
129
182
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
259
300
ShopXO开源商城ShopXO开源商城
🔥🔥🔥ShopXO企业级免费开源商城系统,可视化DIY拖拽装修、包含PC、H5、多端小程序(微信+支付宝+百度+头条&抖音+QQ+快手)、APP、多仓库、多商户、多门店、IM客服、进销存,遵循MIT开源协议发布、基于ThinkPHP8框架研发
JavaScript
93
15
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
332
1.08 K
HarmonyOS-ExamplesHarmonyOS-Examples
本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
398
371
note-gennote-gen
一款跨平台的 Markdown AI 笔记软件,致力于使用 AI 建立记录和写作的桥梁。
TSX
83
4
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.07 K
0
kernelkernel
deepin linux kernel
C
22
5