首页
/ Apache Doris 集成存储计算集群手动部署指南

Apache Doris 集成存储计算集群手动部署指南

2025-06-27 03:01:40作者:曹令琨Iris

概述

Apache Doris 是一款高性能、实时的分析型数据库,采用 MPP(大规模并行处理)架构设计。本文将详细介绍如何手动部署 Apache Doris 的集成存储计算集群,帮助用户快速搭建生产环境。

集群架构简介

Apache Doris 采用集成存储计算架构,主要包含两类节点:

  1. FE(Frontend)节点:负责元数据管理、集群管理、查询解析和调度
  2. BE(Backend)节点:负责数据存储和计算执行

这种架构设计使得 Doris 能够同时提供高效的查询性能和强大的扩展能力。

部署前准备

在开始部署前,请确保已完成以下准备工作:

  1. 硬件环境检查:确认服务器配置满足要求
  2. 操作系统检查:确保系统参数配置正确
  3. 网络规划:确定各节点IP地址和端口分配
  4. 软件准备:下载对应版本的 Doris 安装包

详细部署步骤

第一步:部署 FE Master 节点

1. 创建元数据目录

建议将 FE 元数据存储在独立磁盘上,与 BE 数据存储分离:

# 创建专用元数据目录
mkdir -p /data/doris-meta

# 创建符号链接(如使用默认目录结构)
ln -s /data/doris-meta /path/to/doris/fe/doris-meta

2. 配置 FE 参数

编辑 conf/fe.conf 文件,关键配置项包括:

# JVM 堆内存设置(生产环境建议16GB以上)
JAVA_OPTS="-Xmx16384m -XX:+UseMembar -XX:SurvivorRatio=8"

# 表名大小写敏感设置(建议设为1,不敏感)
lower_case_table_names = 1

# 网络CIDR配置(根据实际网络规划)
priority_networks = 10.1.3.0/24

# JDK路径设置
JAVA_HOME = /usr/local/jdk

3. 启动 FE 进程

./bin/start_fe.sh --daemon

4. 验证 FE 状态

使用 MySQL 客户端连接并检查状态:

mysql -uroot -P9030 -h127.0.0.1
> SHOW FRONTENDS\G

重点关注 AliveJoinIsMaster 字段状态。

第二步:扩展 FE 集群(可选)

生产环境建议部署至少3个 FE 节点(1 Master + 2 Follower)。

1. 添加 Follower 节点

在 Master FE 上执行:

ALTER SYSTEM ADD FOLLOWER "follower_ip:9010";

2. 启动 Follower 节点

在新节点上执行:

./bin/start_fe.sh --helper master_ip:9010 --daemon

3. 验证集群状态

SHOW FRONTENDS;

第三步:部署 BE 节点

1. 创建数据目录

mkdir -p /data1/doris-storage
mkdir -p /data2/doris-storage

2. 配置 BE 参数

编辑 conf/be.conf

# 存储路径配置(支持多磁盘)
storage_root_path=/data1/doris-storage,medium:HDD;/data2/doris-storage,medium:SSD

# 网络CIDR配置
priority_networks = 10.1.3.0/24

3. 注册 BE 节点

在 FE 上执行:

ALTER SYSTEM ADD BACKEND "be_ip:9050";

4. 启动 BE 进程

./bin/start_be.sh --daemon

5. 验证 BE 状态

SHOW BACKENDS;

第四步:集群完整性验证

1. 修改 root 密码

SET PASSWORD = PASSWORD('your_new_password');

2. 创建测试表

CREATE DATABASE test_db;
USE test_db;

CREATE TABLE test_table (
    id INT,
    name VARCHAR(50),
    value DOUBLE
)
DISTRIBUTED BY HASH(id) BUCKETS 10;

3. 数据操作测试

-- 插入数据
INSERT INTO test_table VALUES 
(1, 'item1', 10.5),
(2, 'item2', 20.3);

-- 查询验证
SELECT * FROM test_table;

生产环境建议

  1. FE 节点:至少部署3个节点,确保高可用
  2. BE 节点:根据数据量和查询负载确定节点数量
  3. 监控:部署监控系统,定期检查集群健康状态
  4. 备份:建立定期元数据备份机制

常见问题排查

  1. FE 启动失败:检查 log/fe.log 中的错误信息
  2. BE 无法加入集群:确认网络连通性和端口开放情况
  3. 查询性能问题:检查 BE 节点负载和数据分布情况

总结

通过本文的步骤,您已经成功部署了一个 Apache Doris 集成存储计算集群。这种架构设计使得 Doris 能够充分发挥 MPP 架构的优势,提供高性能的分析能力。在实际生产环境中,建议根据业务需求进一步优化配置参数,并建立完善的监控和维护机制。

登录后查看全文
热门项目推荐

热门内容推荐

最新内容推荐

项目优选

收起
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
136
187
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
880
520
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
361
381
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
181
264
kernelkernel
deepin linux kernel
C
22
5
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
7
0
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.09 K
0
note-gennote-gen
一款跨平台的 Markdown AI 笔记软件,致力于使用 AI 建立记录和写作的桥梁。
TSX
83
4
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
613
60
open-eBackupopen-eBackup
open-eBackup是一款开源备份软件,采用集群高扩展架构,通过应用备份通用框架、并行备份等技术,为主流数据库、虚拟化、文件系统、大数据等应用提供E2E的数据备份、恢复等能力,帮助用户实现关键数据高效保护。
HTML
118
78