Apache Doris 快速入门指南：从零开始体验实时分析数据库

2025-06-27 05:58:38作者：柏廷章Berta

前言

Apache Doris 是一款基于 MPP 架构的高性能、实时的分析型数据库，以其出色的查询性能、高并发能力和易用性著称。本文将详细介绍两种快速体验 Apache Doris 的方式：Docker 快速部署和本地二进制包部署，帮助开发者快速搭建测试环境。

部署方式选择警告

在开始之前，必须强调以下重要事项：

数据安全性：本文介绍的部署方式仅适用于本地开发和测试环境，严禁用于生产环境
数据可靠性问题：
- Docker 部署方式在容器销毁后数据会丢失
- 单副本配置缺乏数据冗余和备份能力，机器故障可能导致数据丢失
性能限制：示例中的表创建语句均为单副本，生产环境应使用多副本存储

方案一：Docker 快速部署（推荐新手）

适用于希望快速体验 Apache Doris 功能的开发者，从 2.1.8 版本开始支持此方式。

环境准备

确保系统已安装：

Docker 环境
MySQL 客户端工具（用于连接 Doris）

详细步骤

获取快速启动脚本

下载官方提供的启动脚本后，需要赋予执行权限：
```
chmod 755 start-doris.sh
```
启动集群

默认使用最新稳定版（当前为 2.1.9）：
```
bash start-doris.sh
```
如需指定版本（如 2.1.8）：
```
bash start-doris.sh -v 2.1.8
```

验证集群状态

使用 MySQL 客户端连接后检查组件状态：

-- 检查 FE 状态（Join 和 Alive 应为 true）
SELECT `host`, `join`, `alive` FROM frontends();

-- 检查 BE 状态（Alive 应为 true）
SELECT `host`, `alive` FROM backends();

方案二：本地二进制部署

适合需要更深入了解 Doris 架构的开发者。

环境准备建议

操作系统：推荐 Ubuntu 等主流 Linux 发行版
Java 环境：必须安装 Java 17 运行时
用户权限：建议创建专用 doris 用户，避免使用 root

系统配置优化

文件描述符限制

# 编辑 limits.conf 添加以下内容
* soft nofile 1000000
* hard nofile 1000000

虚拟内存设置

echo "vm.max_map_count = 2000000" >> /etc/sysctl.conf
sysctl -p  # 立即生效

FE 部署流程

配置文件调整

# fe.conf 关键配置
JAVA_HOME=/path/to/jdk
priority_networks=127.0.0.1/32  # 绑定本地IP

启动与验证

./fe/bin/start_fe.sh --daemon
mysql -uroot -P9030 -h127.0.0.1 -e "show frontends;"

BE 部署流程

基础配置

# be.conf 关键配置
JAVA_HOME=/path/to/jdk
priority_networks=127.0.0.1/32

节点注册

ALTER SYSTEM ADD BACKEND "127.0.0.1:9050";

状态检查
```
SHOW BACKENDS\G
```

快速体验 Doris 功能

数据操作示例

创建测试数据库
```
CREATE DATABASE demo;
USE demo;
```

建表示例

CREATE TABLE mytable(
    k1 TINYINT,
    k2 DECIMAL(10, 2) DEFAULT "10.05",
    k3 CHAR(10) COMMENT "字符串列",
    k4 INT NOT NULL DEFAULT "1" COMMENT "整型列"
) 
DISTRIBUTED BY HASH(k1) BUCKETS 1;

数据导入与查询

-- 批量插入数据
INSERT INTO mytable VALUES
(1,0.14,'a1',20),
(2,1.04,'b2',21),
(3,3.14,'c3',22);

-- 查询验证
SELECT * FROM mytable WHERE k2 > 1.0;

常见问题处理

FE 启动失败：检查 JAVA_HOME 配置和端口冲突
BE 注册失败：确认 FE 已正常启动且网络连通
查询超时：检查 BE 节点是否正常加入集群

后续学习建议

完成本快速入门后，建议进一步了解：

数据导入的各种方式（Stream Load、Routine Load等）
表分区与分桶策略优化
物化视图的使用
查询性能优化技巧

通过本指南，您已经掌握了 Apache Doris 的基本部署和使用方法，可以开始探索更多高级功能。

登录后查看全文

Apache Doris 快速入门指南：从零开始体验实时分析数据库

前言

部署方式选择警告

方案一：Docker 快速部署（推荐新手）

环境准备

详细步骤

方案二：本地二进制部署

环境准备建议

系统配置优化

FE 部署流程

BE 部署流程

快速体验 Doris 功能

数据操作示例

常见问题处理

后续学习建议

热门内容推荐

最新内容推荐

项目优选

Apache Doris 快速入门指南：从零开始体验实时分析数据库

前言

部署方式选择警告

方案一：Docker 快速部署（推荐新手）

环境准备

详细步骤

方案二：本地二进制部署

环境准备建议

系统配置优化

FE 部署流程

BE 部署流程

快速体验 Doris 功能

数据操作示例

常见问题处理

后续学习建议

相关内容推荐

热门内容推荐

最新内容推荐

项目优选