首页
/ Apache Doris 快速入门指南:从零开始体验实时分析数据库

Apache Doris 快速入门指南:从零开始体验实时分析数据库

2025-06-27 13:14:03作者:柏廷章Berta

前言

Apache Doris 是一款基于 MPP 架构的高性能、实时的分析型数据库,以其出色的查询性能、高并发能力和易用性著称。本文将详细介绍两种快速体验 Apache Doris 的方式:Docker 快速部署和本地二进制包部署,帮助开发者快速搭建测试环境。

部署方式选择警告

在开始之前,必须强调以下重要事项:

  1. 数据安全性:本文介绍的部署方式仅适用于本地开发和测试环境,严禁用于生产环境
  2. 数据可靠性问题
    • Docker 部署方式在容器销毁后数据会丢失
    • 单副本配置缺乏数据冗余和备份能力,机器故障可能导致数据丢失
  3. 性能限制:示例中的表创建语句均为单副本,生产环境应使用多副本存储

方案一:Docker 快速部署(推荐新手)

适用于希望快速体验 Apache Doris 功能的开发者,从 2.1.8 版本开始支持此方式。

环境准备

确保系统已安装:

  • Docker 环境
  • MySQL 客户端工具(用于连接 Doris)

详细步骤

  1. 获取快速启动脚本

    下载官方提供的启动脚本后,需要赋予执行权限:

    chmod 755 start-doris.sh
    
  2. 启动集群

    默认使用最新稳定版(当前为 2.1.9):

    bash start-doris.sh
    

    如需指定版本(如 2.1.8):

    bash start-doris.sh -v 2.1.8
    
  3. 验证集群状态

    使用 MySQL 客户端连接后检查组件状态:

    -- 检查 FE 状态(Join 和 Alive 应为 true)
    SELECT `host`, `join`, `alive` FROM frontends();
    
    -- 检查 BE 状态(Alive 应为 true)
    SELECT `host`, `alive` FROM backends();
    

方案二:本地二进制部署

适合需要更深入了解 Doris 架构的开发者。

环境准备建议

  • 操作系统:推荐 Ubuntu 等主流 Linux 发行版
  • Java 环境:必须安装 Java 17 运行时
  • 用户权限:建议创建专用 doris 用户,避免使用 root

系统配置优化

  1. 文件描述符限制

    # 编辑 limits.conf 添加以下内容
    * soft nofile 1000000
    * hard nofile 1000000
    
  2. 虚拟内存设置

    echo "vm.max_map_count = 2000000" >> /etc/sysctl.conf
    sysctl -p  # 立即生效
    

FE 部署流程

  1. 配置文件调整

    # fe.conf 关键配置
    JAVA_HOME=/path/to/jdk
    priority_networks=127.0.0.1/32  # 绑定本地IP
    
  2. 启动与验证

    ./fe/bin/start_fe.sh --daemon
    mysql -uroot -P9030 -h127.0.0.1 -e "show frontends;"
    

BE 部署流程

  1. 基础配置

    # be.conf 关键配置
    JAVA_HOME=/path/to/jdk
    priority_networks=127.0.0.1/32
    
  2. 节点注册

    ALTER SYSTEM ADD BACKEND "127.0.0.1:9050";
    
  3. 状态检查

    SHOW BACKENDS\G
    

快速体验 Doris 功能

数据操作示例

  1. 创建测试数据库

    CREATE DATABASE demo;
    USE demo;
    
  2. 建表示例

    CREATE TABLE mytable(
        k1 TINYINT,
        k2 DECIMAL(10, 2) DEFAULT "10.05",
        k3 CHAR(10) COMMENT "字符串列",
        k4 INT NOT NULL DEFAULT "1" COMMENT "整型列"
    ) 
    DISTRIBUTED BY HASH(k1) BUCKETS 1;
    
  3. 数据导入与查询

    -- 批量插入数据
    INSERT INTO mytable VALUES
    (1,0.14,'a1',20),
    (2,1.04,'b2',21),
    (3,3.14,'c3',22);
    
    -- 查询验证
    SELECT * FROM mytable WHERE k2 > 1.0;
    

常见问题处理

  1. FE 启动失败:检查 JAVA_HOME 配置和端口冲突
  2. BE 注册失败:确认 FE 已正常启动且网络连通
  3. 查询超时:检查 BE 节点是否正常加入集群

后续学习建议

完成本快速入门后,建议进一步了解:

  • 数据导入的各种方式(Stream Load、Routine Load等)
  • 表分区与分桶策略优化
  • 物化视图的使用
  • 查询性能优化技巧

通过本指南,您已经掌握了 Apache Doris 的基本部署和使用方法,可以开始探索更多高级功能。

登录后查看全文
热门项目推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
22
6
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
203
2.18 K
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
208
285
pytorchpytorch
Ascend Extension for PyTorch
Python
62
94
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
977
575
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
9
1
ops-mathops-math
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
550
84
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
1.02 K
399
communitycommunity
本项目是CANN开源社区的核心管理仓库,包含社区的治理章程、治理组织、通用操作指引及流程规范等基础信息
393
27
MateChatMateChat
前端智能化场景解决方案UI库,轻松构建你的AI应用,我们将持续完善更新,欢迎你的使用与建议。 官网地址:https://matechat.gitcode.com
1.2 K
133