首页
/ Apache Doris 快速入门指南:从零开始体验实时分析数据库

Apache Doris 快速入门指南:从零开始体验实时分析数据库

2025-06-27 05:41:20作者:柏廷章Berta

前言

Apache Doris 是一款基于 MPP 架构的高性能、实时的分析型数据库,以其出色的查询性能、高并发能力和易用性著称。本文将详细介绍两种快速体验 Apache Doris 的方式:Docker 快速部署和本地二进制包部署,帮助开发者快速搭建测试环境。

部署方式选择警告

在开始之前,必须强调以下重要事项:

  1. 数据安全性:本文介绍的部署方式仅适用于本地开发和测试环境,严禁用于生产环境
  2. 数据可靠性问题
    • Docker 部署方式在容器销毁后数据会丢失
    • 单副本配置缺乏数据冗余和备份能力,机器故障可能导致数据丢失
  3. 性能限制:示例中的表创建语句均为单副本,生产环境应使用多副本存储

方案一:Docker 快速部署(推荐新手)

适用于希望快速体验 Apache Doris 功能的开发者,从 2.1.8 版本开始支持此方式。

环境准备

确保系统已安装:

  • Docker 环境
  • MySQL 客户端工具(用于连接 Doris)

详细步骤

  1. 获取快速启动脚本

    下载官方提供的启动脚本后,需要赋予执行权限:

    chmod 755 start-doris.sh
    
  2. 启动集群

    默认使用最新稳定版(当前为 2.1.9):

    bash start-doris.sh
    

    如需指定版本(如 2.1.8):

    bash start-doris.sh -v 2.1.8
    
  3. 验证集群状态

    使用 MySQL 客户端连接后检查组件状态:

    -- 检查 FE 状态(Join 和 Alive 应为 true)
    SELECT `host`, `join`, `alive` FROM frontends();
    
    -- 检查 BE 状态(Alive 应为 true)
    SELECT `host`, `alive` FROM backends();
    

方案二:本地二进制部署

适合需要更深入了解 Doris 架构的开发者。

环境准备建议

  • 操作系统:推荐 Ubuntu 等主流 Linux 发行版
  • Java 环境:必须安装 Java 17 运行时
  • 用户权限:建议创建专用 doris 用户,避免使用 root

系统配置优化

  1. 文件描述符限制

    # 编辑 limits.conf 添加以下内容
    * soft nofile 1000000
    * hard nofile 1000000
    
  2. 虚拟内存设置

    echo "vm.max_map_count = 2000000" >> /etc/sysctl.conf
    sysctl -p  # 立即生效
    

FE 部署流程

  1. 配置文件调整

    # fe.conf 关键配置
    JAVA_HOME=/path/to/jdk
    priority_networks=127.0.0.1/32  # 绑定本地IP
    
  2. 启动与验证

    ./fe/bin/start_fe.sh --daemon
    mysql -uroot -P9030 -h127.0.0.1 -e "show frontends;"
    

BE 部署流程

  1. 基础配置

    # be.conf 关键配置
    JAVA_HOME=/path/to/jdk
    priority_networks=127.0.0.1/32
    
  2. 节点注册

    ALTER SYSTEM ADD BACKEND "127.0.0.1:9050";
    
  3. 状态检查

    SHOW BACKENDS\G
    

快速体验 Doris 功能

数据操作示例

  1. 创建测试数据库

    CREATE DATABASE demo;
    USE demo;
    
  2. 建表示例

    CREATE TABLE mytable(
        k1 TINYINT,
        k2 DECIMAL(10, 2) DEFAULT "10.05",
        k3 CHAR(10) COMMENT "字符串列",
        k4 INT NOT NULL DEFAULT "1" COMMENT "整型列"
    ) 
    DISTRIBUTED BY HASH(k1) BUCKETS 1;
    
  3. 数据导入与查询

    -- 批量插入数据
    INSERT INTO mytable VALUES
    (1,0.14,'a1',20),
    (2,1.04,'b2',21),
    (3,3.14,'c3',22);
    
    -- 查询验证
    SELECT * FROM mytable WHERE k2 > 1.0;
    

常见问题处理

  1. FE 启动失败:检查 JAVA_HOME 配置和端口冲突
  2. BE 注册失败:确认 FE 已正常启动且网络连通
  3. 查询超时:检查 BE 节点是否正常加入集群

后续学习建议

完成本快速入门后,建议进一步了解:

  • 数据导入的各种方式(Stream Load、Routine Load等)
  • 表分区与分桶策略优化
  • 物化视图的使用
  • 查询性能优化技巧

通过本指南,您已经掌握了 Apache Doris 的基本部署和使用方法,可以开始探索更多高级功能。

登录后查看全文
热门项目推荐

热门内容推荐

项目优选

收起
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
176
261
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
860
511
ShopXO开源商城ShopXO开源商城
🔥🔥🔥ShopXO企业级免费开源商城系统,可视化DIY拖拽装修、包含PC、H5、多端小程序(微信+支付宝+百度+头条&抖音+QQ+快手)、APP、多仓库、多商户、多门店、IM客服、进销存,遵循MIT开源协议发布、基于ThinkPHP8框架研发
JavaScript
93
15
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
129
182
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
259
300
kernelkernel
deepin linux kernel
C
22
5
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
595
57
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.07 K
0
HarmonyOS-ExamplesHarmonyOS-Examples
本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
398
371
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
332
1.08 K