Impala 技术文档

2024-12-23 23:58:11作者：翟江哲Frasier

项目地址：https://gitcode.com/gh_mirrors/impal/impala

1. 安装指南

Impala 支持在 Linux 系统上安装。目前支持的发行版有：

Ubuntu 16.04/18.04
CentOS/RHEL 7/8

其他系统，如 SLES12，可能也能运行 Impala，但并未经过社区测试。

系统要求

CPU 架构：x86_64（支持），arm64（Impala 4.0 起实验性支持）
最小 CPU 要求：请参考 Impala Requirements

安装步骤

安装 Impala 的详细步骤，请参考 Impala 的开发者文档。

2. 项目的使用说明

Impala 是一个现代、大规模分布式、大规模并行的 C++ 查询引擎，可以让你分析、转换和组合来自各种数据源的数据。

最佳的性能和可扩展性
支持存储在 Apache Iceberg、HDFS、Apache HBase、Apache Kudu、Amazon S3、Azure Data Lake Storage、Apache Hadoop Ozone 等的数据
支持广泛的 SQL 分析功能，包括窗口函数和子查询
使用 LLVM 实现即时代码生成，为每个查询生成特别定制的极速代码
支持最常用的 Hadoop 文件格式，包括 Apache Parquet 和 Apache ORC
支持行业标准的安全协议，包括 Kerberos、LDAP 和 TLS
Apache 授权，100% 开源

最快速的尝试 Impala 的方式是使用 quickstart Docker 容器，你可以在单机上运行查询和处理数据集，而无需安装任何依赖。它能够自动加载测试数据集到 Apache Kudu 和 Apache Parquet 格式中，你可以在几分钟内开始使用 Apache Impala SQL。

3. 项目 API 使用文档

Impala 的 API 使用文档和详细说明可以在 Apache Impala 文档中找到。

4. 项目安装方式

Impala 的构建说明可以在详细的构建笔记中找到，其中包括项目布局和构建的详细信息。

更多关于 Impala 的信息和使用，请参考 Impala 主页。

请注意，本发行版使用加密软件，可能受到出口控制。更多详情，请参考 EXPORT_CONTROL.md。

项目地址：https://gitcode.com/gh_mirrors/impal/impala

登录后查看全文

项目优选

收起

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

昇腾LLM分布式训练框架