首页
/ Zohmg项目技术文档

Zohmg项目技术文档

2024-12-23 16:54:59作者:沈韬淼Beryl

Zohmg 是一个用于多维时间序列数据聚合的数据存储系统,构建在 Hadoop、Dumbo 和 HBase 之上。本文档将详细介绍如何安装、使用 Zohmg,以及如何使用其 API。

1. 安装指南

请参考以下步骤进行 Zohmg 的安装:

  • 确保已经安装了 Hadoop、Dumbo 和 HBase。
  • 运行 ant package 在 Hadoop 的 $HADOOP_HOME 目录下,以构建 streaming jar。
  • 设置环境变量 HADOOP_HOME 并配置 config/environment.py 文件,指定 Hadoop、Hadoop streaming 和 HBase 的 jar 路径。

2. 项目使用说明

创建 Zohmg 项目:

zohmg create television

这将在当前目录下创建一个名为 television 的项目目录,其中包含以下结构:

  • config - 环境和数据集配置。
  • lib - 自动包含在任务 jar 中的 eggs 或 jars。
  • mappers - MapReduce 映射器(你将需要编写这些!)。

配置项目:

  • 编辑 config/environment.py 文件,定义 HADOOP_HOME 和其他必要的路径。
  • 编辑 config/dataset.yaml 文件,定义数据集的维度、投影和单位。
  • 运行 zohmg setup 命令创建 HBase 表。

导入数据:

  • 编写一个映射函数 map,分析数据行。
  • 运行映射器将数据导入 HBase 表。

启动 Zohmg 服务器:

zohmg server

默认情况下,Zohmg 服务器监听本地主机的 8086 端口。在浏览器中访问 http://localhost:8086/ 查看数据。

3. 项目API使用文档

Zohmg 的数据服务器通过 HTTP API 暴露数据存储。每个请求返回 JSON 格式的字符串。

典型的查询字符串如下:

http://localhost:8086/?t0=20090601&t1=20090630&unit=plays&d0=country&d0v=DE,SE,US

此查询返回 2009 年 6 月 1 日至 2009 年 6 月 30 日期间的播放次数,按国家(德国、瑞典、美国)分类。

API 支持以下参数:

  • t0t1:定义时间范围,格式为 "yyyymmdd"。
  • unit:定义查询的单位。
  • d0:定义基础维度。
  • d0v:定义基础维度的值。

4. 项目安装方式

Zohmg 的安装方式已在“安装指南”部分详细说明。请按照以下步骤操作:

  • 确保安装了所有依赖(Hadoop、Dumbo、HBase)。
  • 配置环境变量和项目配置文件。
  • 运行 zohmg setup 创建 HBase 表。
  • 编写并运行映射器将数据导入系统。
  • 启动 Zohmg 服务器。

以上即为 Zohmg 项目的技术文档,希望对您使用该项目有所帮助。

登录后查看全文
热门项目推荐