《DocumentCloud 安装与使用深入解析》

2025-01-02 04:51:00作者：宣海椒Queenly

引言

在当今信息爆炸的时代，有效地管理和注释文档成为了一个迫切的需求。DocumentCloud 作为一款开源的文档管理和发布工具，为广大记者、研究者和档案管理员提供了一个强大的平台。本文将详细介绍如何安装和使用 DocumentCloud，帮助您快速上手并充分发挥其功能。

安装前准备

系统和硬件要求

在开始安装 DocumentCloud 之前，请确保您的系统满足以下要求：

操作系统：建议使用 Ubuntu 18.04 或更高版本。
内存：至少 7GB，推荐 10GB。
硬盘空间：至少分配额外的 11GB 空间给 Docker。

必备软件和依赖项

确保您的系统中安装以下软件：

Docker：用于运行容器化应用。
Python：至少 Python 3.6 版本。
Git：用于克隆和操作代码仓库。

安装步骤

下载开源项目资源

首先，从以下地址克隆 DocumentCloud 的代码仓库：

git clone https://github.com/documentcloud/documentcloud.git

安装过程详解

初始化环境变量：

进入 DocumentCloud 目录，运行以下命令初始化环境变量：
```
python initialize_dotenvs.py
```
配置 /etc/hosts 文件：

为了确保 Docker 容器能够正确连接到服务，需要将以下内容添加到 /etc/hosts 文件：
```
echo "127.0.0.1 api.dev.documentcloud.org minio.documentcloud.org" | sudo tee -a /etc/hosts
```
设置环境变量：

在 envs/local/django 目录下，设置以下环境变量：
- SQUARELET_KEY：Squarelet 客户端的 Client ID。
- SQUARELET_SECRET：Squarelet 客户端的 Client SECRET。
- JWT_VERIFYING_KEY：从 Squarelet Django shell 中获取。
启动 Docker 容器：

在命令行中运行以下命令启动 Docker 容器：
```
export COMPOSE_FILE=local.yml
docker-compose up
```
访问 Django API：

在浏览器中访问 http://api.dev.documentcloud.org/，您应该能看到 Django API 的根页面。

常见问题及解决

内存不足：如果 Docker 容器随机失败或系统大量交换，请确保 Docker 分配了足够的内存。
签名错误：检查 Minio 配置是否正确。
页面找不到：确保在 Django admin 中添加了名为 /tipofday/ 的静态页面。

基本使用方法

加载开源项目

将 DocumentCloud 项目加载到您的开发环境中，按照官方文档中的步骤进行配置。

简单示例演示

以下是一个简单的示例，展示如何使用 DocumentCloud 的 API：

# 示例代码
def example_usage():
    # 初始化 DocumentCloud 客户端
    client = DocumentCloudClient('your-api-key', 'your-api-secret')

    # 获取文档列表
    documents = client.documents()
    
    # 打印文档标题
    for doc in documents:
        print(doc.title)