首页
/ Jina Hub 项目使用教程

Jina Hub 项目使用教程

2025-04-16 00:23:40作者:翟萌耘Ralph

1. 项目目录结构及介绍

Jina Hub 是一个用于托管 Jina 执行器的开放注册表,通过容器镜像来实现。项目的目录结构如下:

jina-hub/
├── Dockerfile
├── manifest.yml
├── README.md
├── requirements.txt
├── __init__.py
├── tests/
│   ├── test_MyAwesomeExecutor.py
│   └── __init__.py
└── /path/to/executors/
    ├── MyAwesomeExecutor/
    │   ├── Dockerfile
    │   ├── manifest.yml
    │   ├── README.md
    │   ├── requirements.txt
    │   ├── __init__.py
    │   ├── helper.py
    │   └── MyAwesomeExecutor.py
    └── ... 其他执行器目录
  • Dockerfile:用于构建执行器的 Docker 镜像。
  • manifest.yml:定义了执行器镜像的元数据。
  • README.md:项目的说明文件。
  • requirements.txt:项目依赖的 Python 包列表。
  • __init__.py:Python 包的初始化文件。
  • tests/:包含项目的测试脚本。
  • /path/to/executors/:包含所有执行器的目录。

每个执行器目录内部结构如下:

MyAwesomeExecutor/
├── Dockerfile
├── manifest.yml
├── README.md
├── requirements.txt
├── __init__.py
├── helper.py
└── MyAwesomeExecutor.py
  • Dockerfile:构建执行器的 Docker 镜像文件。
  • manifest.yml:执行器的配置文件。
  • README.md:执行器的说明文档。
  • requirements.txt:执行器依赖的 Python 包。
  • __init__.py:将目录作为 Python 包使用。
  • helper.py:执行器可能需要的辅助函数。
  • MyAwesomeExecutor.py:执行器的主要逻辑。

2. 项目的启动文件介绍

项目的启动主要是通过构建 Docker 镜像,并使用 Jina Hub 提供的命令来完成。以下是一些基本步骤:

  1. 构建执行器镜像:

    jina hub build /path/to/MyAwesomeExecutor/
    
  2. 推送镜像到 Jina Hub:

    jina hub login
    jina hub push jinahub/type.kind.jina_image_name:image_version-jina_version
    
  3. 在 Flow 中使用镜像:

    from jina import Flow
    with Flow().add(uses='docker://my_image_tag'):
        pass
    

3. 项目的配置文件介绍

项目的配置文件是 manifest.yml,它定义了执行器镜像的元数据,包括版本、类型、描述等。以下是一个 manifest.yml 的示例:

manifest_version: 1
type: pod
kind: encoder
name: MyAwesomeExecutor
description: My custom executor for encoding data
author: Jina AI Dev-Team (dev-team@jina.ai)
url: https://jina.ai
documentation: https://docs.jina.ai
version: 0.0.1
vendor: Jina AI Limited
license: apache-2.0
platform: [linux/amd64]
keywords: [encoder, custom, example]

这个文件中的每个字段都有其特定的作用:

  • manifest_version:定义了 manifest 文件使用的协议版本。
  • typekind:定义了镜像的类型和种类。
  • name:镜像的人类可读标题。
  • description:软件包中包含的软件的描述。
  • author:负责镜像的人员或组织的联系信息。
  • url:找到有关镜像的更多信息。
  • documentation:获取镜像文档的 URL。
  • version:镜像的版本号。
  • vendor:分发实体的名称。
  • license:软件分发的许可证。
  • platform:镜像构建的 CPU 架构。
  • keywords:帮助用户过滤和定位包的关键字列表。

以上是根据 Jina Hub 开源项目链接生成的使用教程。希望对您有所帮助。

登录后查看全文
热门项目推荐