首页
/ CouchDB River 插件技术文档

CouchDB River 插件技术文档

2024-12-24 04:00:46作者:胡易黎Nicole

本文档旨在帮助用户了解和使用 CouchDB River 插件,以便能够自动索引 CouchDB 数据并使其可搜索。以下是插件的安装指南、使用说明以及 API 使用文档。

1. 安装指南

在安装插件之前,请确保您的 Elasticsearch 版本与插件版本相匹配。以下是安装步骤:

bin/plugin install elasticsearch/elasticsearch-river-couchdb/2.6.0

如果需要构建一个 SNAPSHOT 版本,您需要使用 Maven 进行构建:

mvn clean install
plugin --install river-couchdb \
       --url file:target/releases/elasticsearch-river-couchdb-X.X.X-SNAPSHOT.zip

2. 项目使用说明

要设置 CouchDB River,您需要执行以下命令来创建一个 river:

curl -XPUT 'localhost:9200/_river/my_db/_meta' -d '{
    "type" : "couchdb",
    "couchdb" : {
        "host" : "localhost",
        "port" : 5984,
        "db" : "my_db",
        "filter" : null
    },
    "index" : {
        "index" : "my_db",
        "type" : "my_db",
        "bulk_size" : "100",
        "bulk_timeout" : "10ms"
    }
}'

此调用将创建一个 river,使用 CouchDB 的 _changes 流自动索引所有数据。此外,任何“未来”的更改也将自动索引,使您的搜索索引与 CouchDB 保持同步。

CouchDB River 作为插件提供,包括如何安装它的说明。

3. 项目 API 使用文档

以下是 CouchDB River 插件的一些关键配置选项:

Bulking

默认情况下,插件会自动进行 bulking 操作以加快索引过程。如果在指定的 bulk_timeout 内检测到更多更改,更改将在达到 bulk_size 之前进行 bulk 操作。

{
    "type" : "couchdb",
    "index" : {
        "index" : "my_index",
        "type" : "my_type",
        "bulk_size" : 1000,
        "flush_interval" : "1s",
        "max_concurrent_bulk" : 3
    }
}

Filtering

changes 流允许您提供一个过滤器,该过滤器将由 CouchDB 用于过滤更改流。

{
    "couchdb" : {
        "filter" : "test",
        "filter_params" : {
            "param1" : "value1",
            "param2" : "value2"
        }
    }
}

Script Filters

您还可以通过提供脚本来进一步处理更改流中的每个已更改项目。

{
    "type" : "couchdb",
    "couchdb" : {
        "script" : "ctx.doc.field1 = 'value1'"
    }
}

Basic Authentication

您可以通过传递 userpassword 属性来使用基本身份验证。

{
    "type" : "couchdb",
    "couchdb" : {
        "user" : "alice",
        "password" : "secret"
    }
}

HTTPS

要使用 HTTPS,请传递 protocol 字段。如果您遇到服务器证书问题,可以禁用主机名验证。

{
    "type" : "couchdb",
    "couchdb" : {
        "protocol" : "https",
        "port" : 443,
        "no_verify" : "true"
    }
}

Ignoring Attachments

您可以选择忽略 CouchDb 为每个文档提供的附件(_attachments 字段)。

{
  "type":"couchdb",
  "couchdb": {
    "ignore_attachments":true
  }
}

Heartbeat

默认情况下,CouchDB River 将 _changes API 的 heartbeat 设置为 10s

curl -XPUT 'localhost:9200/_river/my_db/_meta' -d '{
    "type" : "couchdb",
    "couchdb" : {
        "host" : "localhost",
        "port" : 5984,
        "db" : "my_db",
        "heartbeat" : "5s",
        "read_timeout" : "15s"
    }
}'

Starting at a Specific Sequence

您可以通过在 _river 索引中的 _seq 文档中设置 last_seq 值来指定 CouchDB River 从特定的序列开始。

curl -XPUT 'localhost:9200/_river/my_db/_seq' -d '
{
  "couchdb": {
    "last_seq": "100"
  }
}'

然后按照之前的方式创建 _meta 文档。CouchDB River 将启动并读取最后序列值,并从那里开始索引。

4. 项目安装方式

请参考上述“安装指南”部分进行项目安装。确保安装的版本与您的 Elasticsearch 版本兼容。

登录后查看全文
热门项目推荐

热门内容推荐

最新内容推荐

项目优选

收起
openHiTLS-examplesopenHiTLS-examples
本仓将为广大高校开发者提供开源实践和创新开发平台,收集和展示openHiTLS示例代码及创新应用,欢迎大家投稿,让全世界看到您的精巧密码实现设计,也让更多人通过您的优秀成果,理解、喜爱上密码技术。
C
54
469
kernelkernel
deepin linux kernel
C
22
5
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
7
0
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
880
519
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
336
1.1 K
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
181
264
cjoycjoy
一个高性能、可扩展、轻量、省心的仓颉Web框架。Rest, 宏路由,Json, 中间件,参数绑定与校验,文件上传下载,MCP......
Cangjie
87
14
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.09 K
0
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
361
381
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
612
60