CouchDB River 插件技术文档
本文档旨在帮助用户了解和使用 CouchDB River 插件,以便能够自动索引 CouchDB 数据并使其可搜索。以下是插件的安装指南、使用说明以及 API 使用文档。
1. 安装指南
在安装插件之前,请确保您的 Elasticsearch 版本与插件版本相匹配。以下是安装步骤:
bin/plugin install elasticsearch/elasticsearch-river-couchdb/2.6.0
如果需要构建一个 SNAPSHOT
版本,您需要使用 Maven 进行构建:
mvn clean install
plugin --install river-couchdb \
--url file:target/releases/elasticsearch-river-couchdb-X.X.X-SNAPSHOT.zip
2. 项目使用说明
要设置 CouchDB River,您需要执行以下命令来创建一个 river:
curl -XPUT 'localhost:9200/_river/my_db/_meta' -d '{
"type" : "couchdb",
"couchdb" : {
"host" : "localhost",
"port" : 5984,
"db" : "my_db",
"filter" : null
},
"index" : {
"index" : "my_db",
"type" : "my_db",
"bulk_size" : "100",
"bulk_timeout" : "10ms"
}
}'
此调用将创建一个 river,使用 CouchDB 的 _changes
流自动索引所有数据。此外,任何“未来”的更改也将自动索引,使您的搜索索引与 CouchDB 保持同步。
CouchDB River 作为插件提供,包括如何安装它的说明。
3. 项目 API 使用文档
以下是 CouchDB River 插件的一些关键配置选项:
Bulking
默认情况下,插件会自动进行 bulking 操作以加快索引过程。如果在指定的 bulk_timeout
内检测到更多更改,更改将在达到 bulk_size
之前进行 bulk 操作。
{
"type" : "couchdb",
"index" : {
"index" : "my_index",
"type" : "my_type",
"bulk_size" : 1000,
"flush_interval" : "1s",
"max_concurrent_bulk" : 3
}
}
Filtering
changes
流允许您提供一个过滤器,该过滤器将由 CouchDB 用于过滤更改流。
{
"couchdb" : {
"filter" : "test",
"filter_params" : {
"param1" : "value1",
"param2" : "value2"
}
}
}
Script Filters
您还可以通过提供脚本来进一步处理更改流中的每个已更改项目。
{
"type" : "couchdb",
"couchdb" : {
"script" : "ctx.doc.field1 = 'value1'"
}
}
Basic Authentication
您可以通过传递 user
和 password
属性来使用基本身份验证。
{
"type" : "couchdb",
"couchdb" : {
"user" : "alice",
"password" : "secret"
}
}
HTTPS
要使用 HTTPS,请传递 protocol
字段。如果您遇到服务器证书问题,可以禁用主机名验证。
{
"type" : "couchdb",
"couchdb" : {
"protocol" : "https",
"port" : 443,
"no_verify" : "true"
}
}
Ignoring Attachments
您可以选择忽略 CouchDb 为每个文档提供的附件(_attachments
字段)。
{
"type":"couchdb",
"couchdb": {
"ignore_attachments":true
}
}
Heartbeat
默认情况下,CouchDB River 将 _changes
API 的 heartbeat 设置为 10s
。
curl -XPUT 'localhost:9200/_river/my_db/_meta' -d '{
"type" : "couchdb",
"couchdb" : {
"host" : "localhost",
"port" : 5984,
"db" : "my_db",
"heartbeat" : "5s",
"read_timeout" : "15s"
}
}'
Starting at a Specific Sequence
您可以通过在 _river
索引中的 _seq
文档中设置 last_seq
值来指定 CouchDB River 从特定的序列开始。
curl -XPUT 'localhost:9200/_river/my_db/_seq' -d '
{
"couchdb": {
"last_seq": "100"
}
}'
然后按照之前的方式创建 _meta
文档。CouchDB River 将启动并读取最后序列值,并从那里开始索引。
4. 项目安装方式
请参考上述“安装指南”部分进行项目安装。确保安装的版本与您的 Elasticsearch 版本兼容。
- mybatis-plusmybatis 增强工具包,简化 CRUD 操作。 文档 http://baomidou.com 低代码组件库 http://aizuda.comJava00
- open-eBackupopen-eBackup是一款开源备份软件,采用集群高扩展架构,通过应用备份通用框架、并行备份等技术,为主流数据库、虚拟化、文件系统、大数据等应用提供E2E的数据备份、恢复等能力,帮助用户实现关键数据高效保护。HTML055
- 每日精选项目🔥🔥 12.27日推荐:解锁高效测试的新工具-Shortest🔥🔥 每日推荐行业内最新、增长最快的项目,快速了解行业最新热门项目动态~~017
- Cangjie-Examples本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。Cangjie041
- 毕方Talon工具本工具是一个端到端的工具,用于项目的生成IR并自动进行缺陷检测。Python039
- PDFMathTranslatePDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务,提供 CLI/GUI/DockerPython03
- advanced-javaAdvanced-Java是一个Java进阶教程,适合用于学习Java高级特性和编程技巧。特点:内容深入、实例丰富、适合进阶学习。JavaScript0103
- taro开放式跨端跨框架解决方案,支持使用 React/Vue/Nerv 等框架来开发微信/京东/百度/支付宝/字节跳动/ QQ 小程序/H5/React Native 等应用。 https://taro.zone/TypeScript09
- Yi-CoderYi Coder 编程模型,小而强大的编程助手HTML012
- excelizehttps://github.com/xuri/excelize Excelize 是 Go 语言编写的一个用来操作 Office Excel 文档类库,基于 ECMA-376 OOXML 技术标准。可以使用它来读取、写入 XLSX 文件,相比较其他的开源类库,Excelize 支持操作带有数据透视表、切片器、图表与图片的 Excel 并支持向 Excel 中插入图片与创建简单图表,目前是 Go 开源项目中唯一支持复杂样式 XLSX 文件的类库,可应用于各类报表平台、云计算和边缘计算系统。Go02