Elasticsearch-Py 8.18.0版本发布:Python DSL整合与功能增强
2025-06-13 04:52:52作者:谭伦延
项目简介
Elasticsearch-Py是Elasticsearch官方提供的Python客户端库,它允许开发者通过Python语言与Elasticsearch集群进行交互。这个库提供了丰富的API接口,支持索引管理、文档操作、搜索查询等核心功能,是Python生态中连接Elasticsearch的首选工具。
版本亮点
1. Elasticsearch-DSL整合
8.18.0版本最显著的改进是将Elasticsearch-DSL项目直接整合到了主库中。这一变化意味着:
- 开发者不再需要单独安装elasticsearch-dsl-py包
- Python DSL(领域特定语言)现在成为官方客户端的一部分
- 查询构建更加直观和Pythonic,减少了原始JSON的使用
DSL整合后,开发者可以更自然地构建复杂查询,例如:
from elasticsearch import Elasticsearch
from elasticsearch_dsl import Search
client = Elasticsearch()
s = Search(using=client).query("match", title="python")
response = s.execute()
2. 文档改进
新版本对文档进行了多项增强:
- 新增了完整的Python DSL文档,方便开发者查阅
- 示例代码现在更多地使用类式查询和类型提示
- 详细说明了
param()方法在DSL中的使用方式 - 完善了子客户端(sub-clients)的使用文档
3. 自动生成DSL字段类
通过从Elasticsearch的schema自动生成DSL字段类,这一改进:
- 确保了字段类型与Elasticsearch最新版本保持同步
- 减少了手动维护的工作量
- 提高了类型系统的准确性
4. API更新
8.18.0版本引入了多个新API和参数:
- 推理API增强:新增了对多种AI服务的支持,包括Alibaba Cloud AI Search、Amazon Bedrock、Anthropic、Azure AI Studio等主流AI平台
- 索引管理:新增了从源索引创建索引的API,以及
include_source_on_error参数用于错误处理 - 异步查询:增加了停止异步ES|QL查询的API
- 集群操作:为解析集群API添加了
timeout参数 - 模型部署:在训练模型部署API中新增了
adaptive_allocations字段
5. DSL字段增强
DSL字段类型获得了多项新功能:
- Boolean字段新增了
ignore_malformed、script、on_script_error和time_series_dimension属性 - GeoShape字段增加了
index属性 - SemanticText字段新增了
search_inference_id属性
技术影响
这次更新对Elasticsearch的Python开发者生态有重要意义:
- 开发体验提升:DSL的整合使得构建复杂查询更加直观,减少了JSON拼接的错误风险
- 类型安全增强:自动生成的字段类提供了更好的IDE支持和类型检查
- 功能覆盖面扩大:新增的API和参数让客户端能够利用Elasticsearch的最新功能
- 文档完善:更详细的文档降低了学习曲线,特别是对新手开发者
升级建议
对于现有项目,建议:
- 如果之前使用了elasticsearch-dsl-py,可以移除该依赖,改用内置的DSL功能
- 检查API变更,特别是参数名称的调整(如
access_token改为token) - 考虑使用新的类型提示功能改进现有代码的静态检查
- 评估新API是否能简化现有实现
总结
Elasticsearch-Py 8.18.0版本通过整合DSL功能和增强API支持,显著提升了Python开发者与Elasticsearch交互的体验。自动生成的字段类和改进的文档进一步降低了使用门槛,而丰富的新API则确保了客户端能够充分利用Elasticsearch的最新功能。这次更新标志着Elasticsearch Python生态的成熟和完善,是Python数据搜索和处理领域的重要进步。
登录后查看全文
热门项目推荐
相关项目推荐
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00
项目优选
收起
deepin linux kernel
C
24
9
Ascend Extension for PyTorch
Python
222
238
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
9
1
暂无简介
Dart
671
156
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
661
312
React Native鸿蒙化仓库
JavaScript
261
322
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
64
19
仓颉编译器源码及 cjdb 调试工具。
C++
134
867
仓颉编程语言测试用例。
Cangjie
37
859
openGauss kernel ~ openGauss is an open source relational database management system
C++
160
217