Apache Hop 2.13.0版本发布:数据集成工具的重大更新
2025-07-10 12:44:41作者:尤辰城Agatha
Apache Hop(Hop Orchestration Platform)是一个开源的数据集成和工作流自动化工具,它提供了直观的图形界面来设计、执行和监控数据处理流程。作为Pentaho Data Integration(Kettle)的下一代产品,Hop在保持原有功能的同时,引入了更现代化的架构和更丰富的功能特性。
核心功能增强
最新发布的2.13.0版本带来了多项重要改进,主要集中在元数据处理、用户界面优化和连接器增强三个方面。
在元数据处理方面,开发团队为多个组件添加了HopMetadataProperty注解,包括管道执行器、工作流执行器、合并连接、SQL文件输出等。这一改进使得这些组件的元数据管理更加规范化和一致化,为后续的功能扩展和维护打下了良好基础。
连接器与数据源支持
2.13.0版本显著增强了对各种数据源的支持:
- 新增了MySQL批量加载器转换,为MySQL数据库的大数据量导入提供了更高效的解决方案
- 改进了Google Drive和Google Sheets集成,修复了相关功能问题
- 增加了对多GCS(Google Cloud Storage)位置的支持,提升了云存储集成的灵活性
- 更新了Snowflake驱动程序,确保与最新版本Snowflake的兼容性
用户界面改进
用户体验方面,2.13.0版本进行了多项优化:
- 重新设计了文件和文件夹存在检查动作的界面,操作更加直观
- 改进了表和列表视图的视觉效果,提升了数据浏览体验
- 为透视视图添加了帮助功能,方便用户快速了解各功能模块
- 优化了项目对话框,简化了项目管理操作
- 增强了工具栏组合框的只读选项,提供更灵活的操作控制
性能与稳定性提升
在系统性能和稳定性方面,2.13.0版本包含多项重要修复:
- 修复了JSON输入转换中字段传递的问题
- 解决了非UI线程调用SWT同步执行导致的界面冻结问题
- 改进了脚本值和用户定义Java类转换的shell终止处理
- 优化了无效信息流的清理机制
- 修复了表输出中预处理语句未关闭的问题
文档与国际化
文档方面也有显著改进:
- 新增了数据类型相关文档,帮助用户更好地理解和使用各种数据类型
- 更新了单元测试文档,为开发者提供更全面的测试指导
- 完善了Google存储认证文档,简化了云服务配置流程
- 同步更新了多语言翻译,提升了国际化支持
开发者相关改进
对于开发者而言,2.13.0版本带来了多项便利:
- 支持项目部分导出功能,便于代码管理和共享
- 进行了全面的依赖项清理和更新,简化了构建过程
- 修复了扩展/扩展名问题,提高了代码一致性
- 新增了多种哈希算法支持,增强了数据处理能力
Apache Hop 2.13.0版本的这些改进和新增功能,使得这个数据集成工具在易用性、功能丰富度和系统稳定性方面都达到了新的高度,无论是数据工程师还是业务分析师,都能从中获得更高效、更可靠的数据处理体验。
登录后查看全文
热门项目推荐
相关项目推荐
PaddleOCR-VL
PaddleOCR-VL 是一款顶尖且资源高效的文档解析专用模型。其核心组件为 PaddleOCR-VL-0.9B,这是一款精简却功能强大的视觉语言模型(VLM)。该模型融合了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,可实现精准的元素识别。Python00- DDeepSeek-V3.2-ExpDeepSeek-V3.2-Exp是DeepSeek推出的实验性模型,基于V3.1-Terminus架构,创新引入DeepSeek Sparse Attention稀疏注意力机制,在保持模型输出质量的同时,大幅提升长文本场景下的训练与推理效率。该模型在MMLU-Pro、GPQA-Diamond等多领域公开基准测试中表现与V3.1-Terminus相当,支持HuggingFace、SGLang、vLLM等多种本地运行方式,开源内核设计便于研究,采用MIT许可证。【此简介由AI生成】Python00
openPangu-Ultra-MoE-718B-V1.1
昇腾原生的开源盘古 Ultra-MoE-718B-V1.1 语言模型Python00HunyuanWorld-Mirror
混元3D世界重建模型,支持多模态先验注入和多任务统一输出Python00AI内容魔方
AI内容专区,汇集全球AI开源项目,集结模块、可组合的内容,致力于分享、交流。03Spark-Scilit-X1-13B
FLYTEK Spark Scilit-X1-13B is based on the latest generation of iFLYTEK Foundation Model, and has been trained on multiple core tasks derived from scientific literature. As a large language model tailored for academic research scenarios, it has shown excellent performance in Paper Assisted Reading, Academic Translation, English Polishing, and Review Generation, aiming to provide efficient and accurate intelligent assistance for researchers, faculty members, and students.Python00GOT-OCR-2.0-hf
阶跃星辰StepFun推出的GOT-OCR-2.0-hf是一款强大的多语言OCR开源模型,支持从普通文档到复杂场景的文字识别。它能精准处理表格、图表、数学公式、几何图形甚至乐谱等特殊内容,输出结果可通过第三方工具渲染成多种格式。模型支持1024×1024高分辨率输入,具备多页批量处理、动态分块识别和交互式区域选择等创新功能,用户可通过坐标或颜色指定识别区域。基于Apache 2.0协议开源,提供Hugging Face演示和完整代码,适用于学术研究到工业应用的广泛场景,为OCR领域带来突破性解决方案。00- HHowToCook程序员在家做饭方法指南。Programmer's guide about how to cook at home (Chinese only).Dockerfile013
Spark-Chemistry-X1-13B
科大讯飞星火化学-X1-13B (iFLYTEK Spark Chemistry-X1-13B) 是一款专为化学领域优化的大语言模型。它由星火-X1 (Spark-X1) 基础模型微调而来,在化学知识问答、分子性质预测、化学名称转换和科学推理方面展现出强大的能力,同时保持了强大的通用语言理解与生成能力。Python00- PpathwayPathway is an open framework for high-throughput and low-latency real-time data processing.Python00
项目优选
收起

deepin linux kernel
C
23
6

OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
236
2.35 K

仓颉编译器源码及 cjdb 调试工具。
C++
114
81

暂无简介
Dart
538
117

React Native鸿蒙化仓库
JavaScript
216
291

Ascend Extension for PyTorch
Python
77
106

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
9
1

🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
994
588

仓颉编程语言测试用例。
Cangjie
34
65

本仓将为广大高校开发者提供开源实践和创新开发平台,收集和展示openHiTLS示例代码及创新应用,欢迎大家投稿,让全世界看到您的精巧密码实现设计,也让更多人通过您的优秀成果,理解、喜爱上密码技术。
C
131
655