Apache Hop 2.13.0版本发布：数据集成工具的重大更新

2025-07-05 09:01:26作者：董灵辛Dennis

Apache Hop（Hop Orchestration Platform）是一个开源的数据集成和工作流自动化平台，它提供了强大的ETL（提取、转换、加载）功能，帮助用户高效地处理和管理数据。作为Pentaho Data Integration（Kettle）的下一代产品，Apache Hop在保持原有功能的基础上，进行了现代化改造和性能优化。

核心功能改进

Apache Hop 2.13.0版本带来了多项重要改进，主要集中在元数据处理、用户界面优化和功能增强方面。在元数据处理方面，开发团队为多个组件添加了HopMetadataProperty注解，包括Pipeline Executor、Workflow Executor、Mergejoin转换、SQL文件输出等，这显著提升了元数据管理的灵活性和可扩展性。

用户界面体验也得到显著提升，团队重新设计了ActionFilesExist的用户界面，改进了TableView的视觉效果，并优化了管道和工作流验证的用户交互。这些改进使得用户操作更加直观，降低了学习曲线。

数据库连接与处理增强

新版本对数据库连接和处理能力进行了多项增强。特别值得注意的是新增了MySQL Bulk Loader转换功能，解决了#2365号问题，为大规模MySQL数据加载提供了更高效的解决方案。同时，Table Output组件现在能够正确关闭预处理语句，解决了#4993号问题。

在数据库驱动方面，团队更新了多个数据库驱动，包括Snowflake驱动，确保与最新数据库版本的兼容性。对于MSSQL BulkLoader和MySQL Bulk File等操作，也添加了HopMetadataProperty支持，提升了元数据管理能力。

文件处理与云存储改进

文件处理方面，2.13.0版本修复了Google Drive实现中的问题，解决了#2524号问题，并随后修复了由此引起的Google Sheets问题。更重要的是，新版本增加了对多个GCS（Google Cloud Storage）位置的支持，解决了#4655号问题，为云存储集成提供了更强大的功能。

在文本文件处理方面，新增了对文本文件中换行符的支持，提高了文本数据处理的灵活性。同时，文件路径问题也得到了修复，确保了Google Cloud存储的稳定使用。