Apache Inlong 2.2.0-RC1版本发布：数据集成平台全面升级

2025-07-03 03:01:50作者：冯爽妲Honey

Apache Inlong作为一款开源的大数据集成平台，专注于提供高效、可靠的数据采集、聚合与传输能力。本次发布的2.2.0-RC1版本在Agent、SDK、Sort等多个核心模块进行了重大改进和优化，显著提升了系统的稳定性、性能和易用性。

Agent模块增强

在数据采集代理方面，本次更新带来了多项重要改进。首先是优化了数据源结束判断逻辑，使文件采集更加准确可靠。针对重复文件采集的问题，开发团队重构了处理机制，确保数据不会重复上报。在性能方面，增加了全局实例数量控制，并优化了实例生命周期管理机制。

日志处理方面也有显著提升，实现了DataProxy SDK日志的分离记录，便于问题排查。同时增加了DataProxy SDK的调试日志输出，为开发者提供更详细的运行时信息。值得关注的是，新增了统一的事件上报点，为系统监控提供了更全面的数据支持。

SDK全面重构

数据代理SDK在本版本中经历了深度优化。TCP消息发送实现被彻底重构，提升了传输效率和稳定性。新增了飞行中请求总数和总大小的限制机制，防止内存溢出风险。在异常处理方面，完善了NPE检查，增强了代码健壮性。

Go语言SDK获得了多项增强，包括连接池大小调整、TCP保活机制支持以及端点不可用标记逻辑优化。Python SDK修复了缺少互斥头文件的问题。在度量统计方面，优化了指标输出内容和报告时机，为运维监控提供了更准确的数据。

Sort模块功能扩展

数据排序处理模块新增了对多种格式的支持。KV和CSV反序列化配置现在支持移除和自动添加转义字符的选项，提高了数据处理灵活性。MySQL CDC变更日志记录功能得到优化，为数据变更追踪提供了更好支持。

Pulsar连接器升级至4.1.0版本，并新增了对InlongMsg元数据的支持。在错误处理方面，修复了InlongMsg体格式问题导致的NPE异常，提高了系统鲁棒性。针对独立部署场景，新增了流控机制，防止单任务阻塞影响其他任务。

审计功能增强

审计模块在本版本中获得了多项重要更新。新增了MQ Pulsar的审计项，扩展了系统监控范围。针对CDC场景，MySQL Binlog新增了专用审计ID，并支持CDC场景的审计对账功能。审计SDK的打包过程也进行了优化，提升了部署效率。

总结

Apache Inlong 2.2.0-RC1版本通过全面优化各核心模块，在数据采集、传输、处理和监控等方面都取得了显著进步。这些改进不仅提升了系统性能和稳定性，也为用户提供了更丰富的功能和更便捷的使用体验。该版本标志着Apache Inlong在构建高效可靠的数据集成平台道路上又迈出了坚实一步。

inlong

Apache InLong - a one-stop, full-scenario integration framework for massive data

项目地址：https://gitcode.com/gh_mirrors/inlo/inlong

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781