推荐文章：引领新时代的分布式数据库 —— HerdDB

2024-05-22 13:17:53作者：秋泉律Samson

1、项目介绍

HerdDB是一个创新的分布式数据库系统，它无需共享存储就能在服务器集群间分布数据。这个项目旨在提供一个嵌入式且支持SQL的数据库解决方案，使得在Java虚拟机中直接处理本地数据成为可能，而无需依赖网络通信。

2、项目技术分析

HerdDB的核心特性包括：

无共享架构：每个节点都直接访问本地数据，提高了数据读写的效率和系统的可扩展性。
SQL支持：通过JDBC驱动API和低级别API，为开发人员提供熟悉的SQL接口，简化了应用开发。
基于ZooKeeper和BookKeeper的复制功能：利用这两个成熟的开源组件，实现了高效的集群管理和数据同步。
内核类似NoSQL数据库：本质上是键值型数据库，但通过SQL抽象层提供了关系数据库的功能。
设计侧重快速写入与主键读取更新：优化了这类常见操作的性能。
事务支持：支持“已提交读”隔离级别的事务管理。
使用Calcite作为SQL解析器和计划器：保证了对标准SQL的强大支持。

3、项目及技术应用场景

HerdDB适用于需要高可用性、高性能写入和主键访问模式的应用场景，如：

实时大数据分析平台：利用其分布式和嵌入式特性，可以在边缘计算环境中高效存储和处理数据。
分布式微服务：每个服务实例可以轻松集成HerdDB，实现数据独立和服务自治。
高并发写入场景：如日志记录、物联网(IoT)数据收集等。
对事务有要求的云原生应用：利用其支持的事务特性，保证数据一致性。

4、项目特点

灵活性：既能在大规模分布式环境部署，也能作为嵌入式数据库单机运行。
高可用：基于ZooKeeper和BookKeeper的复制机制，能自动处理服务器故障，确保服务连续性。
易用性：SQL接口使开发者能快速上手，并可以将已有SQL应用程序轻松迁移至HerdDB。
性能优化：专为快速写入和主键读取设计，满足现代业务对速度的需求。

获取更多资源

要深入了解HerdDB并参与讨论，欢迎加入邮件列表，同时查看其他演讲和深入研究以获取更多信息。

最后，HerdDB采用的是宽松的Apache 2许可证，鼓励自由使用和贡献代码。

让我们一起探索HerdDB带来的无限可能，打造更加灵活、可靠的分布式数据库解决方案！

登录后查看全文

项目优选

收起

deepin linux kernel

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

昇腾LLM分布式训练框架

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。