Workiva/Eva项目入门指南：基于Clojure的Datalog数据库实践

2025-06-04 07:53:27作者：傅爽业Veleda

什么是Eva数据库？

Eva是一个基于Datalog的开源数据库系统，采用Clojure语言实现。它继承了Datomic数据库的核心思想，提供了强大的数据建模能力和灵活的查询机制。Eva采用不可变数据模型，支持时间旅行查询，非常适合需要审计追踪和历史数据分析的场景。

环境准备

安装Leiningen

Leiningen是Clojure生态中最常用的项目管理工具，相当于Java中的Maven或Gradle。安装方法如下：

brew install leiningen

安装完成后，可以通过以下命令验证是否安装成功：

lein version

启动REPL环境

REPL（Read-Eval-Print Loop）是Clojure的交互式编程环境，类似于Python的交互式解释器。启动REPL：

lein repl

创建内存数据库

在REPL中，首先需要建立数据库连接：

(require '[eva.api :as eva])
(def conn (eva/connect {:local true}))

这里创建了一个内存数据库连接，:local true参数表示使用本地内存存储。在实际应用中，你也可以连接到持久化存储。

数据建模

定义Schema

Eva使用Schema定义数据模型，类似于关系型数据库的表结构。下面定义一个简单的图书管理系统Schema：

(def schema [
  {:db/id (eva/tempid :db.part/db)
   :db/ident :book/title
   :db/doc "图书标题"
   :db/valueType :db.type/string
   :db/cardinality :db.cardinality/one
   :db.install/_attribute :db.part/db}

  {:db/id (eva/tempid :db.part/db)
   :db/ident :book/year_published
   :db/doc "出版年份"
   :db/valueType :db.type/long
   :db/cardinality :db.cardinality/one
   :db.install/_attribute :db.part/db}

  {:db/id (eva/tempid :db.part/db)
   :db/ident :book/author
   :db/doc "图书作者"
   :db/valueType :db.type/ref
   :db/cardinality :db.cardinality/one
   :db.install/_attribute :db.part/db}

  {:db/id (eva/tempid :db.part/db)
   :db/ident :author/name
   :db/doc "作者姓名"
   :db/valueType :db.type/string
   :db/cardinality :db.cardinality/one
   :db.install/_attribute :db.part/db}
])

Schema中的关键元素说明：

:db/id：实体ID，使用tempid生成临时ID
:db/ident：属性标识符
:db/valueType：数据类型，支持string、long、ref等
:db/cardinality：基数，one表示单值，many表示多值

提交Schema

将Schema提交到数据库：

@(eva/transact conn schema)

@符号用于解引用返回的future对象，确保事务完成后再继续执行。

数据操作

添加单条数据

(def first-book [[:db/add (eva/tempid :db.part/user) :book/title "第一本书"]])
@(eva/transact conn first-book)

批量添加数据

Eva支持更高效的数据批量添加方式：

(def books [
  {:db/id (eva/tempid :db.part/user -1) 
   :book/title "数据密集型应用系统设计"
   :book/year_published 2017
   :book/author (eva/tempid :db.part/user -2)}
   
  {:db/id (eva/tempid :db.part/user -2)
   :author/name "Martin Kleppman"}
])
@(eva/transact conn books)

注意这里使用了负数的临时ID来建立实体间的引用关系。

数据查询

获取数据库快照

(def db (eva/db conn))

基本查询

查询所有图书标题：

(eva/q '[:find ?title
         :where
         [?b :book/title ?title]]
       db)

带条件的查询

查询2017年出版的图书：

(eva/q '[:find ?title
         :where
         [?b :book/year_published 2017]
         [?b :book/title ?title]]
       db)

关联查询

查询特定作者的所有图书：

(eva/q '[:find ?book
         :where
         [?a :author/name "Martin Kleppman"]
         [?b :book/author ?a]
         [?b :book/title ?book]]
       db)

使用Pull API获取完整实体

(def book-id (first (first (eva/q '[:find ?b 
                                   :where [?b :book/title "数据密集型应用系统设计"]] 
                                 db))))
(eva/pull db '[*] book-id)

高级查询技巧

使用谓词函数

查询2005年前出版的图书：

(eva/q '[:find ?title ?year
         :where
         [?b :book/title ?title]
         [?b :book/year_published ?year]
         [(< ?year 2005)]]
       db)

事务查询

查询数据插入时间：

(eva/q '[:find ?timestamp
         :where
         [_ :book/title "数据密集型应用系统设计" ?tx]
         [?tx :db/txInstant ?timestamp]]
       db)

最佳实践

合理设计Schema：提前规划好实体关系和属性类型
批量操作：尽量使用批量事务而非单条操作
重用数据库快照：避免频繁获取新的数据库快照
利用索引：Eva会自动为所有属性创建索引
事务处理：注意事务的异步特性，必要时使用@等待完成

总结

通过本文，你已经掌握了Eva数据库的基本使用方法，包括环境搭建、Schema设计、数据操作和查询。Eva的Datalog查询语言虽然与SQL不同，但提供了更强大的表达能力和灵活性。下一步可以探索Eva的更多高级特性，如规则定义、时间旅行查询等。

Eva特别适合需要复杂数据关联、历史数据追踪和灵活查询模式的场景，是传统关系型数据库的有力补充。

eva

A distributed database-system implementing an entity-attribute-value data-model that is time-aware, accumulative, and atomically consistent

项目地址：https://gitcode.com/gh_mirrors/eva2/eva

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

455

437

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。