NPGSQL项目中PostgreSQL向量类型的映射与使用

2025-06-24 19:38:57作者：滕妙奇

PostgreSQL的pgvector扩展为数据库提供了强大的向量存储和检索能力，而NPGSQL作为.NET平台下PostgreSQL的主要数据访问组件，提供了对向量类型的原生支持。本文将详细介绍如何在NHibernate中正确映射和使用PostgreSQL的vector类型。

向量类型的基本概念

PostgreSQL中的vector类型是一种特殊的数据类型，专门用于存储高维向量数据，常用于机器学习、相似性搜索等场景。每个vector可以存储多个浮点数，形成一个数学向量。

准备工作

要在.NET项目中使用PostgreSQL的vector类型，首先需要安装Pgvector的NuGet包。这个包提供了.NET与PostgreSQL向量类型之间的转换支持。

配置NPGSQL数据源

为了启用向量支持，我们需要创建一个自定义的连接提供程序，在构建数据源时显式启用向量功能：

public class NpgsqlDataSourceConnectionProvider : DriverConnectionProvider
{
    private NpgsqlDataSource? _dataSource;

    public override void Configure(IDictionary<string, string> settings)
    {
        base.Configure(settings);

        var dataSourceBuilder = new NpgsqlDataSourceBuilder(ConnectionString);
        dataSourceBuilder.UseVector();  // 关键步骤：启用向量支持

        _dataSource = dataSourceBuilder.Build();
    }

    public override DbConnection GetConnection()
    {
        if (_dataSource == null)
        {
            throw new InvalidOperationException("NpgsqlDataSource未初始化");
        }

        var connection = _dataSource.CreateConnection();
        try
        {
            connection.Open();
        }
        catch (Exception)
        {
            connection.Dispose();
            throw;
        }
        
        return connection;
    }
}

实现自定义用户类型

在NHibernate中，我们需要创建一个自定义的用户类型来处理.NET的float数组与PostgreSQL vector类型之间的转换：

public class PostgresVectorType : IUserType
{
    public bool IsMutable => false;
    public Type ReturnedType => typeof(float[]);
    public SqlType[] SqlTypes => [new(DbType.Object)];  // 使用DbType.Object而非String

    public object? NullSafeGet(DbDataReader rs, string[] names, ISessionImplementor session, object owner)
    {
        return rs[names[0]] is Vector value
            ? value.ToArray()  // 将Vector转换为float数组
            : null;
    }

    public void NullSafeSet(DbCommand cmd, object? value, int index, ISessionImplementor session)
    {
        var param = (NpgsqlParameter)cmd.Parameters[index];
        param.Value = value != null 
            ? new Vector((float[])value)  // 将float数组转换为Vector
            : DBNull.Value;
    }

    // 其他必要的方法实现...
}

在NHibernate中映射向量类型

在Fluent NHibernate中，我们可以这样映射向量属性：

mapping.Map(x => x.Vector)
    .Nullable()
    .CustomSqlType("vector")  // 指定PostgreSQL类型为vector
    .CustomType<PostgresVectorType>();  // 使用自定义类型处理器