新手指南：快速上手shibing624/text2vec-base-chinese

2026-02-06 04:22:19作者：凤尚柏Louis

本文介绍如何使用shibing624/text2vec-base-chinese模型，这是一个基于CoSENT（Cosine Sentence）方法训练的中文句子嵌入模型，可以将句子映射到768维的密集向量空间，用于句子嵌入、文本匹配或语义搜索等任务。

基础知识准备

在使用shibing624/text2vec-base-chinese模型之前，你需要了解自然语言处理（NLP）的基本概念和句子嵌入的相关知识。句子嵌入是将文本转换为固定长度向量的技术，这些向量能够捕捉句子的语义信息，用于相似度计算、聚类分析等任务。

环境搭建

要使用shibing624/text2vec-base-chinese模型，你需要安装必要的Python库：

pip install -U text2vec transformers sentence-transformers

安装完成后，可以使用以下代码验证环境配置是否正确：

import text2vec
import transformers
import sentence_transformers

入门实例

以下示例展示如何使用text2vec库进行句子嵌入：

from text2vec import SentenceModel

# 加载模型
model = SentenceModel('shibing624/text2vec-base-chinese')

# 输入句子
sentences = ['如何更换花呗绑定银行卡', '花呗更改绑定银行卡']

# 获取句子嵌入
embeddings = model.encode(sentences)

# 打印句子嵌入
print(embeddings)

也可以使用HuggingFace Transformers库：

from transformers import BertTokenizer, BertModel
import torch

# 均值池化函数
def mean_pooling(model_output, attention_mask):
    token_embeddings = model_output[0]
    input_mask_expanded = attention_mask.unsqueeze(-1).expand(token_embeddings.size()).float()
    return torch.sum(token_embeddings * input_mask_expanded, 1) / torch.clamp(input_mask_expanded.sum(1), min=1e-9)

# 加载模型和分词器
tokenizer = BertTokenizer.from_pretrained('shibing624/text2vec-base-chinese')
model = BertModel.from_pretrained('shibing624/text2vec-base-chinese')

sentences = ['如何更换花呗绑定银行卡', '花呗更改绑定银行卡']

# 分词处理
encoded_input = tokenizer(sentences, padding=True, truncation=True, return_tensors='pt')

# 计算嵌入向量
with torch.no_grad():
    model_output = model(**encoded_input)

sentence_embeddings = mean_pooling(model_output, encoded_input['attention_mask'])
print("Sentence embeddings:")
print(sentence_embeddings)

模型性能优化

该项目提供了多种优化版本以提升推理速度：

ONNX优化版本：提供约2倍的GPU加速，不损失性能
OpenVINO版本：提供1.12倍的CPU加速
INT8量化版本：提供4.78倍的CPU加速，有轻微性能损失

使用ONNX优化版本的示例：

from sentence_transformers import SentenceTransformer

model = SentenceTransformer(
    "shibing624/text2vec-base-chinese",
    backend="onnx",
    model_kwargs={"file_name": "model_O4.onnx"},
)
embeddings = model.encode(["如何更换花呗绑定银行卡", "花呗更改绑定银行卡", "你是谁"])
print(embeddings.shape)