首页
/ Transformer Rankers——基于预训练变换器的排名实验库

Transformer Rankers——基于预训练变换器的排名实验库

2024-09-11 07:03:16作者:龚格成

项目介绍

Transformer Rankers 是一个专为使用预训练变换器进行排名实验而设计的库。该库由一名博士生在2019至2022年间开发,并主要聚焦于对话响应排序任务的研究。尽管该项目目前可能不再积极维护,但它支持多种数据集和任务,包括社区问答、相似问题检索、passage检索等,并提供了一个强大的工具箱来处理这些任务中的排名问题。此外,它已被用于几篇学术论文中,展示了其在神经学习到排名模型评估和弱监督学习上的应用价值。

项目快速启动

要迅速开始使用Transformer Rankers,遵循以下步骤:

环境准备

首先,确保你的系统已安装Git和Python3。然后,执行以下命令以克隆项目仓库并设置虚拟环境:

git clone https://github.com/Guzpenha/transformer_rankers.git
cd transformer_rankers
python3 -m venv env
source env/bin/activate

安装库及依赖

接下来,安装Transformer Rankers库及其所需的第三方包:

pip install -e .
pip install -r requirements.txt

示例:微调BERT以进行社区问答

作为快速入门,你可以尝试使用BERT进行点对点微调,适合社区问答场景:

# 此处假设代码示例应表示为一个简化的脚本过程,实际细节需参考项目文档。
from transformer_rankers import Trainer, DATASETS, evaluate_models
from transformers import BertTokenizer

# 初始化模型和tokenizer
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
dataset = DATASETS['mantis'](tokenizer)
trainer = Trainer(model=...,
                  dataset=dataset.train,
                  eval_dataset=dataset.val,
                  ...  # 根据具体需求配置其他参数
                 )

# 训练模型
trainer.fit()

# 预测并评估
preds, labels, _ = trainer.test()
res = evaluate_models(preds, labels, metrics=['ndcg_cut_10'])
for metric, v in res.items():
    print(f"Test {metric} : {v:.4f}")

请注意,以上代码段是概念性的,具体实现时需参照项目文档详细配置模型和训练参数。

应用案例和最佳实践

Transformer Rankers在多个场景下被应用,如对话搜索中的校准和不确定性研究,以及弱监督学习下的标签平滑。通过微调模型(如BERT或T5)来解决社区问答、对话响应排序等问题,是常见的应用场景。最佳实践通常包括选择合适的数据集处理器、适当调整负样本采样策略,并监控模型的性能指标,如NDCG和召回率。

典型生态项目

虽然Transformer Rankers本身是个独立的库,但它的应用紧密关联于自然语言处理和信息检索领域的其他开源工具和框架,例如Pyserini用于高效的BM25负样本抽取,或Hugging Face Transformers库,提供了丰富的预训练模型供实验使用。这些工具共同构建了一个强大的生态系统,促进了基于变换器的排名模型的发展和应用。


以上就是关于Transformer Rankers项目的一个基本概览和快速启动指南。深入探索这个库,可以发掘更多高级特性和定制化方法来适应特定的排名任务。

热门项目推荐
相关项目推荐

项目优选

收起
Python-100-DaysPython-100-Days
Python - 100天从新手到大师
Python
263
53
国产编程语言蓝皮书国产编程语言蓝皮书
《国产编程语言蓝皮书》-编委会工作区
64
16
open-eBackupopen-eBackup
open-eBackup是一款开源备份软件,采用集群高扩展架构,通过应用备份通用框架、并行备份等技术,为主流数据库、虚拟化、文件系统、大数据等应用提供E2E的数据备份、恢复等能力,帮助用户实现关键数据高效保护。
HTML
85
63
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
53
44
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
195
45
HarmonyOS-ExamplesHarmonyOS-Examples
本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
268
69
xxl-jobxxl-job
XXL-JOB是一个分布式任务调度平台,其核心设计目标是开发迅速、学习简单、轻量级、易扩展。现已开放源代码并接入多家公司线上产品线,开箱即用。
Java
9
0
RuoYi-VueRuoYi-Vue
🎉 基于SpringBoot,Spring Security,JWT,Vue & Element 的前后端分离权限管理系统,同时提供了 Vue3 的版本
Java
171
41
RuoYi-Cloud-Vue3RuoYi-Cloud-Vue3
🎉 基于Spring Boot、Spring Cloud & Alibaba、Vue3 & Vite、Element Plus的分布式前后端分离微服务架构权限管理系统
Vue
38
24
qwerty-learnerqwerty-learner
为键盘工作者设计的单词记忆与英语肌肉记忆锻炼软件 / Words learning and English muscle memory training software designed for keyboard workers
TSX
332
27