allRank 开源项目使用教程

2026-01-19 11:27:56作者：江焘钦

项目介绍

allRank 是一个基于 PyTorch 的框架，专门用于训练学习排序（Learning-to-Rank, LTR）神经网络模型。该项目提供了常见的点对点、成对和列表损失函数的实现，以及全连接和类似Transformer的评分函数。此外，allRank 还支持常用的评估指标，使得用户可以轻松地训练和评估自己的排序模型。

项目快速启动

环境准备

首先，确保你已经安装了 Python 和 PyTorch。然后，通过以下命令安装 allRank：

pip install allrank

训练模型

以下是一个简单的示例代码，展示如何使用 allRank 训练一个基本的排序模型：

import torch
from allrank.models.losses import DEFAULT_LOSS_FUNCTIONS
from allrank.models.metrics import DEFAULT_METRICS
from allrank.data.dataset import create_data_loader
from allrank.models.model import LTRModel

# 定义数据集路径
train_path = "path/to/train/dataset"
valid_path = "path/to/validation/dataset"

# 创建数据加载器
train_loader = create_data_loader(train_path)
valid_loader = create_data_loader(valid_path)

# 定义模型
model = LTRModel(input_dim=136, hidden_dims=[64, 32])

# 定义损失函数和优化器
loss_fn = DEFAULT_LOSS_FUNCTIONS["pairwise"]
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)

# 训练模型
for epoch in range(10):
    model.train()
    for batch in train_loader:
        optimizer.zero_grad()
        outputs = model(batch)
        loss = loss_fn(outputs, batch["labels"])
        loss.backward()
        optimizer.step()

    model.eval()
    with torch.no_grad():
        for batch in valid_loader:
            outputs = model(batch)
            metrics = DEFAULT_METRICS(outputs, batch["labels"])
            print(f"Epoch {epoch}, Metrics: {metrics}")