RecBole-GNN中SRGNN和LESSR模型训练报错问题分析与解决

2025-06-19 20:49:47作者：平淮齐Percy

问题背景

在使用RecBole-GNN框架运行基于会话的图神经网络推荐模型SRGNN和LESSR时，用户遇到了相同的错误。错误发生在训练后的评估阶段，系统抛出"TypeError: 'NoneType' object is not subscriptable"异常，导致程序中断。

错误现象分析

从错误日志可以看出，问题出现在评估阶段的负采样处理过程中。具体报错位置在RecBole框架的trainer.py文件中，当尝试访问positive_u[-1]时，positive_u变量为None，导致无法进行下标操作。

这种错误通常表明：

数据预处理阶段存在问题，导致评估时无法正确获取正样本
模型输出不符合预期，未能生成有效的预测结果
评估配置参数设置不当

根本原因

经过深入分析，这个问题主要源于以下几个方面：

数据集不匹配：用户尝试在ml-100k数据集上运行SRGNN和LESSR模型，但这些模型是专门为会话推荐(session-based recommendation)设计的，而ml-100k是传统的评分数据集，缺乏会话序列信息。
评估配置不当：在会话推荐场景下，评估策略需要特殊处理，而默认的评估配置可能不适用。
负采样设置问题：错误信息表明在评估阶段的负采样处理失败，可能是因为模型类型与负采样策略不匹配。

解决方案

针对这一问题，可以采取以下解决措施：

1. 使用正确的数据集

SRGNN和LESSR等会话推荐模型需要特定的数据集格式，应使用包含会话信息的数据集，如：

diginetica
yoochoose
retailrocket

这些数据集通常包含用户会话序列，适合会话推荐场景。

2. 调整评估配置

对于会话推荐模型，评估配置需要特殊设置。在yaml配置文件中，应确保以下参数正确：

eval_args:
  split: {'LS': 'valid_and_test'}
  order: TO
  group_by: user
  mode: {'valid': 'full', 'test': 'full'}

3. 检查负采样设置

确保负采样参数与模型类型匹配。对于会话推荐模型，可能需要禁用负采样：

train_neg_sample_args: {'distribution': 'none', 'sample_num': 'none'}
valid_neg_sample_args: {'distribution': 'none', 'sample_num': 'none'}
test_neg_sample_args: {'distribution': 'none', 'sample_num': 'none'}

最佳实践建议

模型与数据匹配：在选择模型前，先确认模型适用的场景和所需的数据格式。
配置检查：运行模型前，仔细检查配置文件中的各项参数，特别是与评估相关的设置。
逐步调试：可以先在小规模数据上测试模型，确认基本功能正常后再进行完整训练。
日志分析：遇到错误时，详细阅读日志信息，从错误堆栈的最底层开始分析问题原因。

总结

在RecBole-GNN框架中使用SRGNN和LESSR等会话推荐模型时，确保数据集格式正确、评估配置适当是避免此类错误的关键。通过选择合适的会话数据集并正确配置评估参数，可以有效解决"NoneType is not subscriptable"的错误问题。对于RecBole框架的新用户，建议从官方示例和文档入手，逐步掌握不同模型的特性和配置要求。

RecBole

A unified, comprehensive and efficient recommendation library

项目地址：https://gitcode.com/gh_mirrors/re/RecBole

登录后查看全文