首页
/ OpenFE 自动化特征生成工具教程

OpenFE 自动化特征生成工具教程

2026-01-18 10:02:59作者:虞亚竹Luna

项目介绍

OpenFE 是一个用于表格数据自动化特征生成的新框架。它易于使用、高效且有效,具有以下优势:

  • OpenFE 可以发现有效的候选特征,以提高 GBDT 和神经网络的学习性能。
  • 支持并行计算,覆盖 23 种有用且有效的特征生成操作符。
  • 支持二分类、多分类和回归任务。
  • 能够自动处理缺失值和分类特征。

项目快速启动

安装

首先,使用 mamba 安装包依赖:

mamba env create -f environment.yml

然后,通过 pip 安装 openfe 库:

python -m pip install --no-deps openfe

快速示例

以下是一个简单的示例,展示如何使用 OpenFE 生成特征:

import openfe

# 生成特征
features = openfe.generate_features(data)

# 增强训练和测试数据
train_data_augmented = openfe.augment_data(train_data, features)
test_data_augmented = openfe.augment_data(test_data, features)

应用案例和最佳实践

IEEE-CIS 欺诈检测 Kaggle 竞赛

在 IEEE-CIS 欺诈检测 Kaggle 竞赛中,使用 OpenFE 生成的特征的简单 XGBoost 模型击败了 99.3% 的 6351 支数据科学团队。生成的特征带来了比第一名团队提供的特征更大的性能提升。

ICML2023 接受案例

OpenFE 已被 ICML2023 接受,展示了其在自动化特征生成领域的领先地位。

典型生态项目

Open Molecular Software Foundation

OpenFE 是 Open Molecular Software Foundation 托管的项目,该基金会致力于推动分子软件的开源发展。

相关文档和资源

通过以上内容,您可以快速了解并开始使用 OpenFE 进行自动化特征生成。

登录后查看全文
热门项目推荐
相关项目推荐