PreSumm：基于预训练编码器的文本摘要神器

2024-09-15 08:06:45作者：董宙帆

code for EMNLP 2019 paper Text Summarization with Pretrained Encoders

项目地址：https://gitcode.com/gh_mirrors/pr/PreSumm

项目介绍

PreSumm 是一款基于预训练编码器的文本摘要工具，专为EMNLP 2019论文《Text Summarization with Pretrained Encoders》开发。该项目不仅支持传统的训练和评估模式，还特别推出了“Summarize Raw Text Input”功能，允许用户直接输入原始文本进行摘要生成。无论是抽象式摘要还是抽取式摘要，PreSumm都能轻松应对，为用户提供高效、准确的文本摘要解决方案。

项目技术分析

PreSumm的核心技术基于Transformer和BERT模型，通过预训练编码器提取文本特征，再结合特定的摘要生成算法，实现高质量的文本摘要。项目支持多种模型配置，包括TransformerAbs、BertAbs和BertExtAbs等，每种模型都有其独特的优势和适用场景。此外，PreSumm还提供了详细的训练和评估脚本，方便用户根据自己的需求进行定制化开发。

项目及技术应用场景

PreSumm的应用场景非常广泛，尤其适合以下领域：

新闻媒体：自动生成新闻摘要，帮助编辑快速了解新闻内容。
法律文书：从冗长的法律文书中提取关键信息，提高工作效率。
学术研究：自动生成论文摘要，帮助研究人员快速筛选相关文献。
企业文档：从大量的企业文档中提取核心内容，便于信息检索和管理。

项目特点

支持多种摘要模式：无论是抽象式摘要还是抽取式摘要，PreSumm都能轻松应对。
直接处理原始文本：用户可以直接输入原始文本进行摘要生成，无需预处理。
高性能模型：基于Transformer和BERT的预训练模型，确保摘要的准确性和流畅性。
灵活的训练和评估：提供详细的训练和评估脚本，支持多GPU训练，方便用户进行定制化开发。
丰富的预训练模型：项目提供了多个预训练模型，用户可以直接下载使用，节省训练时间。

PreSumm不仅是一个强大的文本摘要工具，更是一个开放的研究平台，欢迎广大开发者和技术爱好者加入，共同推动文本摘要技术的发展。

code for EMNLP 2019 paper Text Summarization with Pretrained Encoders

项目地址：https://gitcode.com/gh_mirrors/pr/PreSumm

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch

ohos_react_native

React Native鸿蒙化仓库