关于article-extractor库中require()导入问题的技术解析

2025-07-09 01:24:57作者：苗圣禹Peter

article-extractor是一个用于从网页中提取文章内容的JavaScript库。近期有开发者反馈在使用该库时遇到了一个典型的模块导入问题：当TypeScript代码编译为JavaScript后，原本的ES模块导入语句被转换为require()形式，导致运行时出现ERR_REQUIRE_ESM错误。

问题本质

这个问题的核心在于模块系统的兼容性。article-extractor从某个版本开始完全转向了ES模块(ESM)格式，而不再支持CommonJS(CJS)的require()导入方式。当开发者使用TypeScript编写代码并通过tsc编译时，默认的输出模块格式是CommonJS，这就导致了模块系统不匹配的问题。

技术背景

现代JavaScript生态系统存在两种主要的模块系统：

ES模块(ESM)：使用import/export语法，是ECMAScript标准的一部分
CommonJS(CJS)：使用require()/module.exports，是Node.js早期采用的模块系统

TypeScript编译器默认将代码编译为CommonJS格式，而许多现代库(如article-extractor)已经转向纯ESM格式，这就产生了兼容性问题。

解决方案

目前开发者可以采取以下几种解决方案：

使用兼容版本：回退到支持CommonJS的版本(v7.2.6)，这是最简单的临时解决方案
修改TypeScript配置：在tsconfig.json中设置"module"为"ESNext"或"ES2022"，使TypeScript输出ESM格式的代码
使用动态导入：将require()替换为动态import()语法，这是现代JavaScript推荐的异步模块加载方式
等待库作者更新：如仓库协作者所承诺的，未来版本可能会重新加入CommonJS支持

最佳实践建议

对于长期项目，建议采用以下策略：

逐步将项目迁移到ES模块系统，这是JavaScript的未来方向
如果必须使用CommonJS，可以考虑使用打包工具(如webpack或rollup)来处理模块转换
保持依赖项的版本锁定，避免自动升级导致兼容性问题

总结

模块系统转换是许多JavaScript/TypeScript项目在现代化过程中都会遇到的问题。理解ESM和CJS的区别以及它们之间的互操作方式，对于现代前端开发者来说是一项重要技能。article-extractor库的这个案例很好地展示了当库作者选择只支持ESM时，下游开发者可能面临的挑战和解决方案。

article-extractor

To extract main article from given URL with Node.js

项目地址：https://gitcode.com/gh_mirrors/ar/article-extractor

登录后查看全文