如何免费将CAJ文献转为PDF？亲测有效的caj2pdf工具使用指南

2026-01-23 04:30:56作者：傅爽业Veleda

中国知网的部分文献仅提供CAJ格式下载，需使用专用软件打开，给文献阅读和管理带来不便。caj2pdf是一款免费开源工具，能帮助用户将CAJ格式文献转换为可编辑的PDF文件，保留文字内容和大纲结构，解决非Windows系统阅读CAJ文件的难题。

🌟 为什么选择caj2pdf？

CAJ（China Academic Journals）是中国知网的专有文献格式，传统转换方法（如CAJViewer打印）会导致PDF内容为图片格式，无法选择文字且丢失大纲。caj2pdf工具的核心优势在于：

保留文本可编辑性：转换后的PDF文件支持文字选择和复制
完整保留文献大纲：维持原文献的章节结构和目录导航
跨平台支持：适用于Windows、Mac OS等多种操作系统
完全免费开源：基于GLWTPL许可证，无需支付任何费用

📋 环境和依赖准备

在使用caj2pdf前，需确保系统已安装以下依赖：

Python 3.3或更高版本
PyPDF2库（用于PDF文件处理）
mutool工具（用于PDF操作）

对于非Windows用户，处理HN格式文件还需额外安装：

C/C++编译器
libpoppler开发包或libjbig2dec开发包

🚀 安装步骤

克隆项目仓库

git clone https://gitcode.com/gh_mirrors/ca/caj2pdf
cd caj2pdf

安装Python依赖
```
pip install -r requirements.txt
```

编译共享库（非Windows系统）

# 使用libpoppler
cc -Wall `pkg-config --cflags poppler` -fPIC -shared -o libjbig2codec.so decode_jbig2data.cc `pkg-config --libs poppler`

# 或使用libjbig2dec
cc -Wall `pkg-config --cflags jbig2dec` -fPIC -shared -o libjbig2codec.so decode_jbig2data_x.cc `pkg-config --libs jbig2dec`

💻 三种核心用法

1. 查看CAJ文件信息

caj2pdf show [input_file]

此命令会显示文件类型、页面数量和大纲项目数，帮助判断文件是否支持转换。

2. 转换CAJ为PDF

caj2pdf convert [input_file] -o/--output [output_file]

这是最常用的转换命令，将CAJ文件转换为PDF格式并保存到指定路径。

3. 提取大纲到现有PDF

caj2pdf outlines [input_file] -o/--output [pdf_file]

当遇到不支持的文件类型或转换Bug时，可先用CAJViewer打印PDF，再用此命令添加大纲。

📝 使用示例

# 查看文件信息
caj2pdf show thesis.caj

# 转换文件
caj2pdf convert thesis.caj -o thesis.pdf

# 添加大纲到PDF
caj2pdf outlines thesis.caj -o printed.pdf

⚠️ 异常情况说明

caj2pdf目前仍在完善中，遇到以下情况可能无法正常转换：

Unknown file type：遇到未知文件类型
转换过程中出现乱码或内容缺失

若遇到上述问题，建议尝试使用CAJViewer打印为PDF后，再使用大纲提取功能添加目录结构。

🤝 如何贡献

该项目欢迎社区贡献，如果你：

遇到转换问题，可在Issue中提交反馈（需提供测试样本）
熟悉二进制文件分析、图像压缩算法或逆向工程
可通过Pull Request提交代码改进

项目核心代码位于：

主程序：caj2pdf
解析模块：cajparser.py
工具函数：utils.py
转换逻辑：jbig2dec.py、jbigdec.py

📄 许可证信息

本项目基于GLWTPL（Good Luck With That Public License）许可证开源，允许自由使用和修改，但作者不对使用效果做任何保证。

caj2pdf

Convert CAJ (China Academic Journals) files to PDF. 转换中国知网 CAJ 格式文献为 PDF。佛系转换，成功与否，皆是玄学。

项目地址：https://gitcode.com/gh_mirrors/ca/caj2pdf

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

494

515

ops-nn

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

作为 Ascend for PyTorch 社区的核心组件，TorchNPU 是昇腾专为 PyTorch 打造的深度学习适配插件，使 PyTorch 框架能够直接调用昇腾 NPU，为开发者提供昇腾 AI 处理器的超强算力。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

647

284

如何免费将CAJ文献转为PDF？亲测有效的caj2pdf工具使用指南

🌟 为什么选择caj2pdf？

📋 环境和依赖准备

🚀 安装步骤

💻 三种核心用法

1. 查看CAJ文件信息

2. 转换CAJ为PDF

3. 提取大纲到现有PDF

📝 使用示例

⚠️ 异常情况说明

🤝 如何贡献

📄 许可证信息

热门内容推荐

最新内容推荐

项目优选

如何免费将CAJ文献转为PDF？亲测有效的caj2pdf工具使用指南

🌟 为什么选择caj2pdf？

📋 环境和依赖准备

🚀 安装步骤

💻 三种核心用法

1. 查看CAJ文件信息

2. 转换CAJ为PDF

3. 提取大纲到现有PDF

📝 使用示例

⚠️ 异常情况说明

🤝 如何贡献

📄 许可证信息

相关内容推荐

热门内容推荐

最新内容推荐

项目优选