首页
/ Grim 使用与技术文档

Grim 使用与技术文档

2024-12-26 22:32:56作者:钟日瑜

1. 安装指南

在开始使用 Grim 之前,您需要确保已经安装了 ghostscript、imagemagick 和 xpdf。在 Mac (OSX) 系统上,推荐使用 Homebrew 来安装这些依赖项:

$ brew install ghostscript imagemagick xpdf

安装完依赖项后,您可以使用以下命令安装 Grim:

$ gem install grim

2. 项目使用说明

Grim 是一个简单的 Ruby gem,用于从 PDF 中提取页面并将其转换为图片,同时还可以提取页面上的文本内容。以下是基本的使用方法:

pdf = Grim.reap("/path/to/pdf") # 返回一个 Grim::Pdf 实例
count = pdf.count # 返回 PDF 中的页面数
png = pdf[3].save('/path/to/image.png') # 将页面 3 保存为图片,返回 true 或 false
text = pdf[3].text # 返回页面 3 的文本内容

pdf.each do |page|
  puts page.text
end

Grim 还支持使用其他处理器(默认使用系统路径中的 Imagemagick 和 Ghostscript 版本)。

# 指定一个处理器及其对应的 ImageMagick 和 Ghostscript 路径
Grim.processor = Grim::ImageMagickProcessor.new({:imagemagick_path => "/path/to/convert", :ghostscript_path => "/path/to/gs"})

# 指定多个处理器,如果第一个失败则使用备选处理器,适用于需要多个版本的 convert/gs
Grim.processor = Grim::MultiProcessor.new([
  Grim::ImageMagickProcessor.new({:imagemagick_path => "/path/to/6.7/convert", :ghostscript_path => "/path/to/9.04/gs"}),
  Grim::ImageMagickProcessor.new({:imagemagick_path => "/path/to/6.6/convert", :ghostscript_path => "/path/to/9.02/gs"})
])

3. 项目 API 使用文档

以下是 Grim 提供的 API 使用文档:

  • Grim.reap("/path/to/pdf"):从指定的 PDF 文件中提取页面并返回一个 Grim::Pdf 实例。
  • pdf.count:返回 PDF 中的页面数。
  • pdf[3].save('/path/to/image.png'):将指定的 PDF 页面保存为图片。
  • pdf[3].text:返回指定 PDF 页面的文本内容。

Grim::ImageMagickProcessor#save 支持以下选项:

pdf = Grim.reap("/path/to/pdf")
pdf[0].save('/path/to/image.png', {
  :width => 600,         # 默认为 1024
  :density => 72,        # 默认为 300
  :quality => 60,        # 默认为 90
  :colorspace => "CMYK", # 默认为 "RGB"
  :alpha => "Activate"   # 未设置时不使用
})

Grim 还支持日志记录功能,默认日志记录器为 Grim::NullLogger,但您可以设置自己的日志记录器:

require "logger"
Grim.logger = Logger.new($stdout).tap { |logger| logger.progname = 'Grim' }
Grim.processor = Grim::ImageMagickProcessor.new({:ghostscript_path => "/path/to/bin/gs"})
pdf = Grim.reap("/path/to/pdf")
pdf[3].save('/path/to/image.png')

4. 项目安装方式

Grim 的安装方式如下:

  • 确保 ghostscript、imagemagick 和 xpdf 已经安装。
  • 使用以下命令安装 Grim:
$ gem install grim
登录后查看全文
热门项目推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
27
11
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
470
3.48 K
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
10
1
leetcodeleetcode
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
65
19
flutter_flutterflutter_flutter
暂无简介
Dart
718
172
giteagitea
喝着茶写代码!最易用的自托管一站式代码托管平台,包含Git托管,代码审查,团队协作,软件包和CI/CD。
Go
23
0
kernelkernel
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
212
85
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.27 K
696
rainbondrainbond
无需学习 Kubernetes 的容器平台,在 Kubernetes 上构建、部署、组装和管理应用,无需 K8s 专业知识,全流程图形化管理
Go
15
1
apintoapinto
基于golang开发的网关。具有各种插件,可以自行扩展,即插即用。此外,它可以快速帮助企业管理API服务,提高API服务的稳定性和安全性。
Go
22
1