首页
/ Chimera项目技术文档

Chimera项目技术文档

2024-12-27 01:54:50作者:瞿蔚英Wynne

1. 安装指南

Chimera 可以通过 npm 进行安装,操作如下:

npm install chimera

安装过程会自动下载适用于您操作系统的 Chimera 二进制文件。目前支持 64 位 Darwin(mac)和 64 位 Linux。如果您使用的是其他平台,您可能需要自行编译或者等待我为您构建适用于该平台的版本。

2. 项目的使用说明

Chimera 的基本使用方法如下:

var Chimera = require('chimera').Chimera;

var c = new Chimera();
c.perform({
  url: "http://www.google.com",
  locals: {},
  run: function(callback) {
    callback(null, "success");
  },
  callback: function(err, result) {
    // 处理结果
  }
});

使用 new Chimera() 实例化一个新的 Chimera 时,您实际上是在创建一个新的浏览器实例,它不会与其他浏览器实例共享会话数据。它拥有自己的内存 cookie 数据库和 URL 历史。

locals 对象应包含您希望传递给网页的变量。这些值应能转换为 JSON 类型,因为浏览器的 JS 引擎沙盒环境阻止我们传递实际的 nodejs 变量引用。

run 函数在页面加载时立即执行。如果您希望在页面完全加载后执行逻辑,则需要等待,就像在网页中嵌入的正常 JavaScript 代码一样。例如,如果您使用 jQuery,您会执行标准的 $(document).ready(function(){...}) 类型的代码来等待页面完全加载。请注意,run 函数在网页中运行,因此您无法访问 nodejs 作用域中的任何变量。callback 参数应在您准备好暂停浏览器实例并将控制权返回给 nodejs 世界时调用。

callback 函数在 nodejs 上下文中运行,因此您将可以访问作用域中的变量。此函数在 run() 中调用回调函数时执行。

3. 项目API使用文档

以下是创建新的浏览器实例时所有可能的选项:

  • userAgent: 任何代表用户代理的字符串。默认使用示例中显示的字符串,一个 windows chrome 浏览器。
  • libraryCode: 如果您希望在所有网页中注入 jQuery,您可以在此处使用 fs.readFileSync("jquery.js")
  • cookies: 如后面的示例所示,您可以从上一个浏览器实例保存 cookies 并在此处使用它们。
  • disableImages: 如果您的爬虫不需要图像,此选项可以大幅减少内存使用并加快页面加载速度。但是,您的截图可能看起来会很糟糕。

4. 项目安装方式

如安装指南所述,您可以通过 npm 来安装 Chimera。如果您的平台没有预编译的二进制文件,您需要按照以下步骤自行编译:

在 Mac 上编译

在 Mac 上获取二进制文件相当简单,但编译 Qt 需要很长时间。与 Linux 不同,您不需要包含在 Chimera 中的自定义 openssl。以下是 Mac 上的基本步骤:

./scripts/compile_qt.sh
./scripts/compile_binary.sh

最终的二进制文件应该位于 node-chimera/lib 目录中。

在 Linux 上编译

您首先需要安装 ssl 头文件、freetype 和 fontconfig 库,因此您需要执行如下命令安装:

apt-get install libfreetype6-dev libfontconfig1-dev libssl-dev

由于 nodejs 带有自己的 ssl 版本,我们必须让 Qt 也使用这个版本的 ssl,否则会出现段错误。首先编译包含的 openssl(我们有 -fPIC 等额外标志,允许库被静态包含)。以下是构建 Chimera 的所有步骤:

./scripts/compile_openssl.sh
./scripts/compile_qt.sh
./scripts/compile_binary.sh

最终的 chimera.node 二进制文件应该存在于 node-chimera/lib 目录中。如果您在该目录中没有找到它,那么构建过程中很可能出现了问题。

登录后查看全文
热门项目推荐