goquery 使用与技术文档

2024-12-29 19:16:38作者：卓艾滢Kingsley

本文档将为您提供关于如何安装、使用以及API调用的详细指南，帮助您更好地了解和使用 goquery 库。

1. 安装指南

goquery 要求使用特定的 Go 版本。以下是根据不同版本所需的 Go 版本：

从 v1.10.0 版本开始，需要 Go 1.23 或更高版本。
对于 v1.9.0 版本，需要 Go 1.18 或更高版本。
对于之前的版本，需要 Go 1.1 或更高版本。

安装 goquery 的命令如下：

go get github.com/PuerkitoBio/goquery

可选地，要运行单元测试：

cd $GOPATH/src/github.com/PuerkitoBio/goquery
go test

要运行性能测试（注意：可能需要几分钟）：

cd $GOPATH/src/github.com/PuerkitoBio/goquery
go test -bench=".*"

2. 项目的使用说明

goquery 提供了一个类似于 jQuery 的语法和特性集，适用于 Go 语言。它是基于 Go 的 net/html 包和 CSS 选择器库 cascadia。由于 net/html 解析器返回的是节点而非完整的 DOM 树，因此 jQuery 的一些状态操作函数（如 height(), css(), detach()）在 goquery 中不可用。

goquery 要求源文档提供 UTF-8 编码的 HTML。

以下是 goquery 的一些基本使用示例：

package main

import (
    "github.com/PuerkitoBio/goquery"
    "io/ioutil"
    "log"
)

func main() {
    // 读取 HTML 文件
    doc, err := goquery.NewDocumentFromReader(strings.NewReader(htmlString))
    if err != nil {
        log.Fatal(err)
    }

    // 使用选择器查找元素
    doc.Find("div").Each(func(i int, s *goquery.Selection) {
        // 处理每个找到的元素
        log.Println(s.Text())
    })
}

3. 项目API使用文档

goquery 公开了两个结构体 Document 和 Selection，以及 Matcher 接口。以下是一些常用的 API 方法：

NewDocumentFromReader(reader io.Reader) (*Document, error)：从 io.Reader 创建一个新的 Document 实例。
Find(selector string) *Selection：根据选择器查找元素。
Each(func(i int, s *Selection) {})：遍历选择器匹配的所有元素。
Text() string：获取所有匹配元素的文本内容。

更多 API 方法的详细说明和用法，请参考 goquery 的官方文档。