解决Reqwest中URL包含引号导致的InvalidUriChar错误

2025-05-22 22:37:40作者：苗圣禹Peter

在使用Rust的Reqwest库进行HTTP请求时，开发者可能会遇到一个常见问题：当URL中包含引号(")字符时，虽然url::Url::parse或reqwest::Url::parse函数验证通过，但在实际执行client.get()调用时会抛出InvalidUriChar错误并导致程序崩溃。

问题背景

Reqwest是一个流行的Rust HTTP客户端库，底层依赖于hyper和url等库。当处理用户提供的URL时，URL解析器(url crate)和实际的HTTP请求处理器(hyper)对URL有效性的判断标准可能存在差异。

具体表现为：

Url::parse()成功解析包含引号的URL
但在传递给reqwest::Client::get()时失败
错误类型为InvalidUriChar

根本原因

这种不一致性源于URL规范的不同层级验证：

URL解析层：url crate遵循WHATWG URL标准，相对宽松
HTTP请求层：hyper库对URI的有效性有更严格的限制，特别是对于直接用于HTTP请求的路径部分

引号(")字符在URL的某些部分是被允许的，但在HTTP请求的URI部分则被视为非法字符。

解决方案

对于需要处理用户输入URL的应用程序，推荐以下解决方案：

URL编码处理：在将URL传递给Reqwest之前，对URL中的特殊字符进行百分号编码(Percent-encoding)

使用专门的URL清理函数：

fn sanitize_url(url: &str) -> String {
    url.replace("\"", "%22")
}

组合方案：

let raw_url = "http://example.com/path\"with\"quotes";
let encoded_url = raw_url.replace("\"", "%22");
let parsed_url = Url::parse(&encoded_url)?;
let response = client.get(parsed_url).send().await?;