Danbooru项目中Bilibili图片URL协议缺失问题的技术解析

2025-07-01 08:44:48作者：舒璇辛Bertina

在Danbooru项目处理Bilibili内容源的过程中，发现了一个关于图片URL协议缺失的技术问题。这个问题涉及到网络请求的基础协议处理，值得开发者深入理解。

问题现象

当Danbooru解析Bilibili的文章内容时，发现部分图片URL采用了"//"开头的相对协议格式，而不是完整的"https://"协议格式。这种URL格式被称为协议相对URL(Protocol-relative URL)或schemeless URL。

示例中可以看到，返回的图片URL数组中同时存在两种格式：

协议相对URL：//i0.hdslb.com/bfs/article/watermark/7e52215ee182b02bda3d9f6b6aac4007a5d65171.png
完整HTTPS URL：https://i0.hdslb.com/bfs/article/4adb9255ada5b97061e610b682b8636764fe50ed.png

协议相对URL是一种特殊的URL格式，它省略了具体的协议(http:或https:)，只保留双斜杠"//"开头。浏览器在解析这种URL时，会自动采用当前页面使用的协议来发起请求。

这种设计最初是为了方便网站在HTTP和HTTPS之间切换时，无需修改所有资源URL。如果页面使用HTTPS加载，所有协议相对URL也会使用HTTPS；如果页面使用HTTP，则使用HTTP协议。

对于Danbooru这样的内容抓取系统，协议相对URL可能会带来以下问题：

针对这个问题，Danbooru项目可以采取以下几种处理方式：

在实际实现时，开发者需要考虑：

协议相对URL是Web发展过程中产生的一种特殊格式，在现代Web开发中已不再推荐使用。Danbooru项目在处理Bilibili等第三方内容源时，应当增加对这类URL的规范化处理，确保系统能够稳定可靠地获取图片资源。这个问题也提醒我们，在开发内容抓取系统时，需要充分考虑各种URL格式的兼容性处理。

登录后查看全文