Recipe-Scrapers 15.5.0版本发布：增强食谱数据抓取能力

2025-06-25 17:21:36作者：翟萌耘Ralph

recipe-scrapers

Python package for scraping recipes data

项目地址：https://gitcode.com/gh_mirrors/re/recipe-scrapers

Recipe-Scrapers是一个专注于从各类食谱网站提取结构化数据的Python库，它能够将网页上的食谱信息转换为标准化的JSON格式，方便开发者进行后续处理和分析。该项目通过持续更新来支持更多食谱网站，并优化现有解析器的准确性。

新增解析器支持

本次15.5.0版本新增了对多个食谱网站的支持，显著扩展了项目的覆盖范围：

spisbedre.dk：这是一个丹麦食谱网站，现在可以通过Recipe-Scrapers获取其完整的食谱信息。后续还针对该网站进行了专门的解析优化，确保能够准确提取关键数据。
SamsungFood：作为三星旗下的食谱平台，其内容质量较高。新增的解析器能够处理该网站特有的数据结构，为用户提供完整的食谱提取能力。
theplantbasedschool：针对植物基饮食的专门食谱网站，解析器的加入使得素食食谱的获取更加便捷。

现有解析器改进

除了新增支持外，本次版本还对多个现有解析器进行了功能增强和问题修复：

ACoupleCooks：增加了对食谱分组的支持，能够更好地处理该网站上按类别组织的食谱内容。
Panelinha：更新了解析逻辑，确保能够适应网站最新的数据结构变化。
Myplate：优化了数据提取流程，提高了食谱信息的完整性和准确性。
Rewe：通过重构测试和解析代码，提升了德国连锁超市Rewe网站食谱的抓取稳定性。
latelierderoxane：针对该法国美食网站的更新，确保解析器能够继续正常工作。
Feastingathome：改进了对该美食博客的解析能力，特别是对复杂食谱结构的处理。
Lecker：现在完全遵循Schema.org标准，并实现了自定义指令处理逻辑，提高了数据提取的规范性。
dagelijkse kost：修复了指令检测问题，确保能够正确识别食谱步骤内容。

技术优化与问题修复

本次版本包含了一些重要的底层技术改进：

增强了JSON-LD图形数据处理能力，修复了当数据不是对象时可能出现的解析问题。这项改进提高了对非标准结构化数据的兼容性。
优化了多个解析器的错误处理机制，使其在面对网站结构变化时更加健壮。
改进了测试覆盖率，特别是对Rewe等网站的测试用例进行了重构，提升了代码质量保证。

项目意义与发展

Recipe-Scrapers的持续更新展示了开源社区在数据抓取领域的活力。通过支持更多食谱网站和不断优化现有解析器，该项目为食品技术、营养分析、智能厨房等应用场景提供了可靠的数据获取工具。

对于开发者而言，这些更新意味着：

更广泛的食谱来源选择
更稳定的数据提取能力
更规范的输出格式
更易于集成的API接口

随着健康饮食和智能烹饪的普及，Recipe-Scrapers这类工具的价值将愈发凸显。项目的持续发展也反映了社区对标准化食谱数据交换的需求正在不断增长。

recipe-scrapers

Python package for scraping recipes data

项目地址：https://gitcode.com/gh_mirrors/re/recipe-scrapers

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。