首页
/ Recipe-scrapers项目新增cookomix.com网站解析支持

Recipe-scrapers项目新增cookomix.com网站解析支持

2025-07-07 19:59:51作者:凌朦慧Richard

背景介绍

recipe-scrapers是一个开源的食谱数据抓取库,能够从各类食谱网站提取结构化数据。最近该项目新增了对cookomix.com网站的支持,这是一个提供Thermomix料理机食谱的法国网站。

技术实现细节

新开发的解析器能够准确提取cookomix.com网站上的食谱信息,包括:

  1. 基础信息提取:成功获取食谱标题、描述等基本信息
  2. 时间信息处理:分别提取准备时间(prep_time)、烹饪时间(cook_time)和总时间(total_time)
  3. 步骤解析优化:相比wild模式,新解析器能正确处理步骤层级,避免不必要的子步骤拆分

时间信息处理机制

解析器实现了精确的时间信息提取逻辑:

  • 从网页原始数据中分别获取准备时间和总时间
  • 通过计算(总时间-准备时间)自动得出烹饪时间
  • 返回包含三个时间字段的完整数据结构

使用示例

以蘑菇西葫芦烩饭食谱为例,解析器能够正确提取:

  • 准备时间:10分钟
  • 烹饪时间:41分钟
  • 总时间:51分钟

注意事项

虽然解析器本身正确返回了时间数据,但需要注意下游应用(如Mealie)可能存在将总时间误用为烹饪时间的问题。这属于应用层的数据处理问题,而非解析器本身的缺陷。

总结

此次新增的cookomix.com解析器完善了recipe-scrapers对专业料理机食谱网站的支持,为开发者提供了更全面的食谱数据获取能力。该实现特别注重了时间数据的精确提取和处理,为后续应用开发提供了可靠的数据基础。

登录后查看全文
热门项目推荐