Unlighthouse项目中的扫描结果数量不足问题分析与解决方案

2025-06-16 03:41:21作者：姚月梅Lane

Unlighthouse是一个基于Lighthouse的网站性能扫描工具，但在实际使用过程中，用户可能会遇到扫描结果数量少于预期的问题。本文将深入分析这一现象的原因，并提供完整的解决方案。

问题现象分析

当使用Unlighthouse扫描某些网站时，特别是那些拥有大量页面的网站，扫描结果往往只返回10-30个页面，而实际上网站的sitemap中可能包含更多页面。这种现象通常发生在以下情况：

网站拥有复杂的URL结构
网站包含动态生成的内容
网站有多个语言版本
网站包含大量博客文章或其他类型的内容

核心配置解析

要解决扫描结果数量不足的问题，关键在于正确配置Unlighthouse的扫描器参数。以下是几个关键配置项及其作用：

maxRoutes：设置最大扫描路由数，默认值可能较小，建议根据网站规模适当增大
sitemap：设置为true以启用sitemap自动发现功能
dynamicSampling：动态采样功能可能导致部分页面被跳过，建议关闭
include：明确指定需要扫描的路径模式

完整解决方案

基于实际案例，我们推荐以下配置方案：

module.exports = {
  scanner: {
    include: [
      "/",
      "/about",
      "/blog/*",  // 扫描所有博客文章
      "/*"        // 通配符匹配其他路径
    ],
    samples: 1,
    device: 'desktop',
    throttle: true,
    maxRoutes: 300,  // 根据网站实际规模调整
    skipJavascript: false,
    sitemap: true,
    dynamicSampling: false  // 确保扫描所有路由
  },
  chrome: {
    useSystem: true
  },
  debug: false
};