首页
/ T-Pot蜜罐系统磁盘空间不足导致Kibana仪表板报错问题分析

T-Pot蜜罐系统磁盘空间不足导致Kibana仪表板报错问题分析

2025-05-29 22:27:17作者:盛欣凯Ernestine

问题现象

在T-Pot蜜罐系统运行5天后,所有Kibana仪表板开始显示错误信息:"index [.async-search] blocked by: [TOO_MANY_REQUESTS/12/disk usage exceeded flood-stage watermark, index has read-only-allow-delete block]"。同时,攻击地图也无法正常显示数据。系统运行在320GB存储空间的Ubuntu 24.04虚拟机环境中,但实际可用空间仅剩14GB。

根本原因分析

这个问题本质上是Elasticsearch的磁盘空间保护机制被触发。当Elasticsearch检测到磁盘使用量超过"flood-stage"水位线时,会自动将索引设置为只读模式(read-only-allow-delete),以防止进一步写入导致磁盘完全耗尽。这种情况通常由以下几个因素共同导致:

  1. 日志数据量过大:蜜罐系统在短时间内捕获了大量网络攻击数据
  2. 默认保留策略:T-Pot默认配置可能没有设置合理的索引生命周期管理策略
  3. 资源分配不足:虽然虚拟机总空间为320GB,但可能分配给了多个系统组件

解决方案与处理步骤

紧急恢复措施

  1. 清理数据目录:停止T-Pot服务后,删除数据目录~/tpotce/data,这将清除所有日志和索引

    systemctl stop tpot
    rm -rf ~/tpotce/data
    systemctl start tpot
    
  2. 通过Elasticvue管理索引(如果Elasticsearch仍可访问):

    • 登录Elasticvue界面
    • 识别并删除占用空间过大的索引
    • 特别注意.async-search和与网络攻击相关的索引

长期预防措施

  1. 调整蜜罐配置

    • 编辑~/tpotce/docker-compose.yml文件
    • 禁用产生大量日志的组件
    • 或通过防火墙限制相关端口
  2. 优化Elasticsearch配置

    • 设置合理的索引生命周期策略
    • 调整磁盘水位线阈值
    • 配置自动索引轮转和删除策略
  3. 浏览器缓存问题处理

    • 当Kibana出现插件错误时
    • 清除浏览器缓存即可解决大部分界面显示问题

最佳实践建议

  1. 监控磁盘空间:设置定期检查脚本,监控/var/lib/docker和Elasticsearch数据目录的使用情况
  2. 容量规划:根据预期攻击量合理分配存储资源,考虑使用独立磁盘存储日志数据
  3. 日志轮转:配置日志轮转策略,避免单一日志文件过大
  4. 定期维护:建立定期清理旧数据的维护计划

通过以上措施,可以有效预防类似问题再次发生,确保T-Pot蜜罐系统长期稳定运行。对于生产环境,建议在部署前充分测试不同配置下的资源消耗情况,制定符合实际需求的资源分配方案。

登录后查看全文
热门项目推荐