首页
/ Botasaurus项目中的Connection refused错误分析与解决方案

Botasaurus项目中的Connection refused错误分析与解决方案

2025-07-07 03:11:33作者:郜逊炳

问题背景

在使用Botasaurus框架与Django服务器应用集成时,开发者可能会遇到一个持续出现的错误:"[Errno 111] Connection refused - goodbye"。这个错误通常发生在浏览器驱动使用完毕并关闭后,系统会持续不断地抛出这个连接拒绝的错误信息。

错误原因分析

这个错误的核心在于浏览器驱动关闭后的连接处理机制。当Botasaurus的驱动完成操作并关闭浏览器后,系统仍然尝试维持与已关闭浏览器实例的连接,导致连接被拒绝的错误持续出现。这种情况在Linux服务器环境下尤为常见,可能与系统权限、依赖缺失或驱动生命周期管理有关。

解决方案

方法一:补丁修复法

开发者可以通过修改Botasaurus的浏览器关闭逻辑来解决这个问题。以下是一个有效的补丁方案:

from botasaurus_driver.core.browser import Browser
from botasaurus_driver import cdp

def patched_close_chrome(self):
    try:
        if self.connection:
            self.connection.send(cdp.browser.close())
    except Exception as e:
        print(e)

Browser.close_chrome = patched_close_chrome

这个补丁重写了浏览器的关闭方法,确保在关闭前正确发送关闭指令,并优雅地处理可能的异常。

方法二:系统依赖安装

对于Linux服务器环境,确保所有必要的依赖已安装是解决问题的关键。以下是完整的依赖安装脚本:

sudo apt install -y python3-pip

if ! command -v google-chrome &> /dev/null
then
    sudo apt-get update
    wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
    sudo apt-get install -y lsof wget gnupg2 apt-transport-https ca-certificates software-properties-common adwaita-icon-theme alsa-topology-conf alsa-ucm-conf at-spi2-core dbus-user-session dconf-gsettings-backend dconf-service fontconfig fonts-liberation glib-networking glib-networking-common glib-networking-services gsettings-desktop-schemas gtk-update-icon-cache hicolor-icon-theme libasound2 libasound2-data libatk-bridge2.0-0 libatk1.0-0 libatk1.0-data libatspi2.0-0 libauthen-sasl-perl libavahi-client3 libavahi-common-data libavahi-common3 libcairo-gobject2 libcairo2 libclone-perl libcolord2 libcups2 libdata-dump-perl libdatrie1 libdconf1 libdrm-amdgpu1 libdrm-common libdrm-intel1 libdrm-nouveau2 libdrm-radeon1 libdrm2 libencode-locale-perl libepoxy0 libfile-basedir-perl libfile-desktopentry-perl libfile-listing-perl libfile-mimeinfo-perl libfont-afm-perl libfontenc1 libgbm1 libgdk-pixbuf-2.0-0 libgdk-pixbuf2.0-bin libgdk-pixbuf2.0-common libgl1 libgl1-mesa-dri libglapi-mesa libglvnd0 libglx-mesa0 libglx0 libgraphite2-3 libgtk-3-0 libgtk-3-bin libgtk-3-common libharfbuzz0b libhtml-form-perl libhtml-format-perl libhtml-parser-perl libhtml-tagset-perl libhtml-tree-perl libhttp-cookies-perl libhttp-daemon-perl libhttp-date-perl libhttp-message-perl libhttp-negotiate-perl libice6 libio-html-perl libio-socket-ssl-perl libio-stringy-perl libipc-system-simple-perl libjson-glib-1.0-0 libjson-glib-1.0-common liblcms2-2 libllvm11 liblwp-mediatypes-perl liblwp-protocol-https-perl libmailtools-perl libnet-dbus-perl libnet-http-perl libnet-smtp-ssl-perl libnet-ssleay-perl libnspr4 libnss3 libpango-1.0-0 libpangocairo-1.0-0 libpangoft2-1.0-0 libpciaccess0 libpixman-1-0 libproxy1v5 librest-0.7-0 librsvg2-2 librsvg2-common libsensors-config libsensors5 libsm6 libsoup-gnome2.4-1 libsoup2.4-1 libtext-iconv-perl libthai-data libthai0 libtie-ixhash-perl libtimedate-perl libtry-tiny-perl libu2f-udev liburi-perl libvte-2.91-0 libvte-2.91-common libvulkan1 libwayland-client0 libwayland-cursor0 libwayland-egl1 libwayland-server0 libwww-perl libwww-robotrules-perl libx11-protocol-perl libx11-xcb1 libxaw7 libxcb-dri2-0 libxcb-dri3-0 libxcb-glx0 libxcb-present0 libxcb-randr0 libxcb-render0 libxcb-shape0 libxcb-shm0 libxcb-sync1 libxcb-xfixes0 libxcomposite1 libxcursor1 libxdamage1 libxext6 libxfixes3 libxft2 libxi6 libxinerama1 libxkbcommon0 libxkbfile1 libxml-parser-perl libxml-twig-perl libxml-xpathengine-perl libxmu6 libxmuu1 libxrandr2 libxrender1 libxshmfence1 libxt6 libxtst6 libxv1 libxxf86dga1 libxxf86vm1 libz3-4 mesa-vulkan-drivers perl-openssl-defaults shared-mime-info termit x11-common x11-utils xdg-utils xvfb
    sudo dpkg -i google-chrome-stable_current_amd64.deb
    rm -rf google-chrome-stable_current_amd64.deb
fi

方法三:更新Botasaurus相关包

官方已经修复了这个问题,可以通过更新所有相关包来解决:

python -m pip install bota botasaurus botasaurus-api botasaurus-requests botasaurus-driver botasaurus-proxy-authentication botasaurus-server botasaurus-humancursor --upgrade

最佳实践建议

  1. 环境一致性:确保开发环境和生产环境的一致性,特别是在依赖版本方面
  2. 错误处理:在代码中添加完善的错误处理机制,特别是对于浏览器驱动的生命周期管理
  3. 日志记录:增加详细的日志记录,帮助诊断类似问题
  4. 版本控制:定期更新Botasaurus相关包,获取最新的错误修复和功能改进

通过以上方法,开发者可以有效解决Botasaurus与Django集成时出现的连接拒绝错误,确保自动化浏览任务的稳定执行。

登录后查看全文
热门项目推荐
相关项目推荐