开源项目安装与配置指南：SketchAgent

2025-04-18 09:25:38作者：姚月梅Lane

1. 项目基础介绍

SketchAgent 是一个基于语言驱动的顺序草图生成系统。该项目利用现成的多模态大型语言模型（LLM），通过直观的草图语言，实现语言驱动的顺序草图生成。它可以绘制多样化的概念，与人类进行交互式草图绘制，并通过聊天编辑内容。

主要编程语言：Python

2. 项目使用的关键技术和框架

多模态大型语言模型（LLM）：用于理解语言指令并生成对应的草图。
Flask：一个轻量级的Web应用框架，用于创建交互式界面。
cairosvg：用于生成SVG格式的图形。

3. 项目安装和配置的准备工作与详细步骤

准备工作

确保您的计算机上已安装有 Python 环境。
安装 Git 并克隆项目仓库。

安装步骤

克隆项目仓库：

git clone https://github.com/yael-vinker/SketchAgent.git
cd SketchAgent

根据您的操作系统设置环境。对于大多数用户，您需要执行以下命令来创建虚拟环境并激活它：

conda env create -f environment.yml
conda activate sketch_agent

如果您是 Mac 用户，请使用以下环境文件：

conda env create -f mac_environment.yml
conda activate sketch_agent

如果在安装过程中遇到 cairosvg 的警告，尝试重新安装：

conda uninstall cairosvg && conda install cairosvg

获取一个 Anthropic API 密钥，并将它保存在 .env 文件中：

ANTHROPIC_API_KEY=<your_key>

开始绘制草图。要生成单个草图，运行以下命令：

python gen_sketch.py --concept_to_draw "<你的概念>"

例如：

python gen_sketch.py --concept_to_draw "帆船"

可选参数包括：

--seed_mode：默认为 deterministic，以保证结果可重现。设置为 stochastic 可以增加结果的多样性。
--path2save：默认结果保存路径为 results/test/。

要使用交互式界面进行协作草图绘制，运行以下命令：

python collab_sketch.py

该命令将启动一个基于 Flask 的 Web 应用程序。运行后，在终端中查找以下输出信息：

Server running at: http://<你的IP地址>:5000

在网页浏览器中打开提供的 URL 以与应用程序进行交互。结果将保存到 results/collab_sketching/。

请确保您的输入提示清晰且有意义，以生成独特的概念草图。

登录后查看全文

项目优选

收起

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

flutter_flutter

deepin linux kernel

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

ohos_react_native

React Native鸿蒙化仓库

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

cangjie_compiler

仓颉编译器源码及 cjdb 调试工具。