【免费下载】 WeasyPrint入门指南:从安装到PDF生成全解析
2026-02-04 04:00:44作者:凌朦慧Richard
WeasyPrint是一个强大的Python库,能够将HTML和CSS文档转换为高质量的PDF文件。本文将详细介绍WeasyPrint的安装方法、基本使用以及安全注意事项,帮助开发者快速上手这一工具。
系统要求与安装
基础依赖
WeasyPrint需要以下核心组件支持:
- Python ≥ 3.9.0
- Pango ≥ 1.44.0(用于文本布局和渲染)
- 其他关键Python库:pydyf、CFFI、tinyhtml5、tinycss2等
各平台安装指南
Linux系统
推荐优先使用发行版的包管理器安装:
# Debian/Ubuntu
sudo apt install weasyprint
# Fedora
sudo dnf install weasyprint
# Archlinux
sudo pacman -S python-weasyprint
如需最新版本,可通过pip安装:
python3 -m venv venv
source venv/bin/activate
pip install weasyprint
macOS系统
使用Homebrew安装最为简便:
brew install weasyprint
Windows系统
Windows用户有两种选择:
- 直接下载预编译的可执行文件
- 通过Python环境安装(需额外步骤):
- 安装Python 3.9+
- 通过MSYS2安装Pango
- 创建虚拟环境并安装WeasyPrint
python -m venv venv
venv\Scripts\activate.bat
pip install weasyprint
基本使用方式
命令行工具
WeasyPrint提供了便捷的命令行接口:
weasyprint input.html output.pdf
支持多种输入源:
- 本地HTML文件
- 网络URL
- 标准输入流
可通过-s参数添加自定义样式:
weasyprint input.html output.pdf -s <(echo 'body { font-size: 12pt }')
Python API
在Python中使用WeasyPrint更加灵活:
from weasyprint import HTML
# 从URL生成PDF
HTML('https://example.com').write_pdf('output.pdf')
# 从字符串生成PDF
HTML(string='<h1>标题</h1><p>内容...</p>').write_pdf('output.pdf')
高级功能
- 自定义字体:
from weasyprint.text.fonts import FontConfiguration
font_config = FontConfiguration()
css = CSS(string='''
@font-face {
font-family: CustomFont;
src: url(/path/to/font.ttf);
}
body { font-family: CustomFont }
''', font_config=font_config)
HTML(...).write_pdf(..., stylesheets=[css], font_config=font_config)
- 分页控制:
document = HTML(...).render()
# 获取奇数页
document.copy(document.pages[::2]).write_pdf('odd_pages.pdf')
- 自定义资源加载:
def custom_fetcher(url):
if url.startswith('special:'):
return {'string': generate_content(url), 'mime_type': 'text/html'}
return default_url_fetcher(url)
HTML(..., url_fetcher=custom_fetcher).write_pdf(...)
安全注意事项
处理不可信HTML/CSS时需特别注意:
- 资源消耗:恶意文档可能导致长时间渲染或高内存占用
- 本地文件泄露:CSS中的
local()函数可能访问系统字体 - 网络访问:文档可能包含对外部资源的请求
建议措施:
- 在受限用户权限下运行服务
- 使用容器隔离环境
- 限制最大处理时间和内存使用
- 禁用网络访问(通过自定义URL fetcher)
常见问题解决
-
缺少库文件:
- Windows:设置
WEASYPRINT_DLL_DIRECTORIES环境变量指向库目录 - macOS:设置
DYLD_FALLBACK_LIBRARY_PATH包含Homebrew库路径
- Windows:设置
-
字体显示问题:
- 确保系统安装了所需字体
- 使用
@font-face明确指定字体 - 检查字体文件权限
-
性能优化:
- 对于批量处理,保持Python进程长期运行
- 复用FontConfiguration对象
- 预加载常用资源
通过本文介绍,您应该已经掌握了WeasyPrint的基本使用方法。无论是简单的文档转换还是复杂的PDF生成需求,WeasyPrint都能提供灵活的解决方案。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0215
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0138
uni-appA cross-platform framework using Vue.jsJavaScript08
GLM-5.2智谱开源 GLM-5.2,这是针对长文本任务的最新旗舰模型。相较于前代产品 GLM-5.1,它在长文本任务处理能力上实现了显著飞跃,并且首次在稳定的 100 万 token 上下文中提供这一能力。Jinja00
SwanLab⚡️SwanLab - an open-source, modern-design AI training tracking and visualization tool. Supports Cloud / Self-hosted use. Integrated with PyTorch / Transformers / LLaMA Factory / veRL/ Swift / Ultralytics / MMEngine / Keras etc.Python00
tiny-universe《大模型白盒子构建指南》:一个全手搓的Tiny-UniverseJupyter Notebook03
项目优选
收起
deepin linux kernel
C
32
16
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
471
465
暂无描述
Dockerfile
779
5.08 K
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
876
2.03 K
Ascend Extension for PyTorch
Python
758
968
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
697
1.4 K
昇腾LLM分布式训练框架
Python
185
231
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.1 K
1.14 K
本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本,由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用,3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。
Dart
1.04 K
271
JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent,它能够将大语言模型的强大能力,通过你日常使用的各类通讯应用,直接延伸至你的指尖。
Python
2.25 K
677