如何永久保存网页?这款工具让你告别文件管理噩梦!
还在为网页保存后文件散落发愁?收藏的技术文章变成"网页已过期"?旅行途中想离线查阅资料却受制于网络?Webpage2html 让这一切烦恼成为历史——一个文件,完整保存网页所有内容。
解决3大网页保存痛点
💡 告别文件夹地狱:无需管理复杂的资源目录,一个HTML文件包含所有图片、样式和脚本
💡 突破网络限制:在飞机、地铁等无网络环境下,仍能流畅浏览保存的网页内容
💡 保留动态交互:支持JavaScript执行,连2048这样的网页游戏都能离线运行
5大场景实测:从工作到生活的全方位应用
场景1:开发者的离线文档库
📌 案例:出差途中在高铁上查阅API文档
→ 使用Webpage2html保存MDN文档,无网络也能调试代码
→ 所有代码示例、交互演示完整保留,就像在线浏览一样
场景2:研究员的网页档案管理
📌 案例:学术论文引用的网页证据永久保存
→ 避免因原网页删除导致引用失效
→ 完整保留数据图表和计算公式,支持后续编辑标注
场景3:设计师的灵感收集夹
📌 案例:保存优秀设计网站作为灵感素材
→ 所有CSS样式、字体和图片内嵌,确保设计效果完美复现
→ 无需担心原网站改版或失效
场景4:教育者的离线课件包
📌 案例:培训讲师准备离线教学材料
→ 整合多个网页资源为单个文件,便于分发和展示
→ 学生可在无网络环境下复习课程内容
场景5:安全研究者的取证存档

📌 案例:安全比赛题目永久存档
→ 完整保留比赛页面所有元素,便于赛后分析和复盘
→ 包含动态脚本和交互组件,还原真实比赛环境
3步完成网页打包:极简操作流程
第1步:准备环境
# 克隆项目仓库
git clone https://gitcode.com/gh_mirrors/we/webpage2html
cd webpage2html
# 安装依赖(可选,基础功能无需额外依赖)
pip install -r requirements.txt
第2步:保存在线网页
# 基本用法:URL直接转换(输出到指定文件)
python webpage2html.py https://example.com -o saved_page.html
第3步:转换本地文件
# 进阶用法:处理已下载的HTML(保留JavaScript)
python webpage2html.py ./downloaded/page.html --enable-js > interactive_page.html
技术解析:如何做到一个文件装下整个网页?
💡 资源内联技术:将CSS样式表和JavaScript脚本直接嵌入HTML文件,消除外部依赖
💡 Base64编码转换:所有图片自动转为Base64数据URI,实现"一张图片=一段文本"的奇迹
💡 智能解析引擎:自动识别并处理相对路径、动态加载资源,确保离线可用性
💡 轻量化设计:核心功能无需安装额外依赖,Python环境即可运行
加入开源社区
本项目采用"SATA License"(星并感谢作者许可),使用前别忘了给项目点个赞!
欢迎提交issue和PR,一起完善这个实用工具:
- 报告bug或提出功能建议
- 优化代码或添加新特性
- 分享你的使用场景和技巧
现在就试试Webpage2html,让网页保存变得简单而高效!
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
atomcodeAn open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust030
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
HY-Embodied-0.5这是一套专为现实世界具身智能打造的基础模型。该系列模型采用创新的混合Transformer(Mixture-of-Transformers, MoT) 架构,通过潜在令牌实现模态特异性计算,显著提升了细粒度感知能力。Jinja00
ERNIE-ImageERNIE-Image 是由百度 ERNIE-Image 团队开发的开源文本到图像生成模型。它基于单流扩散 Transformer(DiT)构建,并配备了轻量级的提示增强器,可将用户的简短输入扩展为更丰富的结构化描述。凭借仅 80 亿的 DiT 参数,它在开源文本到图像模型中达到了最先进的性能。该模型的设计不仅追求强大的视觉质量,还注重实际生成场景中的可控性,在这些场景中,准确的内容呈现与美观同等重要。特别是,ERNIE-Image 在复杂指令遵循、文本渲染和结构化图像生成方面表现出色,使其非常适合商业海报、漫画、多格布局以及其他需要兼具视觉质量和精确控制的内容创作任务。它还支持广泛的视觉风格,包括写实摄影、设计导向图像以及更多风格化的美学输出。Jinja00