Open NotebookLM开源项目安装与使用指南

2026-02-06 04:00:50作者：凤尚柏Louis

项目概述

Open NotebookLM是一个基于开源AI技术的创新工具，能够将PDF文档智能转换为自然对话风格的音频播客。该项目结合了先进的大型语言模型和文本转语音技术，为用户提供个性化的播客制作体验。

核心功能特性

PDF转播客功能：上传PDF文档即可自动生成播客对话
多语言支持：支持英语、中文、法语、德语、日语等13种语言
对话式音频：生成自然流畅的播客对话，包含主持人和嘉宾角色
用户友好界面：基于Gradio的简单易用界面
自定义选项：支持调整对话长度、语调和提问内容

技术架构

核心模型组件

Llama 3.3 70B：强大的开源语言模型
Fireworks AI：专业模型托管平台
MeloTTS：高质量文本转语音框架
Bark：音频处理工具
Jina Reader：PDF解析引擎

安装步骤

环境要求

Python 3.7或更高版本
Git版本控制系统
稳定的网络连接

详细安装流程

获取项目源码 使用以下命令克隆项目仓库：

git clone https://gitcode.com/gh_mirrors/op/open-notebooklm.git
cd open-notebooklm

创建虚拟环境

python -m venv .venv
source .venv/bin/activate

安装依赖包
```
pip install -r requirements.txt
```
配置API密钥 设置Fireworks API密钥环境变量：
```
export FIREWORKS_API_KEY=你的API密钥
```

使用教程

启动应用

运行以下命令启动Gradio界面：

python app.py

界面操作步骤

上传PDF文件：在界面中上传需要转换的PDF文档
输入URL（可选）：可添加网页内容作为补充
设置问题：指定想要探讨的具体问题或主题
选择语调：在"Fun"（轻松）和"Formal"（正式）之间选择
确定时长：选择"Short (1-2 min)"或"Medium (3-5 min)"
选择语言：从13种支持的语言中选择
音频生成选项：选择是否使用高级音频生成功能

输出结果

音频文件：生成的MP3格式播客文件
文字稿：完整的对话文字记录

项目结构说明

项目包含以下核心文件：

app.py：主应用程序文件，包含Gradio界面和主要逻辑
constants.py：常量定义文件，包含API配置和UI设置
schema.py：数据结构定义
prompts.py：提示词模板
utils.py：工具函数
requirements.txt：依赖包列表

注意事项

字符限制：处理的总文本内容不超过10万个字符
文件格式：仅支持PDF格式文件
语言支持：某些语言需要启用高级音频生成功能

常见问题

安装问题

确保Python版本符合要求
检查网络连接是否稳定
验证API密钥是否正确设置

使用问题

上传的PDF文件应包含可提取的文本内容
对于较长的文档，建议选择较短的输出时长

通过本指南，您可以快速掌握Open NotebookLM的安装和使用方法，开始将PDF文档转换为个性化的音频播客内容。

open-notebooklm

Convert any PDF into a podcast episode!

项目地址：https://gitcode.com/gh_mirrors/op/open-notebooklm

登录后查看全文